ใƒ‹ใƒฅใƒผใ‚นใ‚’็†่งฃใ™ใ‚‹ใŸใ‚ใซAIใซใฉใฎใ‚ˆใ†ใซๆ•™ใˆใŸใ‹

็งใŸใกใฏ็š†ใ€ไฝ•ใŒ่ตทใ“ใฃใฆใ„ใ‚‹ใฎใ‹ใ‚’็Ÿฅใ‚ŠใŸใ„ใฎใงใ€ใƒ‹ใƒฅใƒผใ‚นใ‚’่ชญใ‚€ใ“ใจใซๆ™‚้–“ใฎไธ€้ƒจใ‚’่ฒปใ‚„ใ—ใฆใ„ใพใ™ใ€‚ใใ—ใฆไปŠใ€ใพใ™ใพใ™ๅคšใใฎใƒ‹ใƒฅใƒผใ‚นใŒใƒ‹ใƒฅใƒผใ‚นใ‚ตใ‚คใƒˆใ‚„ๆ–ฐ่žใ‹ใ‚‰ใงใฏใชใใ€ใ‚ใ‚‹็จฎใฎ้›ปๅ ฑใƒใƒฃใƒณใƒใƒซใ‹ใ‚‰ๆฅใฆใ„ใพใ™ใ€‚ใใฎ็ตๆžœใ€ใ—ใฐใ‚‰ใใ™ใ‚‹ใจใ€ๅธธใซไฝ•ใ‹ใ‚’ๆ›ธใ„ใฆใ„ใ‚‹ใƒ€ใƒผใ‚น๏ผˆใใ—ใฆใŠใใ‚‰ใๆ•ฐๅใฎใƒใƒฃใƒณใƒใƒซ๏ผ‰ใซใ‚ตใƒ–ใ‚นใ‚ฏใƒฉใ‚คใƒ–ใ—ใฆใ„ใ‚‹ใ“ใจใŒใ‚ใ‹ใ‚Šใพใ™ใ€‚ใใฎ็ตๆžœใ€ใ€Œไฝ•ใ‹ใ‚’่ฆ‹้€ƒใ•ใชใ„ใ€ใŸใ‚ใซ่†จๅคงใชๆ™‚้–“ใŒ่ฒปใ‚„ใ•ใ‚Œใพใ™ใ€‚ใ—ใ‹ใ—ใ€ใ‚ใชใŸใŒใใ‚Œใ‚’่ฆ‹ใ‚‹ใจใ€ใใ‚Œใ‚‰ใฎใปใจใ‚“ใฉใฏใ€ใพใฃใŸใ็•ฐใชใ‚‹ๆ–นๆณ•ใงใ€1ใคใฎใ“ใจใซใคใ„ใฆๆ›ธใ„ใฆใ„ใพใ™ใ€‚ใใ“ใงใ€AIใซๆœฌๅฝ“ใซ้‡่ฆใชใƒ‹ใƒฅใƒผใ‚นใ‚’้ธๆŠžใ™ใ‚‹ใ‚ˆใ†ใซๆ•™ใˆใ‚‹ใจใ„ใ†ใ‚ขใ‚คใƒ‡ใ‚ขใŒ็”Ÿใพใ‚Œใพใ—ใŸใ€‚ใ‚‚ใกใ‚ใ‚“ใ€Yandex.Newsใฎใ‚ˆใ†ใชใ•ใพใ–ใพใชTOPใ‚„ใ€ๅฐŠๆ•ฌใ•ใ‚Œใฆใ„ใ‚‹ใƒกใƒ‡ใ‚ฃใ‚ขใ‚ขใ‚ฆใƒˆใƒฌใƒƒใƒˆใ‹ใ‚‰ใฎใใฎๆ—ฅใฎ็ตๆžœใฎใ‚ˆใ†ใชใ‚‚ใฎใŒใ‚ใ‚Šใพใ™ใŒใ€่‡ณใ‚‹ๆ‰€ใซใƒ‹ใƒฅใ‚ขใƒณใ‚นใŒใ‚ใ‚Šใพใ™ใ€‚ใ“ใฎ่จ˜ไบ‹ใงใฏใ€ใ“ใ‚Œใ‚‰ใฎใƒ‹ใƒฅใ‚ขใƒณใ‚นใจใ€็งใŸใกใŒ่กŒใฃใŸใ“ใจใจ่กŒใ‚ใชใ‹ใฃใŸใ“ใจใซใคใ„ใฆ่ชฌๆ˜Žใ—ใ‚ˆใ†ใจๆ€ใ„ใพใ™ใ€‚





ใƒ‹ใƒฅใ‚ขใƒณใ‚นใจใ‚ฝใƒผใ‚น

, โ€“  , , , - โ€“  , " ". , ., , โ€“  , . โ€“  , .





:





  • -,





  • , , - (-, , )





  • โ€“ , , 100 . 10 . ( ) โ€“  . - . ,





100 , "" . , โ€“  , , - , GQ, .. - , , - .





, , , , , .. , - . , . โ€“  , ( )... - . , โ€“ , "" ( , , - ). , - , , .





:





  • " ", โ€“ 





  • "", โ€“ .. ""





  • "" โ€“ .. - ,





, , :





  • ( )





  • โ€“  NLP NER โ€“   ,





  • - ""





โ€“  3 , : , ( ), โ€“ . , , - .





"" NLP

NLP, BERT, . . - . โ€“ , MVP :





  • . , NLP , โ€“  , .. - , . , , .





  • , BERT โ€“ , , , .





, MVP BERT , 20 โ€“ ( ), , BERT - , .. , . , , , โ€“  , ( ).





:





  • BERT โ€“ , , NER ,





  • Natasha โ€“ , NLP : , , API, . .. " " โ€“ 





  • Stanza โ€“  NLP , ,





Spacy, , :













  • NLP , : NER, , ,





  • ( BERT)





- , , Spacy.





, , : Natasha-spacy, , . , - , , .





, โ€“  , . โ€“  : . โ€“ , , . , NER PER, LOC, ORG , "" "" , .. .





- , , .. CONLLU, . :





  • GSD





  • SynTagRus





  • Taiga





-. - NER. . , . , - . โ€“ ยซ ยป, , . , ( CONLLU), CONLLU. , , .





"" "" โ€“ . , regexp-, .













, "" "". - :





  • , ,





  • , .. , "" "" , " "





  • โ€“  - , , , , 3- โ€“ 





. , , .





, " ". Facebook( themeduza, forbesrussia) , , ria.ru. โ€“  - . ! - , , , . ~ .





, "" "" , , , , , .





, โ€“  . " " , - .





โ€“  , , . 4-5 , , , , - "".





1ๆ—ฅใ‚ใŸใ‚Šใฎๅนณๅ‡ใƒกใƒƒใ‚ปใƒผใ‚ธๆ•ฐ

4 GB RAM, 2 vCPUs 8% CPU, . , airflow, ( - airflow " " 16 GB RAM, 4 vCPUs 32%). , . , DAG-, โ€“  .





ใ‚คใƒณใƒ•ใƒฉ

" X", . :





  • ( , , , )





  • , โ€“  NER , "" , ( )





  "source": {
      "id": 1115468824,
      "username": "lentadnya",
      "title": " ",
      "participants": 47148
    },
    "text": "ยซ, ,   ยป:       .    ,  ",
    "views": 405,
    "link": "https://t.me/lentadnya/16263",
    "interesting": 0.12,
    "reaction": {
      "enjoyment": 0.04400996118783951,
      "sadness": 0.0019097710028290749,
      "disgust": 0.8650462031364441,
      "anger": 0.08112426102161407,
      "fear": 0.00790974497795105
    },
    "entities": [
      "",
      " ",
      "",
      ""
    ],
    "tags": [
      "",
      " ",
      "",
      ""
    ]
      
      



, .





โ„–1: "" , , . , โ€“  3-4 , . .. , .. , . โ€“  .





โ„–2: NER โ€“ . , , . . - 100 (, ) NER . 85%. . , BERT "" , - , -.





โ„–3: , , , , , . . - "" . , "", . , ( ), NER " ". , , , . "" , - " " โ€“  . "" . , "" , , . .





ใ•ใฆใ€ใ“ใ‚Œใพใง่ชญใ‚“ใ ไบบใฏ่ชฐใงใ‚‚ใ€ใใ‚ŒใŒ้ข็™ฝใ„ใ‚‚ใฎใซใชใ‚‹ใ“ใจใ‚’้ก˜ใฃใฆใ„ใพใ™ใŒใ€็งใŸใกใฎใƒˆใƒƒใƒ—ใฏใฉใฎใ‚ˆใ†ใซ่ฆ‹ใˆใพใ™ใ‹๏ผšhttps๏ผš//t.me/mygendaใ€‚





ใ•ใฆใ€ใƒ•ใ‚กใƒƒใ‚ทใƒงใƒณใƒ–ใƒญใ‚ฌใƒผใŒ่จ€ใ†ใ‚ˆใ†ใซ๏ผš่ณผ่ชญใ—ใ€ใ‚ณใƒกใƒณใƒˆใ‚’ๅ…ฑๆœ‰ใ—ใ€่ณชๅ•ใ‚’ใ—ใพใ™ใ€‚ใ“ใ‚ŒใŒ้ข็™ฝใ‹ใฃใŸใจๆ€ใ„ใพใ™ใ€‚








All Articles