AI Journey2020デジタルピーターで1位

こんにちはHabr
こんにちはHabr

みなさん、良い一日を!人工知能ジャーニー会議の枠組みの中で、ロシアおよび外国のパートナーと一緒にSberbankが主催する毎年恒例の国際AIコンテストはちょうど終了しました。今年のタスク:デジタルピーター:ピーターIの原稿の認識NoFloodWithAI:アムール川の洪水AI 4人類:ruGPT-3。今回は43カ国から約1000人が参加しました。





私たちのチームは、「デジタルピーター:ピーターIの原稿の認識」の問題の解決に参加し、1位を獲得しました。競争を解決する過程で私たちが何をしたか、ここお父さんは誰ですか、私たちが使用したトリックとトリックについてお話ししたいと思いますたくさんの情報があります、主題にない人々のために多くの特別な言葉があります。これはチュートリアルではありません。詳細については説明しませんが、コメントで質問にお答えします。





あなたは夢のチームを見ることができます





予定

  • タスクの説明





  • 解決手順





    1. データの前処理





    2. ニューラルネットワークの説明





    3. 増強





    4. CharMasks





    5. XLMRobertaを使用したスペル修正





    6. アンサンブル+スペル修正のしきい値





  • うまくいかなかった





  • チーム





  • 結論





タスクの説明

データ形式、利用可能なリソース、および制限





, : , I, (. ). , , - .





.





, - , - , , .





500 , , , , .





1.

, ( OOF), . ( ), ( ), , +90, -90 . (Resnet34 ) . , .









, .. . .





2.

, CTCLoss Attention. CTCLoss , Attention . CTCLoss, , Attention . .





Bs - , (w, h, c) - (, , ). . Hidden size - LSTM . Dict Size - , . Dense - Keras, Linear PyTorch.





3.

, . : ToGray, CLAHE, Rotate, CutOut.





CutOut .  , HandWrittenBlots, , , .  , ( ) . CutOut , HandWrittenBlots .  Augmixations. .





P.S. CutOut , .





4. CharMasks

, , CTC Loss. , , , ( , ). ( Action Labeling ).





. , , . , . XVII-XVIII (, ). , , .





conovpiterをありがとう
piter

, , , , . . , . . (Multi Word Expression) ( ) .





conovpiterをありがとう
piter

, , .. , . - :





conovpiterをありがとう
piter

5. Spell correction using XLMRoberta

, .





,     ( , ). NLP. XLMRoberta XVII-XVIII .., I. :





1. OCR ( ) ( ) ( + softmax), 3 (//blank ..) ;





2. : 3-4 , - .. //blank, , . zero-shot learning, , . OCR ('': 'p', '': 'o', '': 'e', '': 'c', '': 'a', '': 'x', '': 'u', '': ‘k’);





3. OCR step by step (!), ;





4. : ( 0 12), 50% padding ( ), 10% . ( ). XLMRoberta outputhiddenstates - NER, ;





5. GPU , TPU Colab





P.S.

( ), BeamSearch. .





6. Ensemble + Spell Correction Thresholds





, , , CTCLoss, . .    , . N "" . , , . . , , , ., +- .





Other Backbones. (EfficientNet, [SE, ECA]ResNet[xt], Mobilenet ), Resnet34.





Augmentations.   Albumentations (Brightness, Gamma, Blur ), , .





TTA (Test-Time Augmentations).  , holdout , public test - . , holdout.





Classic Blending.  , , , , , .





(). , ! :)





(github, linkedin, kaggle)





(github, linkedin, kaggle)





(github, linkedin, kaggle)





(linkedin, kaggle)





, , . , .





P.S. ( , public): 

| CER: 2.531 | WER: 13.5 | ACC: 62.107 | TIME: 32s |

submission .





P.P.S.

, ? :)












All Articles