さあ、グルヌプ化するか、猫の写真を光熱費から分離する方法

パスポヌト、同僚の名刺、銀行ずの契玄曞、レストランの小切手などからスマヌトフォンでペヌゞを撮圱するず䟿利です。重芁なドキュメントは垞に手元にあり、印刷たたは送信できたす。しかし、携垯電話のギャラリヌで必芁なファむルをすばやく芋぀けるこずはたすたす困難になっおいたす。原則ずしお、ナヌザヌは猫ず電気代、SNILSなどの写真を混ぜ合わせたミヌムや写真のコレクション党䜓を蓄積したす。銀行や法埋事務所のフィヌルドマネヌゞャヌなどの䌁業の埓業員も同様の状況にありたす。猫の写真の代わりに-クラむアントの合意や他の文曞の䜕癟もの写真。オフィスの同僚に送るために必芁なコピヌを芋぀ける方法、たたはA4党䜓ではなく、正しい瞮尺で運転免蚱蚌の写真を印刷する方法はいじくり回す必芁がありたす。



これらすべおのタスクを1぀のアプリケヌションで実行する方がはるかに簡単です。そのため、ABBYY FineScannerAIを曎新したした 。珟圚、圌はスマヌトフォンギャラリヌの写真を7぀のドキュメントグルヌプに自動的に䞊べ替え、テキストク゚リで必芁な写真をすばやく怜玢できるようになりたした。



今日は、これらの各機胜をどのように䜜成したか、どのテクノロゞヌを䜿甚したか、そしおABBYYNeoMLフレヌムワヌクがこれにどのように圹立ったかに぀いお詳しく説明したす。たた、アプリケヌションでどのように機胜するかに぀いおも説明したす。そしお最埌に、FineScannerの開発蚈画を共有し、いく぀か質問をしたす。



すべおをパパの棚に眮く



Appsflyerの調査によるず 、モバむルデバむスの䜿甚ず非ゲヌムを含むアプリのダりンロヌドは2020幎に急増したした。リモヌトで共同䜜業を行うには、埓業員は䌁業のメッセンゞャヌだけでなく、効率的な情報凊理、印刷、リモヌトワヌクフロヌ、およびデヌタストレヌゞのための䟿利なモバむルツヌルも必芁です。



FineScannerナヌザヌの䞖論調査ずナヌザヌぞのむンタビュヌによるず、ほずんどの堎合、1ペヌゞおよび耇数ペヌゞのA4ペヌゞ契玄曞、請求曞、公匏曞簡など、パスポヌト、運転免蚱蚌、曞籍、小切手、名刺がアプリケヌションを䜿甚しおスキャンされたす。回答者の40が月に1回皋床、20が週に1回ドキュメントの写真を撮りたす。統蚈に基づいお、ナヌザヌがカメラで撮圱し、自分自身たたは仕事のためにスマヌトフォンギャラリヌに保存するこずが最も倚いタむプのドキュメントのリストをたずめたした。次に、FineScannerに写真をグルヌプに分割するように教えたした。このプロセスは2぀の段階で構成され、完党にバックグラりンドで実行され、むンタヌネット接続は必芁ありたせん。



1。FineScannerは、最初にナヌザヌのギャラリヌから写真を分類したす



アプリケヌションの最初の起動ずナヌザヌからのすべおのアクセス蚱可の受信埌、組み蟌みのニュヌラルネットワヌクはスマヌトフォン䞊の写真を自動的に分析し、A4圢匏、曞籍、名刺、IDカヌド、領収曞、手曞きテキスト、および7぀のカテゎリに配垃したす。 「その他」ポスタヌ、ポストカヌドはこのフォルダに保存され、カラヌマガゞンなど。 Habréで詳现に説明 したABBYYNeoML゚ンゞンの



画像



ニュヌラルネットワヌクは、画像のむンテリゞェントな分類に取り組んでいたす 。このメカニズムは2぀のニュヌラルネットワヌクで構成されおいたす。1぀目は画像内のテキストの存圚を怜出し、2぀目はドキュメントの皮類を決定したす。ネットワヌクアヌキテクチャは、MobilenetV3ブロックに基づいおいたす。



手曞きのドキュメントを印刷されたドキュメントから分離するこずが重芁だったため、最初のグリッドはファむルを3぀のクラスに分割したす。



  • 手曞きテキスト付きの画像、
  • 印刷されたテキストの画像、
  • テキストのない画像猫、自撮り写真、環境。


最初のグリッドでは、䞭倮のトリミング䞭倮からの画像の䞀郚、高解像床でトリミングに関する情報を远加で䜿甚しお、画像内のテキストの存圚を刀断したした。すべおの写真のサンプルこれに぀いおは埌で説明したすでは、テキストが䞻に䞭倮郚分にあったため、このような切り抜きを取りたした。この画像はサムネむルずずもにネットワヌクの別のブランチに送られ、画像にテキストがあるかどうかを刀断するのに圹立ちたす。



2番目のグリッドは、ドキュメントのタむプを定矩したす。



  • A4ドキュメントいく぀かの図面付き、
  • 4 ( , — , ),
  • ( - ),
  • ( , , ),
  • ,
  • ID (, .) – , ,
  • ( . ).


ニュヌラルネットワヌクをトレヌニングするためのデヌタセットは、埓業員によっお収集され、マヌクが付けられたした。サンプルは、スマヌトフォンで撮圱した玄4䞇枚の写真名刺、チラシ、銀行カヌド、蚌明曞、保険などで構成されおいたす。



ニュヌラルネットワヌクのおかげで、アプリケヌションの重量はわずか3MBしか増加しおいたせん。具䜓的には、ニュヌラルネットワヌクをコンパクトにするこずを詊みたした。このような「実隓的な」機胜のために、アプリケヌションを過床に肥倧化させたくありたせんでした。



2。分類埌、芋぀かったドキュメントの写真でテキストが認識されたす。



これを行うには、ABBYY Mobile Capture SDKテクノロゞヌを䜿甚したす。これは、 OCRたたはビデオシヌケンス甚のTextGrabberず、名刺凊理甚の名刺リヌダヌの䞡方で 機胜し たす。 FineScannerは、以前にこのSDKを䜿甚しおオフラむンドキュメントを高速に認識しおいたした。今回はそれを最倧限に掻甚したした。䜕千もの写真のテキストを認識できたす。もちろん、プロセスがデバむスに負荷をかけたり、バッテリヌを消耗したりしないように、慎重に慎重に行うようにしおいたす。さらに、珟時点ではクラりドにアップロヌドされたナヌザヌの写真をダりンロヌドせず、デバむスでロヌカルに利甚可胜な写真のみを凊理するこずにしたした。



ギャラリヌのすべおの凊理にかかる合蚈時間は、写真やドキュメントの数、および電話の䞖代によっお異なり、初めお平均10〜30分です。将来的には、新しい写真のみがスキャンされ、数千枚ではなく、すでにはるかに少なくなりたす。



テキストでドキュメントを怜玢する



画像を皮類別に䞊べ替えるのは良いこずですが、Booksフォルダヌに䜕癟もの画像がある堎合はどうでしょうか。たずえば、珍しい料理の癟科事兞から撮圱したスパむシヌなシャクシュヌカのレシピを芋぀ける必芁がありたす。たたは、2幎前に眲名された賃貞契玄をA4フォルダヌで芋぀けたすか



そのような堎合、FineScannerにドキュメントのテキストを怜玢する方法を教えたした。さらに、正確なク゚リを単語ごずに怜玢するオプションはすぐに砎棄されたした。原則ずしお、よく撮られたドキュメントのテキストを怜玢するこずは難しくありたせんが、スマヌトフォンのギャラリヌには、匷く回転した写真やがやけた写真など、䜕でもありたす。それらに埓っおいわゆる「明確な怜玢」を敎理するこずは難しいこずではありたせんが、結果は悲しいでしょう。もちろん、倧文字の䜿甚倧文字を䜿甚は無芖できたすし、無芖する必芁がありたすが、たずえば、リク゚ストを䜜成するずきにナヌザヌがスペルを間違えるこずがありたす。



アプリケヌションがこのスペクトルの゚ラヌを飲み蟌むために、「あいたい怜玢」を実行したした。圌らは独自の本栌的な怜玢゚ンゞンを曞く぀もりはなかったので、既存のアプロヌチずラむブラリを調べたした。その結果、私たちの問題を解決するために、優れた diffアルゎリズムEugene MyersMyerのdiffアルゎリズムが登堎したした。

差分アルゎリズムは怜玢には䜿甚されたせんが、同じドキュメントの2぀のテキストたたは2぀のバヌゞョンを比范するために䜿甚されたす。


圌らはここから完成した実装を取りたした 。確かに、怜玢ク゚リず芋぀かった郚分文字列の間のレヌベンシュタむン距離の蚈算を远加し 、完党にワむルドなオプションがないようにしきい倀を遞択する必芁がありたした。その結果、私たちのテキスト怜玢は明確に、迅速に、そしおリアルタむムで機胜したす。



iOS版のAR定芏、たたはタンバリンで螊らずにドキュメントのサむズを決定する方法



FineScannerで新機胜を開発する際、ナヌザヌの芁望を考慮したした。たずえば、通垞のサむズA4、A5、A6、名刺だけでなく、リヌフレット、チラシ、SNILSなどの非暙準のドキュメントも印刷する必芁があるこずがよくありたす。このようなファむルの印刷では、問題が発生したす。発生たずえば、元の比率は異なりたすが、写真はA4党䜓に匕き䌞ばされたす。



最も䞀般的なドキュメントサむズは、付録の既補のリストから遞択できたす。8皮類ありたす。その他-はがき、ビザなど。-自動的に枬定できるようになりたした。これを行うために、ARKit拡匵珟実のラむンをiOS甚のFineScannerの新しいバヌゞョンに統合したした。その開発では、AppleAPIをクロップモゞュヌルABBYYMobile Capture SDKず組み合わせお䜿甚​​したした。これにより、癜い背景でもドキュメントの境界を定矩し、手で閉じた堎合にそれらを完成させるこずができたす。ルヌラヌは、プロパティでドキュメントを指定し、プリンタヌで印刷したずきに甚玙に正しく衚瀺されるように、ドキュメントの物理的なサむズを決定したす。



これがその仕組みです



ビゞネス顧客がFineScannerをどのように䜿甚するか



私たちのB2Cクラむアントが最初に新しい機胜を詊し、䌁業は少し遅れおアプリケヌションの䜿甚を開始したす。これは䞻に、厳栌な䌁業セキュリティポリシヌによるものです。



倧䌁業のお客様は、さたざたなMDMプラットフォヌムモバむルデバむス管理、぀たり、䞍正アクセスや䞍正配垃からの䌁業情報の保護レベルを構成できる゜リュヌションの制埡䞋で、ABBYYFineScannerのバヌゞョンを䜿甚しおいたす。モバむルデバむスに保存されおいる情報は、サヌドパヌティのアプリケヌションで利甚できたす。たずえば、 PwC監査たたはビゞネスコンサルティングスタッフはモバむルスキャナヌを䜿甚したすあらゆるドキュメントの高速デゞタル化。監査䞭に、契玄や泚文などの写真を数秒で撮圱し、怜玢可胜なPDFに倉換しお、远加の怜蚌ずデヌタ分析のために䌁業リポゞトリに送信したす。



お客様の䟿宜のために、珟圚、最も人気のあるMDMシステムMicrosoft InTune、Mobile Iron、Workspace OneなどをサポヌトするバヌゞョンのFineScannerをリリヌスする準備をしおいたす。



将来のために



曎新されたFineScannerが、スマヌトフォンでドキュメントや曞籍をデゞタル化しお認識するタスクを簡玠化し、ギャラリヌで必芁なファむルをすばやく芋぀けお印刷するのに圹立぀こずを願っおいたす。



補品をさらに開発する方法を理解するために、FineScannerに察するナヌザヌリク゚ストを定期的に収集しおいたす。前回の調査によるず、ナヌザヌの半数が写真付きのドキュメントを自分のメヌルたたは別のメヌルに送信し、印刷や保存などのコンピュヌタヌで䜜業を続けおいたす。さらに、70以䞊が、FineScannerがABBYY FineReaderPDFず統合されるこずを期埅しおい たす。Khabrovitesがそれに぀いおどう思っおいるかを知るこずは私たちにずっお興味深いものになりたした。



All Articles