個人的な例に関する文書の認識-利用可能な有料および無料のソリューションの概要

こんにちは!これは私が働いている会社の典型的な状況です。会計では、永遠のラッシュがあり、十分な人がいません。誰もが絶対に重要なことをしていますが、本質的に役に立たないのです。この状況は経営陣に適していない。



より詳細には、問題は、会計リソースが現在のタスクに十分ではなく、誰も新しい人々に料金を割り当てたくないということです。したがって、上から、彼らはいくつかのタスクを削減し、会計士の時間をより有用なもののために解放することに決めました。ドキュメントのスキャンと認識、コピー、他の日常的な喜びへの追加などの作業は、ナイフの下で行われました。



そのため、アナリストとして、自分の会社に典型的なドキュメント(請求書)を認識して、使用可能なストレージと1Cに構造化するためのソリューションを見つけるという課題に直面しました。便利で理解しやすく、会社にかなりの費用をかけないソリューション。



その経験は面白いことがわかったので、私は何とか集めたものを共有することにしました。何かが足りなかったのかもしれませんので、何か追加することがあればコメントで歓迎します。





ドキュメントスキャンプログラム、ドキュメント認識プログラムは、市場に出回っている新しいソリューションではありません。無料のプログラムと組み込みのシステムの両方で見つけることができます。



私は無料のプログラムから始めました:



  • glmageReader
  • 事務処理
  • VietOCR
  • 楔形文字。


そのようなプログラムによる請求書の認識中に、私は次のことを見ました:



  • VietOCR、Paperwork、glmageReaderなどのプログラムでは、スキャンしたドキュメントを特定のフォルダーに保存するように構成できます。Paperworkでは、ラベルに従ってそれらを並べ替えることもできます。
  • それらは一般的にテキストでうまく機能し、テキストが正しく認識されない場合、一部のプログラムはファイルをエクスポートする前にコンテンツを手動で変更できます。


画像



ただし、問題もあります。



  • pdfスキャンとpngの操作には違いがあります。pngをpdfに正常に変換できるとは限りません。
  • これらのプログラムのほとんどは、最も単純な形式であっても、表形式のドキュメントの認識に対処するのが困難です。その結果、マークされたフィールドのない認識されたテキストを取得します。



    画像

  • フォントが不正確に決定されることがあり、その結果、変換時に、認識されたすべてのテキストが互いに重なり合います。
  • 認識の過程で、回転や座標変位を伴うキーワードによる位置合わせが必要になる場合があります。
  • 一部のプログラムでは、テーブルが画像として認識され、新しいWordドキュメントに画像としてエクスポートされましたが、非常に切り捨てられており、見づらい場合もあります。
  • 一部のプログラムで認識されたコンテンツを編集すると、問題が発生し、フォントまたはテキスト自体が変更されました。




画像



この技術は十分に機能しました。プログラムが無料であることを考えると、上記の問題は許容できます。しかし、私はもっと合理化された解決策を探していました。



次に、ABBYY FineReader 15Corporateで認識を調査しました



7日間の試用期間中に、私もこのプラットフォームを研究しました。



注意事項:



  • pngファイルを開くと、完全に読み取られ、その結果、画像とテキストの品質を損なうことなく、正常にpdfに変換されました。
  • , . png , .
  • - pdf. .
  • , , .
  • OCR pdf -. - .



    画像

  • , , . , , .



    画像

  • ここでは、指定されたスケジュールに従って、指定されたフォルダーから定期的にプルされる受信ドキュメントの自動変換を設定できます。
  • 異なる形式であっても、ドキュメントのバージョンを比較できます。大量のドキュメントと編集が含まれているため、非常に便利です。


私はこのソフトウェアを使って楽しい経験をしました。しかし、ABBYY Flexicaptureシステムソリューションの値札に目を向けると(そしてシステムソリューションが必要です)、ソリューション、特にカスタマイズされたソリューションは、月額約40万ルーブルというかなりの金額であることがわかりました。1万ページ以上。



私は別の方法を探し始めました。従業員の手を解放し、高品質のドキュメント認識を取得し、データの安全性と構造を気にしない方法。



そして、私は以前にすでに研究したELMARPAをもっとよく見ることにしまし



ベンダーは、データをERPにエクスポートする作業の大部分を、会計士の肩からロボットに移すことを提案しています。実際、これがまさに私に提起された問題を解決するものです。このシステムでの認識を知るために、ベンダーからシステムの試用版を入手しました。



ここで、認識は受信したデータを新しいドキュメントファイルに変換することを目的としていないことを発見しました。



ここでの主な目標は、ドキュメントの詳細を認識し、それらを他のシステム/サイト/アプリケーションに転送することです。さらに、ロボットはすべての情報を必要な場所に配置します。必要なフォルダーを自動的に見つけて、必要な形式で保存します。



私が見たシステムの認識の種類:



パターン認識



ドキュメントテンプレートに基づいて、読み込まれたドキュメントを認識することができます。私の知る限り、このタイプの認識は無料で、Tesseractエンジンが接続されています。



注意事項:



  • このタイプの認識は、jpgおよびpng形式のスキャンで機能し、pdfはまだ考慮されていません。しかし、製品はまだ若いので、すべてが進んでいると思います。
  • このタイプの認識は、無料のCommunityEditionに含まれています
  • テキストは、ロボットのコンテキストで作成した変数に応じて照合できるブロックで便利にマークアップされます。したがって、認識に引き込むものを正確に手動で構成します。
  • 彼は私たちの請求書50/50を認識し、適切と思われるいくつかの言葉を変更しました。:)



    画像





ただし、この場合のベンダーは、このタイプの認識は、テキスト構造または明るい形式の単純なドキュメントに適合していると述べています。そして彼は、請求書を認識するために別のタイプの認識を使用することをアドバイスしました-インテリクトラボ



プロセスは同じです。テンプレートをロードして認識します。ただし、ここではテンプレートがクラウドサーバーに送信されます。



サーバーから応答を受け取り(このタイプのドキュメントを認識するかどうかに関係なく)、認識されると、RPAプロセスで書き込む必要のある変数と一致するようにテンプレート構造(マッピング用の変数)が渡されます。



再生プロセス中に、認識したいドキュメントをすでに送信し、認識に関するiLabサーバーからの応答を受信します。



この認識について私が指摘したこと:



  • pdf, jpg png.
  • . .
  • - .
  • , 1. , , , , .
  • Community Edition . , (, , .), , 100 500 . ( , , .)


ドキュメント認識のプロセス自体は、ボックス内で行われるため、ビデオに表示するのはかなり難しく、画面は数秒間空になります。そのため、認識したデータをノートブックに個別に入力して視覚化しました。



メモ帳でドキュメントを認識する



したがって、ロボットは同じデータを1Cに書き込み、そこで新しいドキュメントを作成



1Cでのドキュメントの認識と作成



します。価格で何とかわかったもの:たとえば、ilab認識を使用して大規模に作業する場合、10,000個のドキュメントに対して支払う必要があります。



  • 約18万ルーブル。一度に、
  • さらに、たとえば、400,000ルーブル。オーケストレーター付きのロボットを購入する
  • 合計:580,000ルーブル。


ロボットは無制限で、しばらくの間10,000ドキュメントで十分です。少なくとも私たちがすべてを一度支払うという事実において、それは非常に有益であることがわかります。



このプラットフォームでの認識について一般的に気に入った点は次のとおりです。



  • , , . .
  • , , , . .
  • . 15 , — . , .
  • , .


:



  • 無料のプログラムは、予想以上にドキュメント認識のタスクに対応しますが、そのため、大量の作業を大幅に高速化することはできません。
  • ABBYY FineReaderは、その後のドキュメントの処理と認識にうまく対応しますが、システムソリューションを取得するには、優れた財務機能が必要です。
  • ELMA RPAは、ドキュメントの認識の品質、変動性、および認識後の保存と転送の機能に驚いていますが、製品が若いことを覚えておく必要があります。



All Articles