AI-OCRとは?従来のOCRとの比較と代表的な製品・サービス

AI-OCRとは?従来のOCRとの比較と代表的な製品・サービス

近年、RPAを活用した業務効率化が盛んに行われていますが、そのなかでもAI-OCRの存在が注目されています。RPAは、PCで扱うことのできるデータのみ自動化処理ができます。そのため、手書きの申込書や見積書などは、RPAの前に人間の手によってデータ入力をしなければなりません。

しかし、データ量があまりにも膨大であると、RPAを稼働させるよりも人間がすべて処理したほうが効率的な場合があります。ここでAI-OCRを活用すれば、書類をスキャンさせるだけで手書き文字や印字された文字をデータ化することが可能です。今回は、AI-OCRについて複数の製品を比較しながら詳しく解説します。

そもそもAI-OCRとは?

OCRとは「Optical Character Recognition」の略称で、日本語では「光学的文字認識」と直訳されます。紙に印刷された文字や手書き文字をデータ化し保存する際に利用されるツールです。たとえば定型書式の請求書や領収書、申込書などをデータ化してコンピュータ内に保存する際に活用されています。しかし、従来のOCRは識字率が良いとはいえず、印字された文字のフォントや手書き文字のくせによっては正しく文字認識されないケースも多かったのです。

近年、OCRの文字認識にAIの技術を活用したAI-OCRが登場し注目を浴びています。AI-OCRはAIの手書き文字認識技術をOCRと組み合わせ、人間が書いた文字や紙に印刷された文字を文字データに変換する技術やソフトウェアのことを指します。

OCRの基本的な原理は書類を画像として取り込み、文字列とそれ以外の画像データを分離、そのうえで文字を1文字単位で解析していくというものです。AI-OCRでは、文字列を抽出し1文字単位で解析する際にAIの技術が応用されており、従来のOCRに比べて圧倒的に高い識字率を誇ります。近年、業務効率化の実現のためにRPAを導入する企業が増えていますが、AI-OCRはRPAと組み合わせることによって大幅な業務効率化が期待できることもあり、注目されているのです。

OCRとAI-OCRの比較

従来のOCRは書類を画像データとして取り込み、文字認識をする際にOCR用として開発されたアルゴリズムを活用していました。このアルゴリズムの精度は一定であり、長期間使い続けていても識字率が向上していくことはありません。

一方、AI-OCRにはディープラーニングによる学習機能があります。AI-OCRは、取り込まれたデータをもとに学習しながらビッグデータに蓄積し、文字認識の精度を向上させていきます。まるで子どもが言葉や文字を覚えていくように、AI-OCRを使い続けることによって高い識字率が実現できるようになるというわけです。

また、OCRは特定の定形書式以外には対応していない製品が多いですが、AI-OCRは非定形書式にも対応できる強みがあります。たとえば、枠線がない紙に大きさの異なる文字が記載されていたとしても、AI-OCRは自動的に文字を認識し臨機応変に判断することが可能です。

このように、OCRよりもAI-OCRのほうが汎用性が高く、幅広い用途に応用が可能なことがわかります。

代表的なAI-OCRの比較

実際に提供されているAI-OCRにはどのような製品があるのでしょうか。AI-OCRのなかでも代表的なものを4つ挙げてみます。

Tegaki

Tegakiはその名のとおり手書き文字認識に強く、実に99.22%もの高い認識率を誇ります。

手書き文字のパターンは無数にあります。たとえば、氏名の記載欄のように枠線のなかに文字列が1行記載されるもの、郵便番号や電話番号などひとつの枠に1文字ずつ記載するもの、住所のようにひとつの枠内に複数行の文字列が記載されるものまでさまざまです。また、性別や生年月日の年号のようにいくつかの選択肢に応じてチェックボックスが設けられているパターンもあります。

このように、手書き文字のあらゆるパターンを想定し、AIによって識字率を極限まで高めているのがTegakiの最大の特徴です。なお、学習のベースとなるトレーニングデータを用意すれば、日本語以外にも英語や中国語、韓国語などにも対応できます。

DX Suite

DX Suiteは400以上のアクティブユーザー数を誇り、AI-OCRにおけるシェア1位を獲得しています。導入企業例としては、みずほ銀行、NTT、JCB、JALなど国内の一流企業が名を連ねており、その高い信頼性がうかがえます。特にみずほ銀行やりそなグループなど金融機関に採用されていることを考えると、AI-OCRそのものの精度はもちろん、セキュリティ的な観点から見ても安心感は高いといえるでしょう。

DX Suiteはデータ化した書類をアップロードした後に自動的に仕分けできる機能が実装されており、申込書や請求書、納品書などジャンルの異なる書類であっても一度にスキャンが可能です。書類の自動仕訳にもAIの技術が採用されているため、識字率はもちろんデータ管理の手間も大幅に削減できるのではないでしょうか。もちろん、フリーフォーマットで記載された文字列も自動的に認識するため、一般的な書類整理にも役立ちます。

Smart OCR

Smart OCRはオンプレミス型、クラウド型、専用クラウド型、プライベートクラウド型の4つの提供形態から選べるAI-OCRです。基本インターフェースはWebブラウザ上に表示され、同時に複数人での操作が可能なため共同作業にも最適。大量の書類を複数人で整理するような部署におすすめのAI-OCRといえます。

また、OCRで変換された構造化データはcsv形式で出力もできるため、基幹システムやRPAとSmart OCRを連携する際にも役立ちます。

AnyForm OCR

AnyForm OCRは注文書や納品書などの帳票処理に特化したAI-OCRです。取引先によって異なるフォーマットの帳票であってもAnyForm OCRは明細行の終端を自動的に認識するため、あらゆる形態の帳票に対応できます。ほかにも、OCR結果の確認画面を簡単にデザインできるといった機能があり、実践に強いソフトウェアだといえるでしょう。

RPAとの併用で活用の幅が広がるAI-OCR

まだまだ手書きの申込書やさまざまな書類が多いなかで、AI-OCRは業務効率化の大きなカギを握っている存在といえるでしょう。

最初は多少の誤認識があったとしても、ディープラーニングによって認識精度は徐々に向上していきます。まさにAI-OCRならではの強みであり、通常のOCRでは実現できなかったことです。今回紹介した4つのAI-OCRのほかにもさまざまな製品やサービスが提供されています。複数のサービスを比較したうえで自社のニーズにマッチしたものを選んでみてはいかがでしょうか。

 

参考:

関連記事