HOME > 製品 > 製品一覧 > IMGtoDigi


「IMGtoDigi(高性能OCRエンジン)」のご紹介

図面OCR、TIFFOCR、PDFOCR、帳票OCRのソリューション

YSSが図面やTIFFや帳票などで、テキストデータの無い電子データの再利用における問題点を解決するデジタル化ソリューションを提供いたします!

デジタル化ソリューション

 

1.YSSのOCRエンジンが以下
のような悩みを解消します。

既存OCRエンジンでは解決できなかった以下のような悩みを解消することができます。
矢印
  • ● 紙からの大量の文字入力を手作業で行っている。
  • ● 図面を電子化したが、検索できなくて困っている。
  • ● 目視での確認作業を行っているが、自動化を考えたい。
  • ● 過去にOCRソフトを検討したが、精度が低くてあきらめた。
  • ● OCRソフトを入れたが、精度が低く使用を停止した。
  • ● OCRソフトを使用しているが、精度が向上できれば、作業の効率化が実現できる。

 

2.当社で改善できる
業務と事例

図面OCR、CADOCR(CAD図面のOCRの事例)
  多くの製造業において、作成中はCADで運用していても、最終図面として、 TIFFやPDFで保存するという運用が非常に多くなっています。設計者以外はCADソフトをインストールしないことが理由です。 しかし、AutoCADやCATIAやPro/E(Pro/ENGINEER)などでは、特殊なフォントが使われていることで、紙やTIFFは当然のこと、 PDFファイルにおいても検索やテキスト抽出ができません。

これをOCRで対応した場合、以下の問題が発生します。

  •   問題1 フォントが特殊なので、認識率が低い
  •   問題2 特殊な記号なども認識したいが、難しい
  •   問題3 文字と図面が重なるなど、思った結果にならない

  YSSのIMGtoDigiによって、多くの製造業様において、これまでは対応困難と思われていた文字認識を実現しています。

  事例1 大量の図面を検索可能に

  過去のファイルなど、10万ファイルのTIFFを保管していました。図面中に参照用の図面番号/製造番号/品番が存在しており、 それをキーワードに検索を行うことを検討していました。 しかし、CADの特殊なフォントに対し、他社OCRでは文字認識精度が低く対応できませんでした。
しかし、IMGtoDigiの高い認識率で解決しました。
実現例 AutoCADOCR(SHXOCR)、CATIAOCR、Pro/EOCRなど

大量の図面を検索可能に


  事例2 探したい部品部分を高速に表示するシステムと連携

  部品表の部品番号を認識して座標も取得します。座標情報を上位システムに渡すことで、部品番号を指定すると、 探したい図面の場所を表示するシステムを構築しました。 テキスト情報だけでなく、フォントサイズや、座標情報も抽出できるIMGtoDigiだからできることです。

事前準備フェーズ スキャンした図面

文字認識+座標取得

図面管理システムに登録
運用フェーズ 部品番号を検索

上位システムで、図面と場所を認識

TIFFやPDF表示システムと連携して、該当箇所を表示

  事例3 図面情報から情報を転記する作業の効率化

  図面情報に記載されている製造番号や部品番号などをExcelにする作業を行っている会社において、 作業を圧倒的に効率化しました。特に、自動車関連の認証作業などで大きな効果をあげています。

 

入力作業や文書振り分けの効率化
  データ入力作業や、紙を仕分ける作業を行うことは非常に大変です。

  •   問題1 作業が多いと、大きな工数がかかる
  •   問題2 スキャンなどの傾きや歪みで、認識精度が低下
  •   問題3 OCR対象文字に、色鉛筆でチェックがされている


  事例1 見積書・納品書・請求書などの情報を自動入力

  一番ポピュラーな例として、紙で受けた受発注などの情報を自動で文字認識させ入力することで、業務を効率化します。
見積書・納品書・請求書などの情報を自動入力

  事例2 文字認識+ファイルの分割と集約

  大量の文章を一度にスキャンして、文書内のキーワードを区切り文字として別ファイルにしたり、 ファイル名を文章内の特定番号から作成したいということを実現します。
文字認識+ファイルの分割と集約

  事例3 アンケート集計の効率化

  大量のアンケートを集計する作業において、手で打ち込む作業は非常に大変です。単純な文字認識だけでなく、 枠内にチェックが行われているか、欄内に手書きで何か追記がされているかの情報を取得することも可能です。

どこにマークしているかの情報を取得すると同時に、手書き部分などを、人間系でどうしても入力しなければいけない場合に、 後工程に個人情報などマスキングして渡している事例もあります。 スキャン時のゆがみや傾きを補正して正しくマスキングを行います。

[個人マスキングイメージ]
個人マスキングイメージ

 

ドットインパクトプリンタ伝票のOCR
  ドットインパクトプリンタとは、複写式の既に印刷された伝票に圧力をかけて印刷をする帳票です。 このためドットインパクトプリンタから印刷された帳票には以下の問題があります。

  •   問題1 文字が罫線にかかってしまう
  •   問題2 文字がかすれてしまう

  このため、他社製品において、OCRを行うと認識率が低いという問題があります。
当社IMGtoDigiでは、他社製品と比較して圧倒的な認識率により、多くのお客様の業務効率化を実現しています。

  事例1 入力作業の効率化

  業際統一伝票の文字認識(OCR)により、これまでは手入力していた業務を圧倒的に低減しました。

  事例2 他社OCRソフトからの切替

  他社OCRで受領伝票の文字認識を行っていましたが、他社OCRソフトでは70%程度の認識率で、効率化できませんでした。 IMGtoDigiを使用することにより、大幅な精度向上が実現され、受領情報などの登録効率化を実現しました。

 

工場ラインの検査
  半導体や食品、化粧品の製造ラインにおいて、製造ミスは大きな損失につながります。 これらの問題を解決する技術を提供しています。どのように画像化するか等、検討すべき事項はありますが、ミスの低減を行うことが可能です。

  事例1 半導体等の製造番号のOCR

  半導体ウエハーというシリコンを薄くスライスした円盤状の板にレーザーで書かれた文字やバーコードを読み取ることを実現しています。 全件確認を行うのか、抜き取りで行うのかについては、内容によって調整をすることになります。

  事例2 食品のラベルのOCR

  食品ラベルが正しく印字されて、添付されているかを、検査する業務で使われています。

  事例3 化学薬品や化粧品の箱のOCR

  化学薬品や化粧品の箱の成分表示や注意事項は非常に重要です。これに間違いが無いかサンプリングをして調査を行う業務を省力化します。 平面だけでなく曲面でも対応余地があります。

  事例4 半導体基板の製造結果の確認

  半導体基板のプリント基板が元の図面と一致していることを確認するために当社技術が使用されています。 非常に細かいプリントが正しく行われていることを確認するのは非常に大変です。

上記以外にも、目視確認作業によるミスを低減しているお客様はいらっしゃいます。 このようなことはできないのかということがあれば、営業までお問い合わせください。

 

決算書のOCR
  決算書を自動でOCRして、データ登録することができます。対象は、銀行や生命保険などの融資を行う金融機関、 企業調査を行うリサーチ会社などです。

  事例1 事務センターでの手入力を削減

  決算情報の入力は、多くの銀行において、データセンターでの手入力を行っています。 これは、OCRでは精度が低いため、手入力をしたほうが早いという結論で、人海戦術を行っていました。 これを当社IMGtoDigiで対応することで、大幅な効率化になりました。

  事例2 他社OCRソフトからの切替

  決算情報の入力を効率化する際に、OCRソフトを使用して効率化を図ろうとしました。 しかし、OCRされたPDFファイルからテキストをコピー&ペーストして、Excelに張り付ける程度のことしかできないため、期待した効果が出せませんでした。 YSSの技術を使用することで、認識精度の大幅向上と、決算書項目に応じた情報自動抽出を実現できました。

 

医療事務の軽減
  医療事務においては、大量のドキュメントが発生します。 特に、紙からの文字入力を求められるケースが多く、医療事務代行会社が人海戦術で入力+2重チェックをしているケースが多いです。

  事例1 外部からの紙ドキュメントOCR

  外部からもらう資料において、OCR対象文字に色鉛筆で追記されたものがあり、単純なOCRでは認識できないケースがあります。 確認作業などのために、紙に色が追記されてしまうケース(押印、サイン、確認のしるしのチェック)などです。 IMGtoDigiはこのようなファイルでも文字認識を行うことが可能です。
なお、医療事務に関しては、以下のような作業効率化を達成しているパターンもあります。

  事例2 入力作業を効率化するシステムの作成

  手書きなど、単純なOCRだけでは対応できないケースがあります。 そのような場合に、手入力したい部分の画像だけ抽出して、入力画面の真上に自動で配置するシステムを構築致します。

  事例3 レセプトチェック処理の自動化

  レセプトから診療報酬を確認する作業は非常に大変です。この作業を委託する業務を大幅に効率化するシステムを提供しております。 ご関心がありましたら、営業までお問い合わせください。

 

YSSのOCRエンジンの使用で、
下記のメリットがあります。

メリット1 特定の書式に合わせた調整で、OCR精度をアップします!
  罫線がある帳票では、OCR精度が大きく低下するケースが多いです。罫線部分を事前処理することで、高いOCR精度を提供します。

メリット2 大量処理・自動処理を行います!
  手動ソフトではありません。大量処理や・自動処理を行う前提のOCRエンジンです。 Java/ASP.NETなどのWebシステム連携や、コマンドやフォルダ監視などの処理を行うことが可能です。 業務の効率化やシステム連携を行う仕組みを提供します。

メリット3 特殊なフォントにも対応します!
  複数のフォントが混在しているファイルは苦手です。 逆に特殊なフォントでも、フォントが1種類しかない場合、ファイルごとにフォントが決まっている場合、高い精度を提供することができます。

  •  ■基幹システム(IBM製、富士通製等)から出力された特殊なフォント
  •  ■出力される特殊なフォント
  •  ■AutoCADのSHXフォント
  •  ■3DCAD等のCADソフト独自のフォント(CATIA等)

メリット4 様々な連携を行うことが可能です!
  お客様に合わせた様々な連携・カスタマイズを行うことが出来ます。

  •  ◎PDFや画像ファイルの自動分割
  •  ◎PDFや画像ファイルへのファイル名自動付与
  •  ◎OCRした情報をDBやExcel等へ自動出力(入力)
  •  ◎OCR結果確認の仕組みの構築
  •  ◎OCR結果とDBデータの突合システムの構築
  •  ◎受発注システム、在庫システム、設計システムとの連携

 

OCRとは

OCRとは
  紙をスキャナなどで画像やPDFファイルにした場合、文字に見える部分は黒の点の集合体であり、文字コードがありません。 ファイルを見るだけであれば問題はありませんが、大量にファイルがある場合やページ数が多い場合に、特定の文字を探すことが大変になります。

この問題を解決するために使用されるのがOCR(optical character recognition)です。日本語にすると光学文字認識です。 これは当初、鏡やレンズといったハード側の光学技術を使用していたためです。 現在はデジタル文字認識が主流となっているため、「光学」というイメージはありません。

画像の白と黒のパターンから、該当するテキストを文字認識して、テキスト化を行います。

OCRはなぜ難しいのか
  OCRソフトを一度でも使用したことのある人は、思った通りに認識されないという経験があると思います。 OCRが正確に行われるかどうかは、以下の条件に依存します。 画像解像度/傾きの有無/汚れの有無/罫線の有無/フォントの種類 等

上記のことを説明せず(説明の隅っこに記載して) 「どのような文字でもOCR出来ます」、「認識率95%です」などと言うのは、あり得ないセールス文句だと思います。

クライアントソフトを販売しないとは
  大量に行っていることを前提としています。 普段は使用していないが、「不特定」な種類の文字認識をしたい場合に、あったら便利なのでソフトが欲しい。というお客様には技術提供をしていません。

お客様の「困っている内容」「OCR導入によって得られるメリット」「どうしたら一番効率的になるか」をお伺いします。 そして「OCRしたいファイル」をお預かりして、効果が出るかをコンサルティングします。 そのうえで、当社OCRエンジンをクライアントソフト化して提供するということはあります。

値段はいくらなのか
  低価格のソフトを探していて、基本手作業で補助を行うというのであれば、当社製品は向いておりません。

当社が提案する内容は、便利ソフトではなく、お客様の業務を効率化できるソリューションです。 単純なOCRエンジン提供ではなく、上位システムとの連携、OCR対象ファイルからの傾き補正や汚れの除去、OCR結果が正しいかをチェックするための情報の提供、 ファイルの分割や格納まで、提案をさせて頂きます。

このため、お安い値段にはならないケースが多いです。しかし、お客様が人件費をかけて行っていたことが明確に省力化されるため、 費用対効果が高いとお客様から評価を頂いています。 また、作業の精度が向上することから、事務ミス件数が減少することで、金額に見えない効果を評価頂いております。

特に、他社製品でエラー率が高く、効果が上がらなかったお客様において、当社エンジンに切り替えて頂くことで、良い評価を頂いております。

手書きは対応しないのか
  以下のようなニーズのお客様には合わない製品ですので、お役に立てません。

  • × クライアント版で低価格なOCRソフトを探している。
  • × OCR対象は不特定。どんなものでもある程度OCR出来る便利ソフトを探している。
  • × 手書き文書をOCRしたい。(手書き文字を実運用可能な認識率で、OCRできると言っているソフトは信用できないと当社は考えております)

  手書き文字もOCR出来ますというソフトを見かけます。 もし一度でも手書き文字をOCRしたことのある人であれば、意味の無いことであると理解頂けるはずです。 同じ「1」を記入するのでも、人によって大きく書き方が異なります。ましてや複雑な文字で正しい判別が出来るはずがありません。

実際にOCRメーカーの言葉を信じて運用を開始したものの、あまりのエラー率の高さに運用を停止した(手書きOCRを使用しなくなった)システムの話を良く聞きます。 認識率が50〜80%になる可能性があるのであれば、最初から手入力をしたほうが効率的です。 大量の正誤確認作業は効率を低下させるからです。手書きOCR出来ますというOCRメーカーは、自らOCRという技術の信頼を低下させている可能性があります。

手書きOCRを使用するよりは、他の方法で業務効率化を図るべきです。当社は、そのようなノウハウが蓄積していますので、お気軽に相談ください。

 

まとめ

  当社は、システムの構築(エンドユーザ向け)あるいはPDF製品とノウハウの提供(SI会社様向け)にて皆様にOCR作業の効率化をご提供します。 OCRのニーズは、会社・部署により千差万別です。まったく同じ機能はまずあり得ません。

  •  ●この機能はこうしたらもっと便利になる
  •  ●あんな機能が欲しい

  というご要望がありましたら、お気軽に営業までお問い合わせください。

 

パンフレット

IMGtoDigiを使用した例です。
IMGtoDigi パンフレット(2898KB)