スキャナ保存の運用を開始している事業者の経理担当者
021スキャナ保存にAI OCRは本当に便利なのか?
スキャナ保存を専用のシステムで対応する際、『領収書をスマホで撮影してアップロードできます、AI-OCRを使っているので精度は◯◯%』
というような説明を見たことはありませんか?
AI-OCRの精度が99.◯%というものもあります。
例えば、精度が99.5%だとします。
『99.5%』と聞くと、めちゃくちゃ精度いいじゃん、と思いませんか?
領収書をスキャナ保存することにフォーカスした場合、99.5%の精度はとても便利なように感じます。
ただし、注意点があります。
- 精度は高いけど、100%ではない、ということです。
- 逆に考えると『0.5%間違える』と言っているのと同じだということです。
『200文字に1文字程度間違えます。』※1
と言われると、あーそっかー、確率は低いけど、0.5%間違えるのか..
『間違える』に引っ張られ、使うのやめよっかな・・・となりませんか?
『99.5%の精度です』
と言われると、ほぼ100%じゃん、99.5%なら、大丈夫だね、
これにしよう!というような判断になりませんか?
※1 例えば、400字詰め原稿用紙1枚の中で2文字誤字脱字があったり、新聞紙1ページには、最大約12,600文字くらい書いてあるので、64文字誤字脱字があるということになります。そんな新聞でも有りですか?というレベルです。
このエラー率は、多くの有名企業が採用している品質基準「シックスシグマ」から見ると1,000倍以上のエラー率になり、常用するには難しいレベルと言わざるを得ません。
どっちに意識を向けるかというだけで言ってることは一緒なんですよね。
話を元に戻しますが、年間の領収書などスキャナ保存する紙の枚数が600枚(月にすると50枚)1枚に付き必要な部分(件名や宛名、品名、数字など)の文字数が100文字程度の場合、「2枚に1枚は1文字間違えている」という計算になります。
AI-OCRはとても便利な機能だけど、一定の割合で間違いがあるので、スキャナ保存の担当者はちゃんと正しく読み取りされているか『目視』でも確認しましょう。
ちなみに私はレシートをスマホ撮影してOCR機能(AI-OCRではない)を使って試した際、いきなり、購入したお店の名前が違って読み取られている、ということがありました。
数年前にお店の名前が変わっていて、読み取られていたデータが古いお店の名前だった、という経験をしたこともあり、スキャナ保存入力時の目視チェックは改めて必ず実行しようと思いました。
結論
※認知バイアスとは、これまでの経験からくる思い込みなどのことです。
計算上でも一定数間違えはあるのでAI-OCRの特徴、精度を知った上で上手に活用していけると業務の効率化に繋がっていきますね!
補足シックスシグマについて
AI-OCRの識字率99.5%(0.5%のエラー)というのは、シックスシグマの見地で見ると約1,250倍以上の不良率(ミス率)になり、現在では、実用に耐えられるレベルには少し難しいと言わざるを得ません。ちなみに0.5%のエラー率というのは、大体4シグマ(エラー率0.621%)になり、シックスシグマが登場する1980年代以前の品質になる感じです。
シックスシグマとは、Motorolaが開発して、その後、GEやシーメンスなど大手企業が導入した品質管理や業務改善の手法です。本質は、製品などのバラツキを100万個(回)の製品(オペレーション)の内の不良(エラー)を3〜4個(回)以下に抑える(標準偏差σを6σにする)ためのフレームワーク(手法と考え方)になります。
MotorolaやGE、SONY、東芝、ボルボ、シーメンスなどの大手企業に導入されています。また、事務作業などのオペレーションにも応用されています。