JP3648270B2 - Form reading device and accounting form reading device - Google Patents
Form reading device and accounting form reading device Download PDFInfo
- Publication number
- JP3648270B2 JP3648270B2 JP18982994A JP18982994A JP3648270B2 JP 3648270 B2 JP3648270 B2 JP 3648270B2 JP 18982994 A JP18982994 A JP 18982994A JP 18982994 A JP18982994 A JP 18982994A JP 3648270 B2 JP3648270 B2 JP 3648270B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image data
- data
- recognition
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【0001】
【産業上の利用分野】
本発明は、文書若しくは帳票(以下、帳票類)に記されたデータを入力するため帳票類を読み取る帳票読取装置に関し、特に、光学文字読取装置を用いた帳票読取装置に関する。
【0002】
【従来の技術】
文書若しくは帳票類を読取り入力データを得る入力装置の一種として、光学文字読取装置(OCR)がある。光学文字読取装置にあっては、原理的には、読取り対象の帳票類を光学的に走査し、鉛筆、あるいは筆記具によって帳票類に記された文字等の反射光を得て光電変換により電気信号を取り出しA/D変換を行いイメージデータを得て、当該イメージデータに対し、例えば、パターン認識等による文字認識処理を行う。このような文字認識装置にあっては、技術的には文字の読取り精度の向上及び読み取った文字の認識率の向上が計られてきたが、読取り精度や認識率の向上とあいまった重要な解決課題として、帳票類の記入ミスや誤字があった場合の処理、即ち、入力データのチェック及び修正方式が挙げられる。入力時に認識不能な文字を検出した場合の処理方式として最も原始的な方式としては読み取った帳票類を読取り不能としてハードウエア的に排出し、オペレータが排出された帳票類を検査し訂正した後、再び読み取るという方式が当初開発された。
【0003】
しかし、上述の方式ではオペレータにとって認識不能文字がどれだけあるかの判断が必要である等、オペレータの負荷が過大でありデータ入力効率が悪いため、その後、表示装置上に認識不能文字が存在する帳票類がある都度記入データのイメージパターンを示し、読取り不能文字を明点表示する等により、オペレータに読取り不能文字の位置を明示してオペレータによる修正を可能とした方式が開発された。しかしながら、上述の方式では表示されたイメージパターンがどのように読取られた(文字認識された)かが不明であるという不都合があり、また、読取り結果(認識結果)のみを表示する場合にはチェックのため帳票とその都度突き合わせを行う必要があるという不都合があった。
【0004】
これに対し、帳票に読取り不能文字がある場合に、読取りの都度、イメージデータと読取り結果(読取り可能な文字はその読取り結果(認識結果)を、読取り不能文字については読取り不能文字であることを示す特定の文字を対応させたもの)とを対応させて表示し、当該表示により読取り不能文字が判別された帳票を読み取る毎にオペレータに修正を行わせる方式(特公昭57−46106号)がある。
【0005】
【発明が解決しようとする課題】
しかしながら、上記特公昭57−46106号に開示された技術では、多数の帳票を連続して読み取っているとき、ある一枚の帳票に読取り不能文字が判別されるとその帳票が表示装置に表示され、オペレータが帳票を参照して入力装置から文字の修正を行うので、帳票類の連続読取りがしばしば長時間にわたって中断され、入力効率が低下するという問題点があった。
【0006】
また、会計帳票のデータは数値であり、相手先コードや科目コードのような文字(数字)も数値として扱うほうが装置全体として取り扱いが容易である場合があるが、数値と文字では電子計算機内部での取り扱いにおいて異なる。このことから、そのような方式をとる装置での会計帳票データの修正にあたっては単に従来のように認識不能とされた文字のみの修正では後述するトータルチェックの実行時等に不都合が生じることとなる。
【0007】
更に、特公昭57−46106号に開示された技術では読取り不能文字が存在する場合に当該イメージデータと読取り結果(読取り可能な文字はその読取り結果(認識結果)を、読取り不能文字については読取り不能文字であることを示す特定に変換したもの)を表示するが、近年の読取り精度及び認識技術の発達により事実上読取り不能な文字はなく、判別精度の程度は異なるものの読み取った文字は正誤は別として認識可能である。従って、近年の読取り精度及び認識技術の優れた文字認識装置における入力データの修正においては、従来の読取り不能文字の存在による帳票類の記入データの適否判定方式に替えた新たな方式の開発が望まれていた。
【0008】
本発明は、上記従来の技術の問題点及び解決課題に基づいてなされたものであり、対象とする帳票類を全て入力した後、読み取った帳票類の形式及び記入データの入力イメージと認識結果若しくは推定結果を表示し、推定を行った場合に表示された推定結果に基づいて入力データの修正を行うよう構成した帳票類読取装置の提供を目的とする。
【0009】
【課題を解決するための手段】
上記の目的を達成するために第1の発明の帳票類読取装置は、帳票類上に記された文字データを光学的に読取り、電気信号に変換してイメージデータを出力する文字読取部と、文字読取部からのイメージデータに対し文字認識処理を行い基準認識閾値以上の候補文字があるときその候補文字を該イメージデータの文字データとして出力する認識部と、イメージデータ及び/又は文字データを表示可能な表示部と、データを格納する格納部を有する帳票類読取装置であって、文字読取部によって得たイメージデータのうち、認識部の基準認識閾値未満のイメージデータに対し、更に、該基準認識閾値より低い認識閾値を設定して認識処理を行い、基準認識閾値より低い認識閾値以上の候補文字のうちの第1候補文字を該イメージデータの推定文字データとして得る文字推定手段と、イメージデータが基準認識閾値以上のイメージデータであった場合には該イメージデータと認識部から出力された文字データを対応付けて格納部に格納し、イメージデータが基準認識閾値未満のイメージデータであった場合には該イメージデータと文字推定手段が得た推定文字データを対応付けて格納部に格納する格納手段と、格納部から帳票類毎のイメージデータとイメージデータに対応付けられて格納されている文字データ又は推定文字データを取り出して該イメージデータと対応付けて表示部に表示し、推定文字データを表示する際は該推定文字データを識別可能に差別表示する表示手段と、を備えたことを特徴とする。
【0010】
また、第2の発明の帳票類読取装置は、会計帳票上に記された数値データを光学的に読取り電気信号に変換してイメージデータを出力する光学的文字読取部と、光学的文字読取部からのイメージデータに対し文字認識処理を行い基準認識値以上の文字候補があるときその候補文字を該イメージデータの数値データとして出力する認識部と、イメージデータ及び/又は文字データを表示可能な表示部と、データを格納する格納部を有する会計帳票読取装置であって、光学的文字読取部によって得たイメージデータのうち、認識部の基準認識閾値未満の認識対象数値データに対し、更に、該基準認識閾値より低い認識閾値を設定して認識処理を行い、基準認識閾値より低い認識閾値以上の候補文字のうちの第1候補文字を該イメージデータの推定数値データとして得る数値推定手段と、イメージデータが基準認識閾値以上のイメージデータであった場合には該イメージデータと認識部から出力された数値データを対応付けて格納し、イメージデータが基準認識閾値未満のイメージデータであった場合には該イメージデータと数値推定手段が得た推定数値データを対応付けて格納部に格納する格納手段と、読取り対象である全ての会計帳票の読取りが終った時、会計帳票一単位毎に格納部から当該帳票類に対応するイメージデータと該イメージデータに対応付けられて格納されている数値データ又は推定数値データを取り出し、会計帳票の種類毎に定められた形式に基づいて、該イメージデータと対応付けて表示部に表示し、推定文字データを表示する際は該推定文字データを識別可能に差別表示する表示手段と、を備えたことを特徴とする。
【0011】
【作用】
上記構成により第1の発明の帳票類読取装置は、文字推定手段により文字読取部によって得たイメージデータのうち、認識部による基準認識閾値以下のイメージデータに対し基準認識閾値より低い認識閾値を設定して認識を行うことにより推定文字データを得るので、読取り不能文字が生じない。
【0012】
第2の発明の会計帳票読取装置は、文字読取部によって得たイメージデータのうちから読み取った帳票類の種類を判定する帳票類種別情報を得て、数値推定手段により、認識対象数値データのうち認識部による基準認識閾値以下の認識対象数値データに対し基準認識閾値より低い認識閾値を設定して認識を行うと共に、該帳票類種別情報に基づく論理推定基準により数値を推定して推定数値データを得るので、読取り不能の数値が生じない。また、全ての会計帳票を読取ってから、入力修正画面にデータを帳票形式で表示する。
【0013】
【実施例】
図1は本発明に基づく帳票類読取装置10の一実施例の構成を示すブロック図であり、1は光学的文字読取装置(以下、OCR)であり読取部に相当し、2は文字認識部、3は文字推定手段、4は格納手段、5は表示手段、6はデータ等を格納する格納装置からなる格納部であり磁気ディスク、光ディスク、フロッピーディスク等が相当する。7はディスプレイ等の表示装置からなる表示部、8はキーボード等の入力装置、9はデータ修正手段である。
【0014】
図3は財務処理システムに図1の帳票類読取装置10を適用した例であり、財務処理システム(図では"OCR財務システム"と記されている)の開始画面を示すものである。ここで、図3のメニュー"1"には帳票類読取装置10による会計帳票の一括入力処理が示され、メニュー"2"には一括入力処理終了後のデータ修正処理が示されている。
【0015】
図2は図3の財務処理システムにおける帳票類読取装置10の動作を示すフローチャートであり、以下、図1及び図2により帳票類読取装置10の動作について説明する。
【0016】
ステップS0でOCR1のスタッカーに読み込み対象の会計帳票をセットし、メニュー"1"を選択する。ステップS1で、OCR1により一枚単位に会計帳票が読み込まれ図4に示すような帳票(図4の例では出金伝票)に予め印刷された帳票種別コード31と、手書きの、会社コード(相手先コード)32、年月日33、勘定科目コード34、補助欄35、伝票番号35、部門コード欄37、相手科目コード38,39及び金額40,41並びに合計金額42等の入力項目の文字(あるいは数値)が光学的に走査され光電変換により電気信号に変換され、これらの電気信号からイメージデータ列が得られる。
【0017】
ステップS2では得られたイメージデータ列をもとに文字認識部2で文字認識処理を行う。文字認識処理は公知であり本発明に係わる部分以外の説明を省略するが、認識部2では通常入力されたイメージデータ列に対し、一文字毎に文字認識処理を行い一文字分のイメージデータに対し所定の認識閾値以上の候補文字があるときにその候補文字を該イメージデータの文字データとして認識しステップS4に移行する。一方、一文字分のイメージデータに対し所定の認識閾値以上の候補文字がないときにはステップS3に移行し文字推定手段3にイメージデータを渡す。
【0018】
ステップS3で、文字推定手段3は後述するように(図7及び図8の説明参照)渡されたイメージデータから文字を推定し推定文字データとする。ステップS4では格納手段4により文字データ又は推定文字データをイメージデータと対応させて帳票類読取装置10のメモリー(図示せず)に記憶する。
【0019】
上述の処理を帳票の入力項目毎の各文字列について繰返し、一帳票分のイメージデータの認識処理ないし推定処理が終了すると、格納手段により一帳票分イメージデータ及び当該イメージデータに対応付けられた文字データ若しくは推定文字データを格納部6に書き込み、OCR1による次の帳票の読み込み動作に移る。
【0020】
なお、本実施例では格納部に格納されている一帳票分のイメージデータの先頭あるいは後尾に項目数分のフラグが設けられている。上記認識処理及び文字推定処理の結果、ある入力項目のイメージデータ文字列について対応する推定文字データがある時は、その帳票データの当該入力項目は文字データ及び推定文字データからなる文字列となるが、この場合その項目の文字列全体を推定文字列として対応する上述のフラグに特定の値(例えば、"1")を付与するようにしている。
【0021】
なお、本実施例では格納部に格納されている一帳票分のイメージデータの先頭あるいは後尾に各項目数分のフラグを設けているが、この方法に限られること無く、推定文字列が判別できるようフラグを設ければよい。
【0022】
ステップS5では、入力対象の全ての帳票の読み込みが終った場合に帳票類読取装置10の表示部7に図3のようなメニュー画面が示される。ここで、メニュー"2"を選択するとステップS6に移行する。ステップS6では、表示手段5により格納部6に格納されているイメージデータ及び文字列データ列あるいは推定文字列を取り出して表示部7に図5に示すような帳票形式(入力修正画面)でその該当する項目位置に表示する。なお、図5は図4の入力帳票(出金伝票)形式の表示画面に図4に示したデータ(イメージデータ)と文字列データ列あるいは推定文字列を各項目位置に表示したものである。
【0023】
図5の例では表示項目に表示された数字のうち上欄は手書き文字そのものの形で表示されたイメージデータ列であり、下欄は(認識)文字データ列あるいは推定文字データ列(実際には推定文字データ列のうち少なくとも一文字が推定文字データであるデータ列)であり、推定文字データは他のデータとの識別を容易にするために反転表示(図5で斜線は反転表示を意味する)される。例えば、会社コード32は実際には"1234"であるべきところを手書き文字では先頭から3桁目の"3"が"8"と紛らわしく、推定手段"8"と推定したため会社コード32の推定文字データ列は"1284"とされ、会社コード欄を推定文字データ列として反転表示されている。
【0024】
以下同様に、年月日33では"5 5 5"を"80803"と、補助コード欄35では" "を" "と、部門コード36では、" "を" "と、相手科目38では"854"を"884"と相手科目39では"855"を"855"と推定し、反転表示している。なお、実施例では合計欄については欄を上中下の三つの欄にわけ、上欄をイメージデータ、下欄を文字データ列あるいは推定文字データ列を表示する位置とし、中欄にはトータルチェック用の欄であり、文字データ列あるいは推定文字データ列からなる金額欄(40,41)の数値の合計をとり、他のデータとの識別を容易にするために推定文字データ列の場合と同様、反転表示している。
【0025】
このように、表示手段5はオペレータが推定データ文字列を視覚的に識別容易なように表示するための識別表示付加手段(図示せず)を有することが望ましい。また、表示手段5は表示部7に一帳票分のデータの表示を行う前に、帳票の種類に対応した帳票形式を表示するために当該一帳票分のレコードの帳票種別コード31を調べ、該帳票種別コードに対応した帳票フォーマットに基づく帳票形式を表示部7に表示する。ここで、該帳票種別コードに対応した帳票フォーマットは予め格納部6に格納されており、表示手段5により対応のフォーマットが取り出され表示される。
【0026】
図6は上述の帳票の表示フォーマットの説明図であり、帳票種別コード31(コード=122;出金伝票(図4参照))を例としたものである。実際には、各帳票毎にこのようなフォーマットが定められ格納部5に格納されている。なお、図で(1)〜(20)は下記による説明に対応した説明用の番号である。
(1)会社コード32の表示フォーマットであり、位置(x,y)と範囲、桁数(4桁),...,必須フラグ=1,...等(2)年月日33の表示フォーマットであり、位置(x,y)と範囲、桁数(6桁),...,必須フラグ=1,...等(15)相手科目コードの表示フォーマットであり、(15)〜(19)はグループデータで、位置(x,y)と範囲、桁数(4桁),...等(19)金額欄の42の表示フォーマットであり、(15)〜(19)はグループデータで、位置(x,y)と範囲、桁数(10桁),必須フラグ=1,...等(20)合計金額42の表示フォーマットであり、位置(x,y)と範囲、桁数(11桁),必須フラグ=1,...等
【0037】
ステップS7では、オペレータが表示部7に表示される一帳票分のデータをみて誤ったデータ項目が有る場合にカーソルを当該項目位置に移動させ、入力部8から正しいデータを入力する。なお、データ入力は数値項目(例えば、金額欄)または数字項目(例えば、科目コード)では項目の全桁を入力する。入力されたデータは修正手段9により修正され、一帳票分の全ての項目が修正されたことをオペレータが確認する(確認キーを押す)と、修正された一帳票分の文字データで格納部5の対応する一帳票分のレコードを更新し、次の帳票を表示するためにステップS6に制御を戻す。
【0028】
上記修正作業において、表示手段5により項目毎の推定データ文字列が視覚的に識別容易なように表示されているので、オペレータはイメージデータと推定文字列を見比べその正否の判定及び誤っていた場合の修正を容易に行うことができる。また、仮に、推定手段3による文字データの推定精度が低い文字が存在しても表示手段5で項目毎の推定データ文字列を視覚的に識別容易なように表示することにより、オペレータによる修正が簡単にできるため特に問題は生じない。
【0029】
図7は図1の文字推定手段3の一実施例を示すフローチャートであり、文字推定手段3は認識部2から受け取ったイメージデータから下記動作により文字を推定し推定文字データとする。ステップS11で当該一文字分のイメージデータについて認識部2での文字認識処理において所定の認識閾値以上の候補文字の有無を調べ、候補文字がない場合にステップS12に移行する。ステップS12では認識部2での認識閾値を保存し、当該認識閾値以下の閾値を認識閾値として設定し、ステップS13に移行する。ステップS13では設定された認識閾値を基に認識処理を行う。ステップS14で候補文字の有無を調べ、候補文字がない場合にステップS12に移行し、候補文字がある場合は第1候補文字を推定文字とし、保存されている認識閾値を認識部2の閾値として戻し処理を終了する(図2のステップS4に移行する)。
【0030】
図8は図1の文字推定手段3の他の実施例を示すフローチャートであり、文字推定手段3は認識部2から受け取ったイメージデータから下記動作により文字を推定し推定文字データとする。ステップS21で当該一文字分のイメージデータについて認識部2での文字認識処理において所定の認識閾値以上の候補文字の有無を調べ、候補文字がない場合にステップS22に移行する。ステップS22では所定の推定基準によりそのデータの値(文字)を推定する。推定基準の例としては、帳票種別の1項目毎に推定基準を設定することができる。例えば、会計帳票では科目コードについては一定の規則(対応関係)があり、帳票種別が出金伝票の場合には貸方科目は「現金」、「預金」または「小切手」であり、相手科目(借方科目)は「運賃」,「梱包費」,......の費用科目であり、これら科目コードは一定のコード基準により設定されるのが通常である。このような関係にある項目については予め相関関係を推定基準として設定しておき、推定処理に用いることができる。また、文書等では「でし・。」は「でした。」というように、後尾、接頭語、慣用句については前後関係から推定ができ、連想方式による推定も可能である。なお、図7、図8の推定処理は併用して行うことが望ましい。なお、図7、図8の推定処理で項目が未記入の場合は数値項目では0(ゼロ)を、文字項目ではスペースを推定する。
【0031】
以上、上記実施例により本発明について説明したが、本発明の帳票類読取装置は会計帳票だけでなく、文書及び他の帳票の読取り及び入力データの作成に用いることができることは記すまでもない。なお、上記において、会計帳票の科目コード、金額等のデータを文字(数字)として説明したが、金額欄は内部処理ではトータルチェックの必要等の要請により数値項目として扱う方が処理上望ましい。また、金額欄ばかりでなく会計帳票の全ての数字記入項目(例えば、年月日、科目コード等)を数値項目として取り扱ってもよい。
【0032】
【発明の効果】
以上説明したように本発明の帳票類読取装置によれば、推定手段を設けたことにより帳票類の形式で記入データの入力イメージと認識結果若しくは推定結果を並列表示するので、誤った読取り(推定)が生じても推定文字データ列を他のデータと識別可能に表示するので、簡単に修正できる。また、本発明の会計帳票読取装置では、数値推定手段により認識対象数値データのうち認識部による基準認識閾値以下の認識対象数値データに対し該帳票類種別情報に基づく論理推定基準により数値を推定して推定数値データを得て、伝票形式で数値データの入力イメージと認識結果若しくは推定結果を並列表示するので、誤った読取り(推定)が生じても、推定数値データを他のデータと識別可能に表示するので、簡単に修正できる。また、全ての会計帳票を読み取ってから、入力修正画面にデータを表示するので処理の流れが中断することがなく入力及び入力修正効率が向上する。
【図面の簡単な説明】
【図1】 本発明に基づく帳票類読取装置の一実施例の構成を示すブロック図である。
【図2】 図1の帳票類読取装置の動作例を示すフローチャートである。
【図3】 財務処理システムに本発明の帳票類読取装置を適用した例の開始画面の例である。
【図4】 入力帳票の一例である。
【図5】 修正画面の一例である。
【図6】 帳票の表示フォーマットの説明図である。
【図7】 文字推定手段の一実施例を示すフローチャートである。
【図8】 文字推定手段の一実施例を示すフローチャートである。
【符号の説明】
1 光学的文字読取装置(文字読取部)
2 文字認識部
3 文字推定手段(数値推定手段)
4 格納手段
5 表示手段
6 格納装置(格納部)
7 表示装置(表示部)
8 入力装置(入力部)
10 帳票類読取装置[0001]
[Industrial application fields]
The present invention relates to a form reading apparatus that reads forms for inputting data written in a document or form (hereinafter referred to as form), and more particularly, to a form reading apparatus using an optical character reader.
[0002]
[Prior art]
An optical character reader (OCR) is one type of input device that reads a document or a form and obtains input data. In principle, optical character readers optically scan forms to be read, obtain reflected light from characters or the like written on forms using a pencil or writing instrument, and generate electrical signals by photoelectric conversion. And A / D conversion is performed to obtain image data, and character recognition processing such as pattern recognition is performed on the image data. In such a character recognition device, technically, improvement of character reading accuracy and improvement of recognition rate of read characters have been attempted, but an important solution combined with improvement of reading accuracy and recognition rate. As a problem, there is a process when there is an entry mistake or a typo in a form, that is, a check and correction method of input data. As the most primitive method when detecting unrecognizable characters at the time of input, the read forms are discharged as hardware as unreadable, the operator inspects and corrects the discharged forms, A method of re-reading was originally developed.
[0003]
However, in the above-described method, it is necessary to determine how many characters are unrecognizable for the operator. For example, the operator's load is excessive and the data input efficiency is poor, and thereafter there are unrecognizable characters on the display device. A system has been developed that allows the operator to make corrections by indicating the position of the unreadable characters by showing the image pattern of the entry data each time the form is present and displaying the unreadable characters as a light spot. However, the above method has a disadvantage that it is unclear how the displayed image pattern was read (character recognition), and it is checked when only the reading result (recognition result) is displayed. Therefore, there is a disadvantage that it is necessary to match the form with each time.
[0004]
On the other hand, if there are unreadable characters in the form, each time the image is read, the image data and the reading result (the readable character is the reading result (recognition result), and the unreadable character is the unreadable character. There is a system (Japanese Examined Patent Publication No. 57-46106) that displays the information in correspondence with each other and displays an unreadable character on the basis of the display. .
[0005]
[Problems to be solved by the invention]
However, in the technique disclosed in the above Japanese Patent Publication No. 57-46106, when a large number of forms are read continuously, if a non-readable character is determined in a certain form, the form is displayed on the display device. Since the operator refers to the form and corrects the characters from the input device, the continuous reading of the form is often interrupted for a long time, and the input efficiency is lowered.
[0006]
In addition, accounting report data is numeric, and it may be easier for the entire device to handle characters (numerics) such as counterparty codes and subject codes as numeric values. In handling. For this reason, in the correction of accounting form data with an apparatus adopting such a method, the correction of only the characters that cannot be recognized as in the prior art causes inconveniences when performing a total check described later. .
[0007]
Furthermore, in the technique disclosed in Japanese Patent Publication No. 57-46106, when there are unreadable characters, the image data and the read result (the readable character indicates the read result (recognition result), and the unreadable character cannot be read. However, due to recent developments in reading accuracy and recognition technology, there are no characters that are virtually unreadable, and although the degree of discrimination accuracy is different, the read characters are different from correct or incorrect. As recognizable. Therefore, in the correction of input data in character recognition devices with excellent reading accuracy and recognition technology in recent years, it is hoped to develop a new method that replaces the conventional method for determining the suitability of entry data for forms due to the presence of unreadable characters. It was rare.
[0008]
The present invention has been made based on the above-mentioned problems and solutions of the prior art, and after inputting all target forms, the form of the read forms and the input image of the input data and the recognition result or An object of the present invention is to provide a form reading apparatus configured to display an estimation result and correct input data based on the estimation result displayed when the estimation is performed.
[0009]
[Means for Solving the Problems]
In order to achieve the above object, a form reading device according to a first aspect of the present invention includes a character reading unit that optically reads character data written on a form, converts it into an electrical signal, and outputs image data; A recognition unit that performs character recognition processing on image data from the character reading unit and outputs candidate characters as character data of the image data when there is a candidate character that is equal to or greater than a reference recognition threshold, and displays image data and / or character data A form reading apparatus having a display unit capable of storing data and a storage unit for storing data, wherein the image data obtained by the character reading unit is further applied to image data that is less than a reference recognition threshold value of the recognition unit. performs recognition processing to set a lower recognition threshold than recognition threshold, the first candidate character of a low recognition threshold or more candidate characters than the reference recognition threshold of the image data estimation sentences Storing a character estimating means obtained by the data, the storage unit in association with the character data output from the recognition unit with the image data when the image data is the image data of the above criteria recognition threshold, the image data reference When the image data is less than the recognition threshold, the image data and the estimated character data obtained by the character estimation means are stored in association with each other in the storage unit, and the image data and image data for each form from the storage unit The character data or the estimated character data stored in association with each other is taken out and displayed on the display unit in association with the image data, and when the estimated character data is displayed, the estimated character data is discriminated in a distinguishable manner. And a display means .
[0010]
Further, the form reading device according to the second invention is an optical character reading unit that optically reads numerical data written on an accounting form and converts it into an electrical signal and outputs image data, and an optical character reading unit. A recognition unit that performs character recognition processing on image data from and outputs a candidate character as numerical data of the image data when there is a character candidate greater than a reference recognition value, and a display capable of displaying image data and / or character data And an accounting form reading device having a storage unit for storing data, and among the image data obtained by the optical character reading unit, for the recognition target numerical data less than the reference recognition threshold value of the recognition unit, performs recognition processing to set a lower recognition threshold than the reference recognition threshold, the first candidate character of the reference below recognition thresholds recognition threshold or more candidate characters of the image data estimation Numerical value estimation means obtained as value data, and when the image data is image data greater than or equal to a reference recognition threshold value, the image data and numerical data output from the recognition unit are stored in association with each other, and the image data is the reference recognition threshold value If the image data is less than, the storage means for storing the image data and the estimated numerical data obtained by the numerical estimation means in association with each other, and when the reading of all accounting forms to be read is completed The image data corresponding to the form and the numerical data or estimated numerical data stored in association with the image data are extracted from the storage unit for each unit of the accounting form, and the format is determined for each type of accounting form. based on the display on the display unit in association with the image data, to be identified to the estimated character data when displaying the estimated character data Characterized by comprising a display means for another display.
[0011]
[Action]
With the above configuration, the form reading apparatus according to the first aspect of the invention sets a recognition threshold lower than the reference recognition threshold for image data obtained by the character reading unit by the character estimation unit and below the reference recognition threshold by the recognition unit. Since the estimated character data is obtained by performing recognition, unreadable characters do not occur.
[0012]
The accounting form reading device of the second invention obtains form type information for determining the type of form read from the image data obtained by the character reading unit, and the numerical estimation means includes Recognize by setting a recognition threshold lower than the reference recognition threshold for the recognition target numerical data below the reference recognition threshold by the recognition unit, and estimate the numerical value by estimating the numerical value based on the logical estimation criterion based on the form type information. As a result, an unreadable numerical value does not occur. Further, after all the accounting forms are read, the data is displayed in the form on the input correction screen.
[0013]
【Example】
FIG. 1 is a block diagram showing the configuration of an embodiment of a form reading device 10 according to the present invention. 1 is an optical character reading device (hereinafter referred to as OCR), which corresponds to a reading unit, and 2 is a character recognition unit.
[0014]
FIG. 3 is an example in which the form reading apparatus 10 of FIG. 1 is applied to a financial processing system, and shows a start screen of the financial processing system (denoted as “OCR financial system” in the figure). Here, the menu “1” in FIG. 3 shows a batch input process of accounting forms by the form reading device 10, and the menu “2” shows a data correction process after the batch input process is completed.
[0015]
FIG. 2 is a flowchart showing the operation of the form reading apparatus 10 in the financial processing system of FIG. 3, and the operation of the form reading apparatus 10 will be described below with reference to FIGS.
[0016]
In
[0017]
In step S2, the
[0018]
In step S3, the character estimation means 3 estimates characters from the received image data as estimated character data, as will be described later (see FIG. 7 and FIG. 8). In step S4, the storage means 4 stores character data or estimated character data in a memory (not shown) of the form reading device 10 in association with the image data.
[0019]
The above processing is repeated for each character string for each input item of the form, and when the image data recognition process or estimation process for one form is completed, the image data for one form and the character associated with the image data are stored by the storage means. Data or estimated character data is written in the
[0020]
In the present embodiment, flags corresponding to the number of items are provided at the head or tail of the image data for one form stored in the storage unit. As a result of the recognition process and the character estimation process, when there is estimated character data corresponding to the image data character string of a certain input item, the input item of the form data is a character string composed of character data and estimated character data. In this case, a specific value (for example, “1”) is assigned to the above-described flag corresponding to the entire character string of the item as an estimated character string.
[0021]
In this embodiment, flags corresponding to the number of items are provided at the head or tail of image data for one form stored in the storage unit. However, the present invention is not limited to this method, and an estimated character string can be determined. A flag may be provided.
[0022]
In step S5, when all the forms to be input have been read, a menu screen as shown in FIG. Here, when the menu “2” is selected, the process proceeds to step S6. In step S6, the image data and the character string data string or the estimated character string stored in the
[0023]
In the example of FIG. 5, among the numbers displayed in the display items, the upper column is an image data string displayed in the form of a handwritten character itself, and the lower column is a (recognized) character data string or an estimated character data string (actually A data string in which at least one character of the estimated character data string is estimated character data), and the estimated character data is displayed in reverse for easy identification from other data (in FIG. 5, hatched lines indicate inverted display). Is done. For example, where the
[0024]
Similarly, in the
[0025]
Thus, it is desirable that the display means 5 has an identification display addition means (not shown) for displaying an estimated data character string so that the operator can visually identify it easily. Further, before displaying the data for one form on the
[0026]
FIG. 6 is an explanatory diagram of the above-described form display format, and takes the form type code 31 (code = 122; withdrawal slip (see FIG. 4)) as an example. Actually, such a format is determined for each form and stored in the
(1) Display format of
In step S <b> 7, the operator moves the cursor to the item position when there is an erroneous data item by looking at the data for one form displayed on the
[0028]
In the above correction work, the estimated data character string for each item is displayed on the display means 5 so that it can be easily visually identified. Therefore, the operator compares the image data with the estimated character string and determines whether it is correct or incorrect. Can be easily corrected. Further, even if there is a character whose character data is not accurately estimated by the estimating means 3, the estimated data character string for each item is displayed on the display means 5 so that it can be easily visually identified. There is no particular problem because it can be simplified.
[0029]
FIG. 7 is a flow chart showing an embodiment of the character estimation means 3 of FIG. 1. The character estimation means 3 estimates characters from the image data received from the
[0030]
FIG. 8 is a flowchart showing another embodiment of the character estimation means 3 of FIG. 1. The character estimation means 3 estimates characters from the image data received from the
[0031]
Although the present invention has been described above by way of the above embodiments, it goes without saying that the form reading apparatus of the present invention can be used not only for accounting forms but also for reading documents and other forms and creating input data. In the above description, the data such as the item code and the amount of money in the accounting form has been described as characters (numbers). However, it is preferable in terms of processing that the amount field is handled as a numerical item in response to a request for total check in the internal processing. Further, not only the amount column but also all the numerical entry items (for example, date, subject code, etc.) of the accounting form may be handled as numerical items.
[0032]
【The invention's effect】
As described above, according to the form reading apparatus of the present invention, since the estimation means is provided, the input image of the input data and the recognition result or the estimation result are displayed in parallel in the form of the form, so that erroneous reading (estimation) ), The estimated character data string is displayed so as to be distinguishable from other data, so that it can be easily corrected. In the accounting form reading apparatus of the present invention, the numerical estimation means estimates the numerical value based on the logical estimation criterion based on the form type information for the recognition target numerical data below the reference recognition threshold value by the recognition unit among the recognition target numerical data. The estimated numerical data is obtained and the input image of the numerical data and the recognition result or estimation result are displayed in parallel in a slip format, so that even if erroneous reading (estimation) occurs, the estimated numerical data can be distinguished from other data Since it is displayed, it can be easily corrected. In addition, since all the accounting forms are read and the data is displayed on the input correction screen, the flow of processing is not interrupted and the input and input correction efficiency are improved.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an embodiment of a form reading apparatus according to the present invention.
FIG. 2 is a flowchart illustrating an operation example of the form reading apparatus in FIG. 1;
FIG. 3 is an example of a start screen of an example in which the form reading apparatus of the present invention is applied to a financial processing system.
FIG. 4 is an example of an input form.
FIG. 5 is an example of a correction screen.
FIG. 6 is an explanatory diagram of a form display format;
FIG. 7 is a flowchart showing an embodiment of character estimation means.
FIG. 8 is a flowchart showing an embodiment of character estimation means.
[Explanation of symbols]
1 Optical character reader (character reader)
2
4 Storage means 5 Display means 6 Storage device (storage part)
7 Display device (display unit)
8 Input device (input unit)
10 Form reader
Claims (2)
前記文字読取部によって得たイメージデータのうち、前記認識部の基準認識閾値未満のイメージデータに対し、更に、該基準認識閾値より低い認識閾値を設定して認識処理を行い、前記基準認識閾値より低い認識閾値以上の候補文字のうちの第1候補文字を該イメージデータの推定文字データとして得る文字推定手段と、
前記イメージデータが前記基準認識閾値以上のイメージデータであった場合には該イメージデータと前記認識部から出力された文字データを対応付けて前記格納部に格納し、前記イメージデータが前記基準認識閾値未満のイメージデータであった場合には該イメージデータと前記文字推定手段が得た前記推定文字データを対応付けて前記格納部に格納する格納手段と、
前記格納部から前記帳票類毎のイメージデータと前記イメージデータに対応付けられて格納されている文字データ又は推定文字データを取り出して該イメージデータと対応付けて前記表示部に表示し、推定文字データを表示する際は該推定文字データを識別可能に差別表示する表示手段と、を備えたことを特徴とする帳票類読取装置。Character reading unit that optically reads the character data written on the form, converts it into an electrical signal and outputs the image data, and performs character recognition processing on the image data from the character reading unit and exceeds the reference recognition threshold A document reader having a recognition unit that outputs the candidate character as character data of the image data, a display unit that can display image data and / or character data, and a storage unit that stores the data Because
Among the image data obtained by the character reading unit, image data that is less than the reference recognition threshold value of the recognition unit is further subjected to recognition processing by setting a recognition threshold value lower than the reference recognition threshold value. Character estimation means for obtaining a first candidate character of candidate characters having a low recognition threshold value or more as estimated character data of the image data ;
When the image data is image data equal to or higher than the reference recognition threshold, the image data and character data output from the recognition unit are stored in association with each other, and the image data is stored in the reference recognition threshold. Storage means for associating and storing the image data and the estimated character data obtained by the character estimation means in the storage unit when the image data is less than
The character data stored in association with the image data and the image data for each form and the estimated character data are extracted from the storage unit and displayed on the display unit in association with the image data. And a display means for displaying the estimated character data so that the estimated character data can be discriminated in a distinguishable manner.
イメージデータ及び/又は文字データを表示可能な表示部と、データを格納する格納部を有する会計帳票読取装置であって、
前記光学的文字読取部によって得たイメージデータのうち、前記認識部の基準認識閾値未満の認識対象数値データに対し、更に、該基準認識閾値より低い認識閾値を設定して認識処理を行い、前記基準認識閾値より低い認識閾値以上の候補文字のうちの第1候補文字を該イメージデータの推定数値データとして得る数値推定手段と、
前記イメージデータが前記基準認識閾値以上のイメージデータであった場合には該イメージデータと前記認識部から出力された数値データを対応付けて格納し、前記イメージデータが前記基準認識閾値未満のイメージデータであった場合には該イメージデータと前記数値推定手段が得た前記推定数値データを対応付けて前記格納部に格納する格納手段と、
読取り対象である全ての会計帳票の読取りが終った時、会計帳票一単位毎に前記格納部から当該帳票類に対応するイメージデータと該イメージデータに対応付けられて格納されている数値データ又は推定数値データを取り出し、会計帳票の種類毎に定められた形式に基づいて、該イメージデータと対応付けて前記表示部に表示し、推定文字データを表示する際は該推定文字データを識別可能に差別表示する表示手段と、
を備えたことを特徴とする会計帳票読取装置。An optical character reading unit that optically reads numerical data written on an accounting form and converts it into an electrical signal and outputs image data, and a character recognition process for the image data from the optical character reading unit. A recognition unit that outputs the candidate character as numerical data of the image data when there is a candidate character greater than or equal to the recognition value;
An accounting form reader having a display unit capable of displaying image data and / or character data, and a storage unit for storing data,
Wherein among the image data obtained by an optical character reader, the relative recognized numerical data below threshold recognition threshold of the recognition unit, further performs the recognition process by setting a lower recognition threshold than the reference recognition threshold, the Numerical estimation means for obtaining a first candidate character of candidate characters that are equal to or higher than a recognition threshold lower than a reference recognition threshold as estimated numerical data of the image data ;
When the image data is image data equal to or higher than the reference recognition threshold, the image data and numerical data output from the recognition unit are stored in association with each other, and the image data is less than the reference recognition threshold. Storage means for associating the image data and the estimated numerical data obtained by the numerical value estimating means in association with each other and storing them in the storage unit;
When all the accounting forms to be read have been read, the image data corresponding to the forms and the numerical data stored in association with the image data are stored from the storage unit for each unit of the accounting form. Numeric data is extracted and displayed on the display unit in association with the image data on the basis of a format determined for each type of accounting form. When displaying the estimated character data, the estimated character data is discriminated so that it can be identified. Display means for displaying;
An accounting form reading apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18982994A JP3648270B2 (en) | 1994-07-20 | 1994-07-20 | Form reading device and accounting form reading device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18982994A JP3648270B2 (en) | 1994-07-20 | 1994-07-20 | Form reading device and accounting form reading device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0830719A JPH0830719A (en) | 1996-02-02 |
JP3648270B2 true JP3648270B2 (en) | 2005-05-18 |
Family
ID=16247913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP18982994A Expired - Lifetime JP3648270B2 (en) | 1994-07-20 | 1994-07-20 | Form reading device and accounting form reading device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3648270B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020057186A (en) * | 2018-10-02 | 2020-04-09 | フードゲート株式会社 | Accounting software and system |
-
1994
- 1994-07-20 JP JP18982994A patent/JP3648270B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH0830719A (en) | 1996-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6885769B2 (en) | Business form handling method and system for carrying out the same | |
US7092561B2 (en) | Character recognition, including method and system for processing checks with invalidated MICR lines | |
JP4977368B2 (en) | Medium processing apparatus, medium processing method, medium processing system, and computer-readable recording medium recording medium processing program | |
JP4078009B2 (en) | CHARACTERISTIC RECORDING AREA DETECTION DEVICE FOR FORM, CHARACTER RECORDING AREA DETECTION METHOD FOR FORM, STORAGE MEDIUM, AND FORM FORMAT CREATION DEVICE | |
US9027833B2 (en) | Commodity information display apparatus and method for displaying commodity information in different forms | |
JP2001184453A (en) | Document processing system and document filing system | |
US7480403B2 (en) | Apparatus, system, and method for fraud detection using multiple scan technologies | |
JPH08161436A (en) | Receipt reader | |
JP3648270B2 (en) | Form reading device and accounting form reading device | |
JP3707997B2 (en) | Method and apparatus for determining payment form | |
JP3946043B2 (en) | Form identification device and identification method | |
JPH0773267A (en) | Method and apparatus for discrimination and correction of error | |
JP4224914B2 (en) | Character reading system and character reading method | |
JP2000132635A (en) | Recognizing data confirming method | |
JP3790575B2 (en) | Book issue management device | |
JP3310063B2 (en) | Document processing device | |
JP2022088183A (en) | Ledger sheet reader and ledger sheet reading method | |
JP2022116983A (en) | Image processing apparatus, image processing method, and program | |
JP6217403B2 (en) | Handwritten amount entry column check screen output method, handwritten amount entry column check screen output program, and handwritten amount entry column check screen output device | |
JP3419418B2 (en) | Character reading method and device | |
JP2007115280A (en) | Slip-identifying apparatus and its identifying method | |
JP2005266923A (en) | Handwritten numeral recognition method | |
JPS6154581A (en) | Character recognizer | |
JP2002074269A (en) | Method for recognizing character | |
JPS6119079B2 (en) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040406 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040608 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040921 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050118 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050214 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080218 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140218 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |