[go: nahoru, domu]

JP6322086B2 - Display control device, display device, program, recording medium - Google Patents

Display control device, display device, program, recording medium Download PDF

Info

Publication number
JP6322086B2
JP6322086B2 JP2014172035A JP2014172035A JP6322086B2 JP 6322086 B2 JP6322086 B2 JP 6322086B2 JP 2014172035 A JP2014172035 A JP 2014172035A JP 2014172035 A JP2014172035 A JP 2014172035A JP 6322086 B2 JP6322086 B2 JP 6322086B2
Authority
JP
Japan
Prior art keywords
line
display
document image
document
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014172035A
Other languages
Japanese (ja)
Other versions
JP2016045896A (en
Inventor
真彦 高島
真彦 高島
松岡 輝彦
輝彦 松岡
和之 濱田
和之 濱田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2014172035A priority Critical patent/JP6322086B2/en
Publication of JP2016045896A publication Critical patent/JP2016045896A/en
Application granted granted Critical
Publication of JP6322086B2 publication Critical patent/JP6322086B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Controls And Circuits For Display Device (AREA)
  • User Interface Of Digital Computer (AREA)
  • Digital Computer Display Output (AREA)

Description

本発明は、文書画像を表示部に表示させる表示制御装置に関する。   The present invention relates to a display control apparatus that displays a document image on a display unit.

スキャナ等の撮像手段に文書を読み取らせて生成される文書画像として、PDF(Portable Document Format)ファイルの画像やTIFF(Tagged Image File Format)ファイルの画像が知られている。撮像手段を用いて生成される文書画像は、通常、フィックス型と呼ばれる形式になっている。フィックス型とは、文書のレイアウト(1行当たりの文字数や1頁当たりの行数等)が固定の形式である。それゆえ、フィックス型の文書画像を、スマートフォンやタブレット等の小型表示装置で表示すると、表示装置の垂直方向および水平方向共に文書画像が表示領域(コンテンツ表示領域)に収まりきらないことが多く、垂直方向のみならず水平方向にも文書画像をスクロールさせる必要があり、操作が煩雑になる。   2. Description of the Related Art Known document images generated by causing an imaging unit such as a scanner to read a document include PDF (Portable Document Format) file images and TIFF (Tagged Image File Format) file images. The document image generated using the image pickup means is usually in a format called a fixed type. The fixed type is a format in which the document layout (number of characters per line, number of lines per page, etc.) is fixed. Therefore, when a fixed document image is displayed on a small display device such as a smartphone or a tablet, the document image often cannot fit in the display area (content display area) in both the vertical and horizontal directions of the display device. It is necessary to scroll the document image not only in the direction but also in the horizontal direction, and the operation becomes complicated.

また、フィックス型の文書画像の表示倍率を表示領域の広さに応じて調整すれば(縮小表示すれば)、スクロールを行わずに1頁分の文書全体を表示させることが可能になる。しかし、この場合、表示される文字のサイズが小さくなり、文字の可読性が低下してしまう問題がある。   Further, if the display magnification of the fixed document image is adjusted according to the size of the display area (if reduced display), the entire document for one page can be displayed without scrolling. However, in this case, there is a problem that the size of the displayed character is reduced and the readability of the character is lowered.

そこで、撮像手段にて生成される文書画像についても、フィックス型ではなく、テキストデータから構成される画像ファイルのようにリフロー型として表示させることが望ましい。リフロー型とは、文書のレイアウトが固定ではなく、表示領域の広さに応じてレイアウトが再構成される形式であり(各文字を再配置する)、例えばHTML(Hyper Text Markup Language)ファイルが挙げられる。また、最近では、小型表示装置(スマートフォンやタブレット)向けに提供される電子書籍もリフロー型として作成されていることが多い。   Therefore, it is desirable to display the document image generated by the imaging unit as a reflow type like an image file composed of text data instead of a fixed type. The reflow type is a format in which the layout of the document is not fixed and the layout is reconfigured according to the size of the display area (rearranged each character), for example, an HTML (Hyper Text Markup Language) file. It is done. In recent years, electronic books provided for small display devices (smartphones and tablets) are often created as a reflow type.

リフロー型の画像ファイルでは、例えば文書が横書きの場合、可読性が保たれる程度に文字サイズが維持されつつ、文書の1行の長さが表示領域の水平方向の長さ以下になるように、1行当たりの文字数を調整するようになっている。これにより、適切な文字サイズを維持しつつ、水平方向のスクロールを行なわずに垂直方向のスクロールだけで文書全体が表示されるようになる。それゆえ、リフロー型によれば、フィックス型よりも、操作の煩雑度が低いという利点を有する。   In the reflow type image file, for example, when the document is horizontally written, the character size is maintained to the extent that readability is maintained, and the length of one line of the document is equal to or less than the horizontal length of the display area. The number of characters per line is adjusted. As a result, while maintaining an appropriate character size, the entire document is displayed only by scrolling in the vertical direction without scrolling in the horizontal direction. Therefore, the reflow type has an advantage that the operation is less complicated than the fixed type.

そこで、近年、撮像手段にて生成される文書画像をリフロー型として表示させるための技術が提案されている。例えば、特許文献1には、文書画像から文字を抽出して、文字の並び順に従って各文字を配列し直す事により、表示領域の横幅と同じ横幅を持つ文書画像を生成して表示させる文字画像表示装置が提案されている。   Therefore, in recent years, a technique for displaying a document image generated by an imaging unit as a reflow type has been proposed. For example, Patent Document 1 discloses that a character image is generated and displayed by extracting a character from a document image and rearranging each character according to the character arrangement order to generate a document image having the same width as the width of the display area. Display devices have been proposed.

特開2012−108750号公報(2012年6月7日公開)JP 2012-108750 A (released on June 7, 2012) 特許第5153857号(2013年2月27日公報発行)Patent No. 5153857 (issued on February 27, 2013) 特開2009−194740号(2009年8月27日公開)JP 2009-194740 (released August 27, 2009)

特許文献1の技術では、文書画像を生成するとともに、文書画像の文字の並び順を座標値で表した位置座標リストを生成する。続いて、位置座標リストに基づいて、文書画像から各文字を切り出し、各文字を配列し直すことで再配列文書画像を生成し、この再配列文書画像を表示装置に表示させるようになっている。   In the technique of Patent Document 1, a document image is generated, and a position coordinate list in which the order of characters in the document image is expressed by coordinate values is generated. Subsequently, based on the position coordinate list, each character is cut out from the document image, a rearranged document image is generated by rearranging each character, and the rearranged document image is displayed on the display device. .

ここで、前記の位置座標リストは、スキャンされた際の文書画像上での各文字の座標(各文字の並び順)を示したものであるが、表示領域に対する位置関係を示した表示用座標ではない。したがって、特許文献1の技術によれば、最初にファイルを開いた際に各文字について表示用座標を求めるだけではなく、スクロールの度に各文字について表示用座標を求めなければならず、演算手段等のハードウェアにかかる処理負荷が多いという問題が生じていた。   Here, the position coordinate list indicates the coordinates of each character (arrangement order of each character) on the document image when scanned, but the display coordinates indicating the positional relationship with respect to the display area. is not. Therefore, according to the technique of Patent Document 1, not only the display coordinates for each character is obtained when the file is first opened, but also the display coordinates for each character must be obtained each time scrolling. There has been a problem that the processing load on the hardware is large.

本発明は、以上の問題に鑑みてなされたものであり、撮像手段にて生成される文書画像をリフロー型として表示部に表示させる装置において、処理負荷を抑制することを目的とする。   The present invention has been made in view of the above problems, and an object of the present invention is to suppress a processing load in an apparatus that displays a document image generated by an imaging unit on a display unit as a reflow type.

上記の課題を解決するために、本発明の一態様の表示制御装置は、文書を撮像して得られる文書画像をリフロー形式で表示領域に表示させるために前記文書画像のレイアウトを変更する変更部と、レイアウト変更後の文書画像をリフロー形式で前記表示領域に表示させる表示処理を行う表示制御部とを備え、前記変更部は、前記文書画像を構成する要素毎に、レイアウト変更後の文書画像全体のなかでの位置を示す座標値を求め、前記表示制御部は、前記座標値のうち、画像のスクロールの方向と平行な座標軸の座標値に、前記スクロールの量に応じたオフセット値を加算する加算処理を行い、前記加算処理後の座標値を、前記表示領域と前記要素との位置関係を示す表示用座標として前記表示処理を行うことを特徴とする。   In order to solve the above problems, a display control apparatus according to an aspect of the present invention includes a changing unit that changes a layout of the document image so that a document image obtained by imaging the document is displayed in a display area in a reflow format. And a display control unit that performs display processing for displaying the document image after the layout change in the reflow format in the display area, and the change unit includes a document image after the layout change for each element constituting the document image. A coordinate value indicating a position in the whole is obtained, and the display control unit adds an offset value corresponding to the scroll amount to the coordinate value of the coordinate axis parallel to the scroll direction of the image among the coordinate values. And performing the display process using the coordinate value after the addition process as display coordinates indicating the positional relationship between the display area and the element.

本発明の一態様によれば、従来構成よりも処理負荷を抑制できる効果を奏する。   According to one aspect of the present invention, the processing load can be suppressed more than in the conventional configuration.

本発明の一実施形態の携帯端末の機能ブロック図である。It is a functional block diagram of the portable terminal of one Embodiment of this invention. 図1に示した携帯端末の外観構成を模式的に示した図である。It is the figure which showed typically the external appearance structure of the portable terminal shown in FIG. 文字および図表(図または表)から構成される文書画像の一例を示した図であり、図4に示す参照リストに適合した段落分けがされている文書画像を示した図である。It is the figure which showed an example of the document image comprised from a character and a figure (a figure or a table | surface), and is the figure which showed the document image by which the paragraph division suitable for the reference list shown in FIG. 4 was carried out. 図3Aと同じ文書画像を示した図であり、図5に示す参照リストに適合した段落分けがされている文書画像を示した図である。FIG. 3B is a diagram showing the same document image as FIG. 3A, and is a diagram showing a document image that is divided into paragraphs suitable for the reference list shown in FIG. 5. 参照リストの一例を模式的に示した図である。It is the figure which showed an example of the reference list typically. 図4とは異なる参照リストの例を模式的に示した図である。It is the figure which showed the example of the reference list different from FIG. 図4の参照リストを用いる場合のレイアウト変更部の処理手順を示すフローチャートである。FIG. 5 is a flowchart illustrating a processing procedure of a layout changing unit when using the reference list of FIG. 4. FIG. 図5の参照リストを用いる場合のレイアウト変更部の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the layout change part in the case of using the reference list of FIG. 描画座標に基づいて文書画像を表示する場合の表示例を模式的に示した図である。It is the figure which showed typically the example of a display in the case of displaying a document image based on drawing coordinates. 図8のように描画座標が求められた場合の携帯端末のコンテンツ表示領域の様子を示した図である。It is the figure which showed the mode of the content display area of the portable terminal when a drawing coordinate was calculated | required like FIG. オフセット値を変化させるとコンテンツ表示領域に描画される範囲が変化する様子を示した説明図である。It is explanatory drawing which showed a mode that the range drawn on a content display area changed when an offset value was changed. タッチ操作によるスクロール指示を説明するための図である。It is a figure for demonstrating the scroll instruction | indication by touch operation. 表示倍率の変更方法を示した第1の説明図である。It is the 1st explanatory view showing the change method of display magnification. 表示倍率の変更方法を示した第2の説明図である。It is the 2nd explanatory view showing the change method of display magnification. 表示倍率の変更方法を示した第3の説明図である。It is the 3rd explanatory view showing the change method of display magnification. ズーム指示により表示倍率を拡大する際、表示倍率の前後でオフセット値を一定とした場合の描画座標と、コンテンツ表示領域に描画されている範囲とを示した図である。FIG. 6 is a diagram illustrating drawing coordinates and a range drawn in a content display area when an offset value is constant before and after the display magnification when the display magnification is enlarged by a zoom instruction. 参照リストのi番目の要素(「あ」を示す文字)がコンテンツ表示領域上に描画された際の当該要素の外接矩形の中心座標を示す図である。It is a figure which shows the center coordinate of the circumscribed rectangle of the said element when the i-th element (character which shows "a") of a reference list is drawn on the content display area. 複数のタッチ箇所の平均座標値が文字を囲む外接矩形(最小矩形)の内側に位置する様子を示した図である。It is the figure which showed a mode that the average coordinate value of a some touch location is located inside the circumscribed rectangle (smallest rectangle) surrounding a character. ユークリッド距離を求めるための式に含まれる重み付け係数を説明するための図である。It is a figure for demonstrating the weighting coefficient contained in the type | formula for calculating | requiring an Euclidean distance. 表示倍率を変更する前後で要素の上端を揃える様子を示す説明図である。It is explanatory drawing which shows a mode that the upper end of an element is arrange | equalized before and after changing display magnification. 表示倍率を変更する前後で要素の下端を揃える様子を示す説明図である。It is explanatory drawing which shows a mode that the lower end of an element is arrange | equalized before and after changing display magnification. コンテンツ表示領域の一部にメニュー領域をオーバレイ表示させた携帯端末の例を示した図である。It is the figure which showed the example of the portable terminal which displayed the menu area as an overlay display in a part of content display area. 図4および図5とは異なる参照リストの例を示す図である。It is a figure which shows the example of the reference list different from FIG. 4 and FIG. 図22の参照リストを用いる場合のレイアウト変更部の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the layout change part in the case of using the reference list of FIG. 実施形態8の参照リスト作成部を示すブロック図である。FIG. 20 is a block diagram illustrating a reference list creation unit according to an eighth embodiment. 行頭禁則の文字の例と行末禁則の文字の例を示す図である。It is a figure which shows the example of the character of a line head prohibition character, and the example of the character of a line end prohibition. 横書きの文字列の例を示す図である。It is a figure which shows the example of the character string of horizontal writing. 文書画像の例を示す図である。It is a figure which shows the example of a document image. 図27の文書画像であって、行に分類した文書画像を示す図である。It is a figure which shows the document image classified into the line of FIG. 27. (a)は、2段組の横書きの文書の例、(b)は、2段組の縦書きの文書の例を示す図である。(A) is a diagram showing an example of a two-column horizontal writing document, and (b) is a diagram showing an example of a two-column vertical writing document. (a)〜(f)は、2つの行の行間距離を説明する図である。(A)-(f) is a figure explaining the distance between two lines. (a)は、行に分類した文書画像の例、(b)は、(a)をさらに行ブロックに分類した文書画像の例を示す図である。(A) is an example of a document image classified into rows, and (b) is a diagram illustrating an example of a document image into which (a) is further classified into row blocks. 行と行ブロックとに分類した文書画像の例を示す図である。It is a figure which shows the example of the document image classified into the line and the line block. レイアウト解析処理部の構成を示すブロック図である。It is a block diagram which shows the structure of a layout analysis process part. (a)は、行ブロックに分類した文書画像の例、(b)は、(a)をさらに段組に分類した文書画像の例、(c)は、(b)をさらにカラムに分類した文書画像の例を示す図である。(A) is an example of a document image classified into row blocks, (b) is an example of a document image into which (a) is further classified into columns, and (c) is a document in which (b) is further classified into columns. It is a figure which shows the example of an image. 2段組構成の文書画像の例を示す図である。It is a figure which shows the example of the document image of a two-column structure. 行、行ブロック、段(カラム)、及び段組に分類した文書画像の例を示す図である。It is a figure which shows the example of the document image classified into the line, the line block, the stage (column), and the column group. 行順序リストの例を示す図である。It is a figure which shows the example of a line order list. 行ブロック、カラム、及び段組についての情報を示す図である。It is a figure which shows the information about a row block, a column, and a column. 文書構造ツリーの構造の例を示す図である。It is a figure which shows the example of the structure of a document structure tree. 図33に示される段落解析処理部における改行判定処理の概要を示すイメージ図である。It is an image figure which shows the outline | summary of the line feed determination process in the paragraph analysis process part shown by FIG. 図33に示される段落解析処理部の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the paragraph analysis process part shown by FIG. 行IDバッファの更新処理の概要を示すイメージ図である。It is an image figure which shows the outline | summary of the update process of a row ID buffer. 初期化された文書構造ツリーの例を示す図である。It is a figure which shows the example of the initialized document structure tree. 更新された行順序リストの例を示す図である。It is a figure which shows the example of the updated line order list. 行順序リストに従って生成された文書構造ツリーの構造の例を示す図である。It is a figure which shows the example of the structure of the document structure tree produced | generated according to the line order list. 横書きの文書画像の一例を示す模式図である。It is a schematic diagram which shows an example of a horizontal writing document image. 変倍処理によってレイアウトを変更した場合にインデントの位置がずれてしまった様子を示す説明図である。It is explanatory drawing which shows a mode that the position of the indent shifted | deviated when the layout was changed by scaling process. 変倍処理によってレイアウトを変更した場合であってもインデントの位置が適切になっている様子を示す説明図である。It is explanatory drawing which shows a mode that the position of an indent is appropriate even if it is a case where a layout is changed by scaling process. 表示部の短辺方向を垂直方向とし、表示部の長辺方向を水平方向として文書画像を表示させた場合の携帯端末の外観構成を模式的に示した図である。It is the figure which showed typically the external appearance structure of the portable terminal at the time of displaying a document image by making the short side direction of a display part into a perpendicular direction, and making the long side direction of a display part into a horizontal direction.

〔実施の形態1〕
本発明の一実施形態について以下説明する。図1は、本実施形態に係る携帯端末10の構成を示す機能ブロック図である。図2は、本実施形態に係る携帯端末10の外観構成を示す模式図である。
[Embodiment 1]
An embodiment of the present invention will be described below. FIG. 1 is a functional block diagram showing the configuration of the mobile terminal 10 according to the present embodiment. FIG. 2 is a schematic diagram illustrating an external configuration of the mobile terminal 10 according to the present embodiment.

(携帯端末10の全体構成)
携帯端末(表示制御装置、表示装置)10は、図2に示すように、小型の表示部を備えたスマートフォンである。携帯端末10は、図1に示すように、制御部11、記憶部12、通信部13、タッチパネル14、アクセス部15を備えている。
(Overall configuration of mobile terminal 10)
As shown in FIG. 2, the mobile terminal (display control device, display device) 10 is a smartphone including a small display unit. As illustrated in FIG. 1, the mobile terminal 10 includes a control unit 11, a storage unit 12, a communication unit 13, a touch panel 14, and an access unit 15.

制御部11は、携帯端末10の各ハードウェアの動作を制御するブロックであり、例えば、CPU(Central Processing Unit)を備えるマイクロコンピュータやマイクロプロセッサによって実現される。制御部11は、記憶部12に記憶されている各種情報および各種制御を実施するためのプログラムを取り出して演算処理や判定処理を行い、これらの処理結果に基づいて携帯端末10の各ハードウェアに信号や情報を送って、各ハードウェアの動作を制御する。制御部11の詳細については後に述べる。   The control unit 11 is a block that controls the operation of each hardware of the mobile terminal 10, and is realized by, for example, a microcomputer or a microprocessor including a CPU (Central Processing Unit). The control unit 11 extracts various information stored in the storage unit 12 and a program for performing various controls, performs arithmetic processing and determination processing, and stores each processing unit in the hardware of the mobile terminal 10 based on the processing results. Sends signals and information to control the operation of each hardware. Details of the control unit 11 will be described later.

記憶部12は、制御部11が実行する各種アプリケーションプログラム、OS(Operating System)プログラム、制御プログラム、これらプログラムを実行するときに読み出す各種データ(設定値、テーブル等)を記憶する記憶領域である。記憶部12としては、従来から公知の種々の記憶手段、例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(登録商標)(Electrically EPROM)などを用いることができる。また、制御部11に取り扱われている各種データや処理中のデータは、記憶部12のワーキングメモリに一時的に記憶される。   The storage unit 12 is a storage area for storing various application programs executed by the control unit 11, an OS (Operating System) program, a control program, and various types of data (setting values, tables, etc.) read when the programs are executed. As the storage unit 12, various conventionally known storage means such as read only memory, random access memory, flash memory, EPROM (Erasable Programmable ROM), EEPROM (registered trademark) (Electrically EPROM) and the like can be used. . Various data handled by the control unit 11 and data being processed are temporarily stored in the working memory of the storage unit 12.

通信部13は、外部装置との間でデータ通信を行う通信インターフェイスである。本実施形態の通信部13は、USB(Universal Serial Bus)1.1またはUSB2.0の規格に基づいて、シリアル転送/パラレル転送、無線データ通信を行うようになっている。通信部13は、ユーザからの入力指示に従って、複合機、画像入力装置(スキャナ専用機)、またはサーバ装置との間で画像データの送受信を行う。   The communication unit 13 is a communication interface that performs data communication with an external device. The communication unit 13 of the present embodiment performs serial transfer / parallel transfer and wireless data communication based on the USB (Universal Serial Bus) 1.1 or USB 2.0 standard. The communication unit 13 transmits and receives image data to and from the multifunction device, the image input device (scanner dedicated device), or the server device in accordance with an input instruction from the user.

タッチパネル14は、画像を表示する表示部14aと、ユーザのタッチ操作に応じた入力信号を生成する入力部14bとが一体化されている装置である。タッチパネル14としては、周知のタッチパネルを用いることができる。つまり、表示部14aはLCD(Liquid Crystal Display)などで構成され、入力部14bは表示部14aと一体化された静電容量センサなどで構成される。   The touch panel 14 is an apparatus in which a display unit 14a that displays an image and an input unit 14b that generates an input signal corresponding to a user's touch operation are integrated. As the touch panel 14, a known touch panel can be used. That is, the display unit 14a is configured by an LCD (Liquid Crystal Display) or the like, and the input unit 14b is configured by a capacitance sensor or the like integrated with the display unit 14a.

ユーザがタッチパネル14に対してタッチ操作を行うと、タッチ操作に応じた入力指示が表示画像に反映されることになる。例えば、タップ操作が行われるとタップされたアイコンやファイルに応じた画像が表示されるようになっている。タッチ操作に応じた入力指示の具体例については後で詳述する。   When the user performs a touch operation on the touch panel 14, an input instruction corresponding to the touch operation is reflected in the display image. For example, when a tap operation is performed, an image corresponding to the tapped icon or file is displayed. A specific example of the input instruction corresponding to the touch operation will be described in detail later.

また、本実施形態では、図2に示すようにタッチパネル14(表示部14a)に文書画像が表示されるようになっている。ここで、表示部14aの表示領域全体のうち、文書画像を表示させるために確保されている表示領域をコンテンツ表示領域と称す(図2を参照)。コンテンツ表示領域は、表示領域全体を占めていてもよいし、表示領域全体のうちの一部であってもよい。図2は、コンテンツ表示領域が表示領域全体のうちの一部である形態を示したものであり、コンテンツ表示領域以外の領域が余白になっている。なお、表示部14aには、ツールバー等が表示されていてもよいし、スクロールバーが表示されていてもよい。或いは、図9に示すように、ユーザに選択させる機能が列挙されているメニュー領域が表示されてもよい。   In this embodiment, as shown in FIG. 2, the document image is displayed on the touch panel 14 (display unit 14a). Here, of the entire display area of the display unit 14a, a display area secured for displaying a document image is referred to as a content display area (see FIG. 2). The content display area may occupy the entire display area or may be a part of the entire display area. FIG. 2 shows a form in which the content display area is a part of the entire display area, and areas other than the content display area are blank. Note that a toolbar or the like may be displayed on the display unit 14a, or a scroll bar may be displayed. Alternatively, as shown in FIG. 9, a menu area in which functions to be selected by the user are listed may be displayed.

なお、ユーザの視認性からすれば、通常、コンテンツ表示領域と、それ以外の領域(メニュー領域など)とは、互いに重複しないように設定されることが望ましい。但し、メニュー領域については、必ずしも常時表示されている必要がないことから、ユーザにとってメニューが必要な場合のみ(ユーザのタッチ操作に応じてメニューを呼び出す信号が入力された場合)、図21に示す例のようにコンテンツ表示領域上にメニュー領域をオーバレイ表示するようになっていてもよい。つまり、図21の例では、メニュー領域を半透明表示とすることにより、コンテンツ表示領域のうちメニュー領域に重畳されている部分も視認可能とし、メニュー表示前のコンテンツも表示され続けるようにしている。あるいは、前述のようにメニューを呼び出す信号が入力された場合にのみ、図9に示す例のように、コンテンツ表示領域を変形して余白を拡大し、拡大された余白の一部にメニュー領域を一時的に設けるようにしても良い。また、図9の例において、メニュー領域の表示を終了する指示信号を入力した場合、メニュー領域を表示領域から除外し、コンテンツ表示領域を、メニュー領域を呼び出す前の形状(大きさ)になるように再度変形するように設定されていてもよい。   From the viewpoint of the user's visibility, it is usually desirable that the content display area and other areas (such as the menu area) are set so as not to overlap each other. However, since the menu area does not necessarily need to be displayed at all times, it is shown in FIG. 21 only when the user needs the menu (when a signal for calling the menu is input in response to the user's touch operation). As shown in the example, the menu area may be displayed in an overlay on the content display area. That is, in the example of FIG. 21, by making the menu area semi-transparent display, the portion of the content display area superimposed on the menu area can be visually recognized, and the content before the menu display is continuously displayed. . Alternatively, only when a signal for calling a menu is input as described above, as shown in the example of FIG. 9, the content display area is deformed to enlarge the margin, and the menu area is set to a part of the enlarged margin. You may make it provide temporarily. In the example of FIG. 9, when an instruction signal for terminating the display of the menu area is input, the menu area is excluded from the display area, and the content display area has a shape (size) before calling the menu area. It may be set to be deformed again.

アクセス部15は、携帯端末10に挿入されるリムーバブルメディアにアクセスし、当該リムーバブルメディアに対する情報の読み書きを行う装置である。   The access unit 15 is a device that accesses a removable medium inserted into the mobile terminal 10 and reads / writes information from / to the removable medium.

つぎに、制御部11について詳細に説明する。制御部11は、図1に示すように、少なくとも、レイアウト変更部111および表示制御部112を含む。   Next, the control unit 11 will be described in detail. As shown in FIG. 1, the control unit 11 includes at least a layout change unit 111 and a display control unit 112.

レイアウト変更部111は、ユーザに指定(選択)された文書ファイルの文書画像をリフロー形式で表示させるためにレイアウト変更処理を行うブロックである。つまり、レイアウト変更部111は、入力部14bからユーザのタッチ操作に応じた入力信号を受け付け、この入力信号に示される入力指示が文書ファイルを開く指示である場合(文書ファイルのアイコンをタップ操作したような場合)、当該文書ファイルを記憶部12から読み出してレイアウト変更処理を行うのである。   The layout change unit 111 is a block that performs layout change processing in order to display a document image of a document file designated (selected) by a user in a reflow format. That is, the layout changing unit 111 receives an input signal corresponding to the user's touch operation from the input unit 14b, and when the input instruction indicated by the input signal is an instruction to open the document file (the icon of the document file is tapped. In such a case, the document file is read from the storage unit 12 and the layout change process is performed.

レイアウト変更処理(再配置処理)は、本来はフィックス型である文書画像を、表示部14aのコンテンツ表示領域においてはリフロー形式で表示可能になるように、当該文書画像の各要素の配置を変更する処理を指す。具体的には、レイアウト変更処理は、コンテンツ表示領域においてリフロー形式で表示可能になるように当該文書画像の各要素の配置座標を求める処理を指す。   The layout change process (rearrangement process) changes the arrangement of each element of the document image so that the originally fixed document image can be displayed in the reflow format in the content display area of the display unit 14a. Refers to processing. Specifically, the layout change process refers to a process for obtaining the arrangement coordinates of each element of the document image so that it can be displayed in the reflow format in the content display area.

配置座標とは、文書画像全体(表示部にて表示されている最中の部分のみならず表示部からはみ出している部分も含む)のなかでの各要素(文字、図表)の位置を示した座標である。つまり、配置座標とは、文書画像全体のなかの所定位置を原点とした場合の各要素の座標を示したものである。   The arrangement coordinates indicate the position of each element (character, chart) in the entire document image (including not only the middle part displayed on the display part but also the part protruding from the display part). Coordinates. That is, the arrangement coordinates indicate the coordinates of each element when the origin is a predetermined position in the entire document image.

リフロー形式とは、表示部14aの水平方向および垂直方向のうちのいずれかの方向のみのスクロールで文書画像を表示させる形式である。すなわち、図8に示すように、水平方向および垂直方向のうち、スクロール可能な方向と異なる方向(図8では水平方向)については、文書画像の長さがコンテンツ表示領域の長さ以下になるように(文書画像の画素数がコンテンツ表示領域の画素数以下になるように)、レイアウト変更処理が行われるのである。   The reflow format is a format in which the document image is displayed by scrolling only in one of the horizontal direction and the vertical direction of the display unit 14a. That is, as shown in FIG. 8, in the horizontal direction and the vertical direction, the length of the document image is equal to or less than the length of the content display area in a direction different from the scrollable direction (horizontal direction in FIG. 8). In addition, the layout change process is performed (so that the number of pixels of the document image is equal to or less than the number of pixels of the content display area).

また、レイアウト変更部111は、文書画像の各要素(文字、表等)の並び順を示した参照リスト(図4)に基づいて、レイアウト変更処理を行うようになっている。この参照リストの内容、および、レイアウト変更処理の内容は、後に詳述する。   Further, the layout changing unit 111 performs a layout changing process based on a reference list (FIG. 4) indicating the arrangement order of each element (character, table, etc.) of the document image. The contents of this reference list and the contents of the layout change process will be described in detail later.

表示制御部112は、タッチパネル14の表示制御を行う。つまり、表示制御部112は、記憶部12に記憶されている各種アプリケーションまたはOS(Operating System)に基づいて各種画像をタッチパネル14に表示させる。   The display control unit 112 performs display control of the touch panel 14. In other words, the display control unit 112 displays various images on the touch panel 14 based on various applications or OS (Operating System) stored in the storage unit 12.

また、表示制御部112は、タッチパネル14の入力部14bから、ユーザのタッチ操作に応じた入力信号を受け付け、入力指示に応じた表示制御を行う。すなわち、表示制御部112は、文書ファイルを表示させる指示を示す入力信号を入力部14bから受け付けると(文書ファイルのアイコンをタップ操作したような場合)、当該文書ファイルの文書画像をタッチパネル14に表示させる。   Further, the display control unit 112 receives an input signal corresponding to a user's touch operation from the input unit 14b of the touch panel 14, and performs display control according to the input instruction. That is, when the display control unit 112 receives an input signal indicating an instruction to display a document file from the input unit 14b (when the user taps an icon of the document file), the display control unit 112 displays the document image of the document file on the touch panel 14. Let

また、本実施形態の表示制御部112は、レイアウト変更部111にて求められた配置座標に基づいて、文書画像の各要素(文字等)の描画座標(表示用座標)を求め、この描画座標に基づいて文書画像を表示部14aに表示させるようになっている。ここで、描画座標とは、文書画像の各要素と表示部14aのコンテンツ表示領域との位置関係を示す座標である(つまり、描画座標とは、図10の(b)に示すようにコンテンツ表示領域上の基準位置(左上隅部)を原点(0,0)とした平面座標上での各要素の座標値を示したものである)。表示制御部112における処理の詳細については後に詳述する。   In addition, the display control unit 112 according to the present embodiment obtains drawing coordinates (display coordinates) of each element (character or the like) of the document image based on the arrangement coordinates obtained by the layout changing unit 111, and the drawing coordinates. The document image is displayed on the display unit 14a based on the above. Here, the drawing coordinates are coordinates indicating the positional relationship between each element of the document image and the content display area of the display unit 14a (that is, the drawing coordinates are content display as shown in FIG. 10B). The coordinate value of each element on the plane coordinates with the reference position (upper left corner) on the area as the origin (0, 0) is shown. Details of the processing in the display control unit 112 will be described later.

なお、本実施形態は、図2に示すように、略長方形の表示部14aの長辺方向を表示部14aの垂直方向とし、表示部14aの短辺方向を表示部14aの水平方向として、左横書きの文書画像を表示部14aに表示する例を説明するものである(左横書の文書とは、各行の左側が先頭側になって右側が末尾側となる横書き文書を指す)。すなわち、本実施形態では、図2に示すように、表示中の左横書の文書画像における横方向(左右方向)と表示部14aの水平方向とが一致し、表示中の左横書の文書画像における縦方向(上下方向)と表示部14aの垂直方向とが一致する。そこで、本実施形態では、図2に示すように、短辺方向を水平方向として長辺方向を垂直方向とした略長方形の表示部14aに左横書の文書画像を表示させる場合において、当該左横書の文書画像の右側から左側に向けた方向を左方向とし、その逆方向を右方向とし、当該左横書きの文書画像の上側から下側に向けた方向を下方向とし、その逆方向を上方向とする(なお、図2に示す上下左右の各方向は、短辺方向を水平方向として長辺方向を垂直方向とした略長方形の表示部14aに縦書きの文書画像を表示させる場合において、当該縦書きの文書画像における上下左右の各方向とも一致することになる)。   In the present embodiment, as shown in FIG. 2, the long side direction of the substantially rectangular display unit 14a is the vertical direction of the display unit 14a, and the short side direction of the display unit 14a is the horizontal direction of the display unit 14a. An example in which a horizontally written document image is displayed on the display unit 14a will be described (a left horizontally written document refers to a horizontally written document in which the left side of each line is the leading side and the right side is the ending side). That is, in the present embodiment, as shown in FIG. 2, the horizontal direction (left-right direction) in the left horizontal document image being displayed matches the horizontal direction of the display unit 14a, and the left horizontal document being displayed is displayed. The vertical direction (vertical direction) in the image matches the vertical direction of the display unit 14a. Therefore, in the present embodiment, as shown in FIG. 2, when a left horizontal document image is displayed on a substantially rectangular display unit 14a in which the short side direction is the horizontal direction and the long side direction is the vertical direction, the left side is displayed. The direction from the right to the left of the horizontal document image is the left direction, the opposite direction is the right direction, the direction from the upper side to the lower side of the left horizontal document image is the lower direction, and the opposite direction is (In the case of displaying a vertically written document image on the substantially rectangular display unit 14a with the short side direction as the horizontal direction and the long side direction as the vertical direction) , The vertical and horizontal directions in the vertically written document image also coincide with each other).

また、本実施形態において、図4等に示される横幅は水平方向の長さを意味し、高さは垂直方向の長さを意味する。また、本実施形態において、前述した配置座標の原点(0,0)は、図10の(a)に示すように、横書文書画像全体のなかの左上隅部に設定され、前述した描画座標の原点(0,0)は、図10の(b)に示すように、表示部14aにおけるコンテンツ表示領域の左上隅部(基準位置)に設定される。   In the present embodiment, the horizontal width shown in FIG. 4 or the like means the length in the horizontal direction, and the height means the length in the vertical direction. In the present embodiment, the origin (0, 0) of the arrangement coordinates described above is set at the upper left corner of the entire horizontal document image as shown in FIG. The origin (0, 0) is set at the upper left corner (reference position) of the content display area in the display unit 14a, as shown in FIG.

(入力指示の具体例)
つぎに、タッチ操作に応じた入力指示の具体例を説明する。タッチパネル14に対して利用者がタッチ操作を行うと、タッチ操作に応じた入力信号が入力部14bから制御部11に伝達される。そして、制御部11の各部は、この入力信号から、タッチ点数(タッチ箇所の数)、タッチ座標等を導き、タッチ操作に応じた入力指示の内容を識別する。具体的には、以下の通りである。
(Specific examples of input instructions)
Next, a specific example of an input instruction according to a touch operation will be described. When the user performs a touch operation on the touch panel 14, an input signal corresponding to the touch operation is transmitted from the input unit 14b to the control unit 11. Then, each unit of the control unit 11 derives the number of touch points (number of touch points), touch coordinates, and the like from this input signal, and identifies the contents of the input instruction according to the touch operation. Specifically, it is as follows.

例えば、制御部11は、コンテンツ表示領域上にて1点のタッチを検出した場合、画像のスクロール指示(スクロール操作)の開始であると識別する。また、制御部11は、スクロール指示が開始されてから1点のタッチがコンテンツ表示領域上で検出され続けている間はスクロール指示が継続されていると識別し、コンテンツ表示領域上で検出されるタッチ点数が1点以外に変化した場合はスクロール指示が終了したと識別する。   For example, when detecting one touch on the content display area, the control unit 11 identifies the start of an image scroll instruction (scroll operation). Further, the control unit 11 identifies that the scroll instruction is continued while one point touch is continuously detected on the content display area after the scroll instruction is started, and is detected on the content display area. When the number of touch points has changed to other than one, it is identified that the scroll instruction has ended.

また、制御部11は、コンテンツ表示領域上にて2点以上の同時タッチを検出した場合、画像のズーム指示(ズーム操作)の開始であると識別する。また、制御部11は、ズーム指示が開始されてから、ズーム指示開始時に検出したタッチ点数と同じ点数のタッチがコンテンツ表示領域上で検出され続けている間はズーム指示が継続されていると識別し、コンテンツ表示領域上で検出されるタッチ点数が異なる点数に変化した場合はズーム指示が終了したと識別する。なお、2点タッチの場合、2点の間隔を広げる動きで画像拡大となり、2点の間隔を狭める動きで画像縮小となる。3点タッチの場合、3点を頂点とした三角形を広げる動きで画像拡大となり、三角形を狭める動きで画像縮小となる。   Further, when two or more simultaneous touches are detected on the content display area, the control unit 11 identifies that it is the start of an image zoom instruction (zoom operation). Further, the control unit 11 identifies that the zoom instruction is continued while the touch with the same number of touch points detected at the start of the zoom instruction is continuously detected on the content display area after the zoom instruction is started. When the number of touch points detected on the content display area changes to a different number, it is identified that the zoom instruction has ended. In the case of a two-point touch, the image is enlarged by a movement that increases the interval between the two points, and the image is reduced by a movement that reduces the interval between the two points. In the case of three-point touch, the image is enlarged by moving the triangle with the three points at the apex, and the image is reduced by moving the triangle.

また、スクロール指示が行われている最中にタッチの検出点数が2点以上に変わった場合、制御部11は、スクロール指示の終了とズーム指示の開始とを同時に識別するようになっていてもよい。同様に、ズーム指示が行われている最中にタッチの検出点数が1点に変わった場合、制御部11は、ズーム指示の終了とスクロール指示の開始とを同時に識別するようになっていてもよい。或いは、ズーム指示が行われている最中に、タッチ点数がズーム指示開始時のタッチの点数とは異なる2点以上の点数に変化した場合、制御部11は、新たに検出された点数を基準としたズーム操作を開始するようになっていてもよい。   In addition, when the number of touch detection points changes to 2 or more while the scroll instruction is being performed, the control unit 11 may simultaneously identify the end of the scroll instruction and the start of the zoom instruction. Good. Similarly, when the number of detected touch points is changed to 1 while the zoom instruction is being performed, the control unit 11 may simultaneously identify the end of the zoom instruction and the start of the scroll instruction. Good. Alternatively, when the number of touch points changes to two or more points different from the number of touch points at the start of the zoom instruction while the zoom instruction is being performed, the control unit 11 uses the newly detected point as a reference The zoom operation may be started.

(文書ファイルについて)
続いて、携帯端末10にて扱われる文書ファイル(文書画像のデータ)について説明する。文書ファイルは、CCD(Charge Coupled Device)センサ、またはCMOS(Complementary Metal-Oxide Semiconductor)センサ等の撮像手段が文書原稿を撮影して得られるデジタル画像をファイル化したものである。文書ファイルは、テキストデータを有しない撮影画像であり、例えばPDFファイルやTIFFファイルが挙げられる。
(About document files)
Next, a document file (document image data) handled by the mobile terminal 10 will be described. The document file is a digital image obtained by imaging a document document by an imaging unit such as a CCD (Charge Coupled Device) sensor or a CMOS (Complementary Metal-Oxide Semiconductor) sensor. The document file is a captured image that does not have text data, and examples thereof include a PDF file and a TIFF file.

携帯端末10は、アクセス部15を介してリムーバブルメディアから文書ファイルを取得して記憶部12に保存してもよいし、通信部13を介して複合機や画像入力装置から文書ファイルを受信し、記憶部12に保存してもよい。   The mobile terminal 10 may acquire the document file from the removable media via the access unit 15 and store it in the storage unit 12, or receive the document file from the multifunction device or the image input device via the communication unit 13, It may be stored in the storage unit 12.

なお、携帯端末10にて扱われる文書ファイルは、カラー画像データであってもよいし、白黒の画像データであってもよい。   Note that the document file handled by the mobile terminal 10 may be color image data or monochrome image data.

(参照リストについて)
つぎに、レイアウト変更部111によるレイアウト変更処理にて使用される参照リストについて図3Aおよび図4を参照して説明する。図3Aは、文字および図表から構成される文書画像(横書き文書)の一例を示したものであり、図4は、図3Aの文書画像に対応する参照リストの一例を示したものである。
(About reference list)
Next, a reference list used in layout change processing by the layout change unit 111 will be described with reference to FIGS. 3A and 4. FIG. 3A shows an example of a document image (horizontal writing document) composed of characters and charts, and FIG. 4 shows an example of a reference list corresponding to the document image of FIG. 3A.

参照リストは、文書画像を構成する要素(文字および図表)ごとに、夫々の要素の情報を示したリストである。   The reference list is a list showing information on each element (characters and charts) constituting the document image.

個々の要素に関する情報には、文書中における要素の並び順を示したリスト番号と、文書中における要素の範囲を示す範囲情報と、要素の種類(文字、図表)を示す要素種別と、要素が属する段落を特定する情報とが含まれる。   The information about each element includes a list number indicating the arrangement order of elements in the document, range information indicating the range of elements in the document, an element type indicating the element type (character, chart), and elements. Information specifying the paragraph to which it belongs.

図4の参照リストでは、リスト番号の小さい順(つまり要素の並び順)に各要素に関する情報が示されている。また、図4の参照リストでは、範囲情報として、各要素のみを含む矩形の左上位置のX座標およびY座標と、矩形の横幅および高さとを含む。矩形の幅および高さの代わりに、矩形の右下位置のX座標およびY座標であってもよい。   In the reference list of FIG. 4, information about each element is shown in ascending order of the list number (that is, the element arrangement order). In the reference list of FIG. 4, the range information includes the X and Y coordinates of the upper left position of the rectangle including only each element, and the horizontal width and height of the rectangle. Instead of the width and height of the rectangle, the X coordinate and Y coordinate of the lower right position of the rectangle may be used.

また、図4の参照リストでは、要素種別として、文字、図表(図または表)に加えて改行を持つ。この「改行」は、要素種別であるだけではなく、要素が属する段落を特定する情報としても機能することになる。つまり、リスト番号の順に各要素の情報を参照していく場合、改行が参照されてから次に改行が参照するまで(まだ一度も改行が参照されていない場合は参照リストの先頭から最初に改行が参照されるまで)の間に参照された文字ないし図表を同一の段落に属していると判定できる。たとえば、リスト番号7において最初に改行が参照されるため、リスト番号1から6が1つの段落(図3Aにおける段落R1)となり、次にリスト番号41において改行が参照されるため、リスト番号8から40が1つの段落(図3Aにおける段落R2)となる。同様にして、全ての文字および図表の属する段落を判別できる。   In addition, the reference list of FIG. 4 has line breaks as element types in addition to characters and charts (figure or table). This “new line” functions not only as an element type but also as information for specifying the paragraph to which the element belongs. In other words, when referring to the information of each element in the order of the list number, the line break is referenced until the next line break is referenced (if a line break has not been referenced yet, the line break starts from the beginning of the reference list. Can be determined to belong to the same paragraph. For example, since a new line is first referred to in list number 7, list numbers 1 to 6 become one paragraph (paragraph R1 in FIG. 3A), and then a new line is referred to in list number 41. 40 becomes one paragraph (paragraph R2 in FIG. 3A). Similarly, all the characters and paragraphs to which the chart belongs can be determined.

さらに、図3Aに示す文書画像のように同一段落内において文字列と文字列とに挟まれる図表が存在する場合、レイアウト変更を行うと、文字と図表との位置関係が変わり、可読性が低下するおそれがある。そこで、レイアウト変更前の文書画像において同一段落内において文字列と文字列とに挟まれる図表が存在する場合、この段落内において、レイアウト変更前の文字と図表との並び順に関係なく、レイアウト変更後には文字と図表とが別々に配置されるように、各文字および図表にリスト番号を割り振る。例えば、図4のリスト番号398の図表は、図3Aに示すように、段落R7に含まれており、リスト番号398の図表の後の4行にわたる文字列までが同一段落(段落R7)となるが、図4の参照リストでは、まず段落R7の先頭の文字から段落R7に含まれる文字列の末尾にあたるリスト番号397の文字までの順にリスト番号が割り振られ、図表には、リスト番号397の次のリスト番号398が割り振られる。   Further, when there is a chart sandwiched between character strings and character strings in the same paragraph as in the document image shown in FIG. 3A, if the layout is changed, the positional relationship between the characters and the chart changes, and the readability decreases. There is a fear. Therefore, when there is a diagram that is sandwiched between character strings and character strings in the same paragraph in the document image before layout change, in this paragraph, regardless of the arrangement order of characters and diagrams before layout change, after layout change Assigns a list number to each character and chart so that the letters and charts are arranged separately. For example, the chart of the list number 398 in FIG. 4 is included in the paragraph R7 as shown in FIG. 3A, and the character string extending over four lines after the chart of the list number 398 is the same paragraph (paragraph R7). However, in the reference list of FIG. 4, first, list numbers are allocated in the order from the first character of paragraph R7 to the character of list number 397 at the end of the character string included in paragraph R7. List number 398 is assigned.

但し、リスト番号の割り振り手法は、以上の図4の参照リストのような形態に限定されるものではない。例えば、同一段落内に文字列と図表とが共に含まれている場合、図22に示す参照リストのように、図表と文字との境界となる位置に「改行」の要素を挿入することにより、同一段落内での図表と文字との位置関係(順序)をレイアウト変更の前後で固定させるようになっていてもよい。なお、同一段落内に複数の図表が存在する場合、図表と図表との境界の位置にも「改行」の要素を挿入することで、複数の要素がスクロールの方向と直交した方向に並ぶことなく表示することができる。   However, the list number allocation method is not limited to the form of the reference list of FIG. For example, when both a character string and a chart are included in the same paragraph, by inserting a “new line” element at a position that becomes the boundary between the chart and the character, as in the reference list shown in FIG. The positional relationship (order) between the chart and characters in the same paragraph may be fixed before and after the layout change. If there are multiple charts in the same paragraph, insert a line break element at the boundary between the charts and charts so that the multiple elements do not line up in the direction perpendicular to the scrolling direction. Can be displayed.

また、図5に示す参照リストのように、要素ごとに、属する段落を識別する段落IDを記述してもよい。図5は、図4とは異なる参照リストの例を模式的に示した図である。この参照リストにおいては、リスト番号の順に各要素の情報を参照していく場合、段落IDが変化した際にその前後の要素間で段落が変更されたと判定できる。なお、同一段落内において文字列と文字列とに挟まれる図表が存在する場合、図5においては、この段落内において図表からなる小段落が含まれるように扱う。つまり、図3Bおよび図5に示すように、文字列および図表からなる段落は段落7になり、このうち、図表については段落7に属する小段落7−2として扱われる。なお、同一段落内に複数の図表が存在する場合、個々の図表をそれぞれ異なる小段落としても良い。   Further, as in the reference list shown in FIG. 5, a paragraph ID for identifying a paragraph to which the element belongs may be described for each element. FIG. 5 is a diagram schematically showing an example of a reference list different from FIG. In this reference list, when the information of each element is referred to in the order of the list number, when the paragraph ID changes, it can be determined that the paragraph has been changed between the preceding and subsequent elements. When there is a chart sandwiched between character strings in the same paragraph, in FIG. 5, the paragraph is handled so as to include a small paragraph composed of charts. That is, as shown in FIG. 3B and FIG. 5, a paragraph composed of a character string and a chart becomes paragraph 7, and among these, the chart is treated as a small paragraph 7-2 belonging to paragraph 7. When a plurality of charts exist in the same paragraph, each chart may be a different small paragraph.

また、本実施の形態では、記憶部12においては、単に文書ファイルが保存されているだけではなく、保存されている文書ファイルの文書画像に対応する参照リストも当該文書ファイルに紐付けされて保存されているものとする。   In the present embodiment, the storage unit 12 not only stores a document file, but also stores a reference list corresponding to the document image of the stored document file in association with the document file. It is assumed that

参照リストは、文書ファイルが生成される複合機やスキャナにおいて、当該文書ファイルから作成され、当該文書ファイルに紐付けされることになる。そして、互いに紐付けされた文書ファイルと参照リストとの組み合わせは、通信部13を介して携帯端末10に送信されたり、リムーバブルメディアを介して携帯端末10に入力される。   The reference list is created from the document file and linked to the document file in a multifunction peripheral or scanner that generates the document file. The combination of the document file and the reference list associated with each other is transmitted to the mobile terminal 10 via the communication unit 13 or input to the mobile terminal 10 via a removable medium.

但し、携帯端末10が参照リスト作成部を備えてもよく、この場合、携帯端末10は複合機やスキャナから文書ファイルのみを受信し、参照リスト作成部は、この文書ファイルを参照して参照リストを作成するようになっていてもよい。なお、参照リスト作成部については実施形態8にて説明する。   However, the mobile terminal 10 may include a reference list creation unit. In this case, the mobile terminal 10 receives only the document file from the multifunction peripheral or the scanner, and the reference list creation unit refers to the document file and refers to the reference list. You may come to create. The reference list creation unit will be described in the eighth embodiment.

(レイアウト変更部111について)
以下、レイアウト変更部111の処理について詳細に説明する。なお、本実施形態では、文字列の文字の配列方向が表示画面の水平方向と一致する横書き(左横書き)の文書画像に対して処理を行う場合を説明する。なお、横書き(左横書き)の文書画像では、一つの文字列に属する文字の並び順は左から右へ向かう順であり、複数の文字列の並び順は原則として上から下へ向かう順である。
(About the layout changing unit 111)
Hereinafter, the processing of the layout changing unit 111 will be described in detail. In the present embodiment, a case will be described in which processing is performed on a horizontally written (left horizontally written) document image in which the character arrangement direction of the character string matches the horizontal direction of the display screen. In a horizontally written (left horizontally written) document image, the order of characters belonging to one character string is the order from left to right, and the order of a plurality of character strings is in principle the order from top to bottom. .

すなわち、図8に示すように、水平方向および垂直方向のうち、スクロール可能な方向と直交する方向(図8では水平方向)については、文書画像の長さがコンテンツ表示領域の長さ以下になるように、レイアウト変更処理が行われるのである。   That is, as shown in FIG. 8, in the horizontal direction and the vertical direction, the length of the document image is equal to or less than the length of the content display area in the direction orthogonal to the scrollable direction (the horizontal direction in FIG. 8). In this way, layout change processing is performed.

図6は、図4の参照リストを用いる場合のレイアウト変更部111の処理手順を示すフローチャートである。レイアウト変更部111は、図4の参照リストを参照し、N個の各要素のうち並び順の小さい要素から順に注目要素として扱っていく。   FIG. 6 is a flowchart illustrating a processing procedure of the layout changing unit 111 when the reference list of FIG. 4 is used. The layout changing unit 111 refers to the reference list in FIG. 4 and treats the N elements as attention elements in order from the element with the smallest arrangement order.

レイアウト変更部111は、図4の参照リストに基づいて、注目要素の要素種別を判定する(S101)。そして、図6に示すように、レイアウト変更部111は、注目要素が文字または図表であると判断する場合(S101)、注目要素の1つ前の要素の要素種別を示す履歴要素種別と、注目要素の要素種別との比較を行う(S102)。なお、履歴要素種別は記憶部12に記憶されている。ここで、レイアウト変更部111は、履歴要素種別が文字または図表であり、かつ、注目要素の要素種別が履歴要素種別と異なる場合(S102にてNO)、段落変更処理(S103)、要素切り出し処理(S104)、要素変倍処理(S105)、配置処理(S106)、履歴要素種別更新処理(S107)を順に実行する。これに対し、レイアウト変更部111は、履歴要素種別が「改行」である場合、もしくは、履歴要素種別と注目要素の要素種別とが同一である場合(S102にてNO)、段落変更処理(S103)を実行せずに、要素切り出し処理(S104)、要素変倍処理(S105)、配置処理(S106)、履歴要素種別更新処理(S107)を順に実行する。また、レイアウト変更部111は、S101において注目要素が改行であると判断する場合、段落変更処理(S108)、履歴要素種別更新処理(S107)を順に実行する。レイアウト変更部111は、N個の全ての要素を順に注目要素として扱い、各注目要素に対して図6の処理を行う。なお、履歴要素種別は、参照リストの先頭(すなわちr=1)が参照される前に、「改行」に初期化されており、図6の履歴要素種別更新処理(S107)において、注目要素の要素種別を新たな値として更新する。   The layout changing unit 111 determines the element type of the element of interest based on the reference list in FIG. 4 (S101). Then, as shown in FIG. 6, when the layout changing unit 111 determines that the element of interest is a character or a chart (S101), the history element type indicating the element type of the element immediately before the element of interest, The element type is compared with the element type (S102). The history element type is stored in the storage unit 12. Here, when the history element type is a character or a chart and the element type of the element of interest is different from the history element type (NO in S102), the layout changing unit 111 performs a paragraph change process (S103), an element cut-out process (S104), element scaling processing (S105), placement processing (S106), history element type update processing (S107) are executed in order. In contrast, when the history element type is “line feed” or when the history element type and the element type of the element of interest are the same (NO in S102), the layout changing unit 111 changes the paragraph (S103) ), The element extraction process (S104), the element scaling process (S105), the arrangement process (S106), and the history element type update process (S107) are executed in order. If the layout changing unit 111 determines in S101 that the element of interest is a line break, the layout changing unit 111 sequentially executes a paragraph changing process (S108) and a history element type updating process (S107). The layout changing unit 111 treats all N elements as attention elements in order, and performs the process of FIG. 6 for each attention element. The history element type is initialized to “line feed” before the head of the reference list (ie, r = 1) is referred to, and the history element type is updated in the history element type update process (S107) of FIG. Update the element type as a new value.

以下、図6の要素切り出し処理、要素変倍処理、配置処理、段落変更処理の各々の処理内容を順に説明する。前述したレイアウト変更処理とは、要素切り出し処理、要素変倍処理、配置処理、段落変更処理からなるのである。   In the following, the process contents of the element cutout process, element scaling process, arrangement process, and paragraph change process of FIG. 6 will be described in order. The layout change process described above includes an element cutout process, an element scaling process, an arrangement process, and a paragraph change process.

図6の要素切り出し処理(S104)は、参照リストに示される注目要素の範囲に基づいて、文書画像のデータから注目要素の切り出し(抽出)を行う処理である。   The element cutout process (S104) in FIG. 6 is a process of cutting out (extracting) an element of interest from document image data based on the range of the element of interest indicated in the reference list.

図6の要素変倍処理(S105)は、切り出した注目要素を、現在指定されている表示倍率に応じて拡大もしくは縮小を行う処理である。たとえば、表示倍率が200%である場合、切り出された各要素の水平および垂直方向のサイズが2倍になるように拡大処理が実行される。表示倍率が50%となっている場合、切り出された各要素の水平および垂直方向のサイズが1/2倍になるように縮小処理が実行される。   The element scaling process (S105) in FIG. 6 is a process for enlarging or reducing the extracted element of interest according to the currently specified display magnification. For example, when the display magnification is 200%, the enlargement process is executed so that the horizontal and vertical sizes of each cut out element are doubled. When the display magnification is 50%, the reduction process is executed so that the horizontal and vertical sizes of each extracted element are halved.

但し、図表は、文字に比べてサイズが大きいため、携帯端末10(スマートフォン)のように表示部14aの画素数が少ない場合(高さおよび幅が小さい場合)、リフロー表示する際のスクロールの方向と直交する方向の長さがコンテンツ表示領域よりも長くなりがちである。このような場合、図表の長さ(スクロールの方向と直交する方向の長さ)をコンテンツ表示領域に収めるようにするための方法として、指定されている表示倍率と関係なく、図表の長さ(スクロールの方向と直交する方向の長さ)をコンテンツ表示領域の長さ(スクロールの方向と直交する方向の長さ)以下になるように縮小する。また、図表の長さがコンテンツ表示領域の長さよりも短い場合、指定されている表示倍率と関係なく、図表の長さがコンテンツ領域の長さを超えない程度に図表を拡大してもよい(表示倍率を指定値から変更する)。なお、以上の手法は、たとえば各要素の要素種別を参照リストから参照して「図表」である場合に表示倍率を変更することで実行できる。或いは、注目要素の切り取り時の横幅(スクロールの方向と直交する方向の長さ)がコンテンツ表示領域のスクロールの方向と直交する方向の長さに所定係数(たとえば0.5)を乗じたものよりも大きい場合に倍率を変更するようにすれば、図表のみならず非常に大きな文字などにも対応できる。   However, since the size of the chart is larger than that of characters, the scroll direction when reflow display is performed when the number of pixels of the display unit 14a is small (when the height and width are small) like the mobile terminal 10 (smart phone). Tends to be longer than the content display area. In such cases, the length of the chart (length in the direction orthogonal to the scroll direction) can be stored in the content display area, regardless of the specified display magnification ( The length in the direction orthogonal to the scroll direction) is reduced to be equal to or less than the length of the content display area (length in the direction orthogonal to the scroll direction). Further, when the length of the chart is shorter than the length of the content display area, the chart may be enlarged so that the length of the chart does not exceed the length of the content area regardless of the designated display magnification ( Change the display magnification from the specified value). The above method can be executed by changing the display magnification when, for example, the element type of each element is referred to from the reference list and is a “chart”. Alternatively, the horizontal width (length in the direction orthogonal to the scroll direction) at the time of cutting off the element of interest is obtained by multiplying the length in the direction orthogonal to the scroll direction in the content display area by a predetermined coefficient (for example, 0.5). If the magnification is changed when it is too large, not only diagrams but also very large characters can be handled.

つぎに、図6に示されている配置処理(S106)を説明する。変倍処理された注目要素の横幅をSW、縦の長さをSHとするとき、配置座標(Px,Py)を左上として要素の配置を行う場合、その右下座標は(Px+SW−1,Py+SH−1)となる。配置座標は、最初にPx=IndentX1,Py=0として初期化されている。   Next, the arrangement process (S106) shown in FIG. 6 will be described. When the element width is SW and the vertical length is SH and the element is arranged with the arrangement coordinate (Px, Py) as the upper left, the lower right coordinate is (Px + SW-1, Py + SH). -1). The arrangement coordinates are initially initialized as Px = IndentX1, Py = 0.

注目要素が下記の式(1)を満たす場合、スクロール方向と直交する方向においてコンテンツ領域をはみ出さずに注目要素を配置することができ、注目要素に対する配置座標を(Px,Py)として確定する。
Px+SW≦DW・・・・・・ 式(1)
ただし、DWは、コンテンツ表示領域におけるスクロールの方向と直交する方向の長さ(横書きの場合は横幅)の大きさを示す。
When the target element satisfies the following expression (1), the target element can be arranged without protruding the content area in the direction orthogonal to the scroll direction, and the arrangement coordinates for the target element are determined as (Px, Py). .
Px + SW ≤ DW ··· Equation (1)
However, DW indicates the size of the length (horizontal width in horizontal writing) in the direction orthogonal to the scroll direction in the content display area.

注目要素が式(1)を満たさないとき、コンテンツ表示領域をはみ出すとして、以下に説明する方法により行の折り返し処理を実行する(注目要素の属する行を、注目要素の直前の要素(並び順が注目要素の直前の要素)の属する行の下の行にする)。   When the element of interest does not satisfy Expression (1), the content display area is projected, and line wrapping processing is executed by the method described below (the line to which the element of interest belongs is the element immediately before the element of interest (the arrangement order is (The element immediately before the element of interest) is the line below the line to which the element belongs).

注目要素の直前の要素を含む行の下端座標をY=LineMaxYとするとき、注目要素の配置座標をPx=IndentX2、Py=LineMaxY+LineSpaceY2と更新した上で、式(1)を満たすか否か判定し、満たす場合は配置座標を(Px,Py)として確定する。   When the bottom coordinate of the line including the element immediately before the element of interest is Y = LineMaxY, the arrangement coordinates of the element of interest are updated as Px = IndentX2 and Py = LineMaxY + LineSpaceY2, and then it is determined whether or not Expression (1) is satisfied. If it is satisfied, the arrangement coordinates are determined as (Px, Py).

ただし、IndentX1、IndentX2は、インデントの大きさを示すゼロ以上の係数であり、正の値をとるとき、行の先頭文字が右側にシフトされた形で要素が配置される。IndentX1、IndentX2の値は、特に限定されるものではないが、IndentX1が段落の先頭位置を示す値に設定されるのに対し、IndentX2は段落の2行目以降の各行の先頭位置に適用される点で異なる。それゆえ、IndentX2は、IndentX1よりも小さい値が好ましく、ゼロであることが望ましいが、特にそれに限定するのでなく、たとえば双方ともゼロとして行頭のインデントを持たないレイアウトとしても構わない。LineSpaceY2は、行間距離の大きさを示す係数であり、値が大きくなるほど行間距離が大きくなる。LineSpaceY2の値は、特に限定されるものではないが、コンテンツ領域の縦の長さの5%というように表示部14aのサイズに応じて設定されてもよいし、SHに所定係数α(たとえばα=1.5)を乗じた値とすることで、注目要素を基準として行の高さのα倍を行間距離とすることができる。以上のようにすることにより、注目要素とその直前の要素とが水平方向に並ばないように配置座標を変更することができ、行を折り返すことができる。   However, IndentX1 and IndentX2 are zero or more coefficients indicating the size of the indent, and when taking a positive value, the elements are arranged in such a manner that the first character of the line is shifted to the right. The values of IndentX1 and IndentX2 are not particularly limited. IndentX1 is set to a value indicating the start position of the paragraph, whereas IndentX2 is applied to the start position of each line after the second line of the paragraph. It is different in point. Therefore, the value of IndentX2 is preferably smaller than that of IndentX1, and is desirably zero. However, the present invention is not particularly limited to this, and for example, both of them may be zero and do not have a head indent. LineSpaceY2 is a coefficient indicating the size of the inter-line distance, and the inter-line distance increases as the value increases. The value of LineSpaceY2 is not particularly limited, but may be set according to the size of the display unit 14a, such as 5% of the vertical length of the content area, or a predetermined coefficient α (for example, α) = 1.5), a line height can be set to α times the height of the line with the element of interest as a reference. By doing as described above, the arrangement coordinates can be changed so that the element of interest and the element immediately before it are not aligned in the horizontal direction, and the line can be folded.

注目要素の配置座標(Px,Py)が確定すると、注目要素の配置座標(Px,Py)、SWおよびSHを記憶部12に記憶させる。なお、変倍後の横幅および縦の長さの代わりに変倍率Rを記憶させても良い。   When the arrangement coordinates (Px, Py) of the element of interest are fixed, the arrangement coordinates (Px, Py) of the element of interest, SW and SH are stored in the storage unit 12. Note that the scaling factor R may be stored instead of the horizontal width and the vertical length after scaling.

注目要素の配置座標を記憶すると、次の注目要素の配置座標の初期値を(Px+SW+CharaSpaceX−1,Py)として更新する。但し、CharaSpaceXは文字同士の字間距離を示す所定係数である。CharaSpaceXの値は、特に限定されるものではなく、たとえばコンテンツ表示領域の横幅の1%というように表示部14aのサイズに応じて設定されてもよい。或いは、CharaSpaceXの値は、直前に参照された注目要素の横幅SWに所定係数β(たとえばβ=0.1)を乗じた値としてもよい。この場合、直前の注目要素の大きさに応じた字間距離を設定することができる。   When the arrangement coordinates of the element of interest are stored, the initial value of the arrangement coordinates of the next element of interest is updated as (Px + SW + CharaSpaceX-1, Py). However, CharaSpaceX is a predetermined coefficient indicating the distance between characters. The value of CharaSpaceX is not particularly limited, and may be set according to the size of the display unit 14a, for example, 1% of the horizontal width of the content display area. Alternatively, the value of CharaSpaceX may be a value obtained by multiplying the horizontal width SW of the element of interest referenced immediately before by a predetermined coefficient β (for example, β = 0.1). In this case, the inter-character distance can be set according to the size of the immediately preceding attention element.

つぎに、図6の段落変更処理(S103、S108)について説明する。段落変更処理では、注目要素の直前の要素が含まれる行の下端座標をY=LineMaxYとすると、注目要素の配置座標をPx=IndentX1,Py=LineMaxY+LineSpaceY1として確定する。   Next, the paragraph changing process (S103, S108) of FIG. 6 will be described. In the paragraph changing process, if the lower end coordinates of the line including the element immediately before the target element is Y = LineMaxY, the arrangement coordinates of the target element are determined as Px = IndentX1, Py = LineMaxY + LineSpaceY1.

なお、LineSpaceY1は、行間距離の大きさを示す係数であり、値が大きくなるほど行間距離が大きくなる。LineSpaceY1の値は、特に限定されず、LineSpaceY2と同様の方法で設定できる。但し、LineSpaceY1は、異なる段落間の行間距離を示すのに対し、LineSpaceY2は、同一の段落内における行間の距離を示す点で異なる。それゆえ、LineSpaceY1の値としては、LineSpaceY2より大きな値が設定される方が望ましい。   LineSpaceY1 is a coefficient indicating the size of the inter-line distance, and the inter-line distance increases as the value increases. The value of LineSpaceY1 is not particularly limited, and can be set in the same manner as LineSpaceY2. However, LineSpaceY1 indicates the distance between lines in different paragraphs, whereas LineSpaceY2 differs in that it indicates the distance between lines in the same paragraph. Therefore, it is desirable to set a larger value than LineSpaceY2 as the value of LineSpaceY1.

レイアウト変更部111は、注目要素に対して以上の処理を行って注目要素の配置座標を確定すると、履歴要素種別更新処理(S107)を行った上で、次の注目要素に対して以上の処理を繰り返す。   When the layout changing unit 111 performs the above process on the element of interest to determine the arrangement coordinates of the element of interest, the layout change unit 111 performs the history element type update process (S107) and then performs the above process on the next element of interest. repeat.

なお、図4の参照リストではなく、図22に示す参照リスト(同一段落内であっても文字要素と図表要素との境界に改行要素を挿入した参照リスト)を使用する場合、レイアウト変更部111は、図23のフローに示す手順で処理を実行する。ここで、図23の要素切り出し処理(S104)、要素変倍処理(S105)、配置処理(S106)、段落変更処理(S108)は、図6の素切り出し処理(S104)、要素変倍処理(S105)、配置処理(S106)、段落変更処理(S108)と同一であるため、その説明を省略する。すなわち、図22に示す参照リストを使用する場合の図23の処理フローにおいては、要素が変更される場合は必ず改行されるようになっているため、図6のS102,S103,S107が省略されることになる。   If the reference list shown in FIG. 22 (a reference list in which a line feed element is inserted at the boundary between a character element and a chart element) is used instead of the reference list shown in FIG. The process is executed according to the procedure shown in the flow of FIG. Here, the element cutout process (S104), the element scaling process (S105), the arrangement process (S106), and the paragraph change process (S108) in FIG. Since this is the same as S105), the placement process (S106), and the paragraph change process (S108), description thereof is omitted. That is, in the processing flow of FIG. 23 when the reference list shown in FIG. 22 is used, line breaks are always made when elements are changed, so S102, S103, and S107 of FIG. 6 are omitted. Will be.

つぎに、図4の参照リストではなく、図5の参照リストを用いる場合のレイアウト変更部111の処理について以下説明する。図7は、図5の参照リストを用いる場合のレイアウト変更部111の処理手順を示すフローチャートである。   Next, processing of the layout changing unit 111 when using the reference list of FIG. 5 instead of the reference list of FIG. 4 will be described below. FIG. 7 is a flowchart showing a processing procedure of the layout changing unit 111 when the reference list of FIG. 5 is used.

レイアウト変更部111は、図5の参照リストを参照し、N個の各要素のうち並び順の小さい要素から順に注目要素として扱っていく。そして、図7に示すように、レイアウト変更部111は、注目要素について、要素切り出し処理(S104)、要素変倍処理(S105)を順に実行する。図7の要素切り出し処理(S104)、要素変倍処理(S105)の内容は、図6の要素切り出し処理(S104)、要素変倍処理(S105)と同一であるため、その説明を省略する。続いて、レイアウト変更部111は、図5に示す参照リストに示されている段落IDを参照して、注目要素が、注目要素の直前の要素と同じ段落であるかどうかを判定する(S110)。   The layout changing unit 111 refers to the reference list in FIG. 5 and treats the elements as attention elements in order from the element with the smallest arrangement order among the N elements. Then, as illustrated in FIG. 7, the layout changing unit 111 sequentially performs an element cutout process (S104) and an element scaling process (S105) for the element of interest. The contents of the element cutout process (S104) and element scaling process (S105) in FIG. 7 are the same as the element cutout process (S104) and element scaling process (S105) in FIG. Subsequently, the layout changing unit 111 refers to the paragraph IDs shown in the reference list shown in FIG. 5 to determine whether the element of interest is the same paragraph as the element immediately before the element of interest (S110). .

注目要素が直前の要素と異なる段落である場合、すなわち判定処理が偽である場合(S110にてNO)、図7に示すように、段落変更処理(S108)、配置処理(S106)を順に実行する。なお、図7の段落変更処理(S108)、配置処理(S106)の内容は、図6の段落変更処理(S108)、配置処理(S106)と同一であるため、その説明を省略する。なお、注目要素が、直前の要素を含む段落内の、図表を含む小段落である場合は、直前の要素と異なる段落であるとみなすことで、文字列と図表との間、もしくは図表と図表との間を改行することができる。また、図示しないが、上記小段落が、複数の図表を含んでいる場合、上記小段落内の図表を参照するごとに段落変更処理を実行するようにしても良い(すなわち小段落内の図表を参照するときは、S110は常にNOに固定されるようにしても良い)。   If the element of interest is a paragraph different from the immediately preceding element, that is, if the determination process is false (NO in S110), as shown in FIG. 7, the paragraph change process (S108) and the arrangement process (S106) are executed in order. To do. The contents of the paragraph changing process (S108) and the arranging process (S106) in FIG. 7 are the same as the paragraph changing process (S108) and the arranging process (S106) in FIG. If the element of interest is a sub-paragraph including a chart within a paragraph including the immediately preceding element, it is assumed that it is a paragraph different from the immediately preceding element, so that it is between the character string and the chart or between the chart and the chart. Line breaks can be made between Although not shown, when the small paragraph includes a plurality of charts, the paragraph change process may be executed every time the chart in the small paragraph is referred to (that is, the chart in the small paragraph is displayed). When referencing, S110 may always be fixed to NO).

これに対し、注目要素が直前の要素と同じ段落である場合、すなわち判定処理が真である場合(S110にてYES)、段落変更処理(S108)をスキップして配置処理(S106)を行う。また、図示されていないが、注目要素のリスト番号が1の場合も(つまり最初の注目要素の場合)、段落変更処理(S108)をスキップして配置処理(S106)を行う。   On the other hand, when the element of interest is the same paragraph as the immediately preceding element, that is, when the determination process is true (YES in S110), the paragraph change process (S108) is skipped and the arrangement process (S106) is performed. Although not shown, when the list number of the element of interest is 1 (that is, in the case of the first element of interest), the paragraph changing process (S108) is skipped and the arrangement process (S106) is performed.

(表示制御部112について)
つぎに、表示制御部112の処理内容を説明する。表示制御部112は、文書画像を構成する要素ごとに、レイアウト変更部111にて求められた配置座標から、コンテンツ表示領域に対する位置関係を示した描画座標を算出する。具体的には、各要素の配置座標を(Px,Py)とするとき、描画座標(Ox,Oy)は以下の式(2)および式(3)から求めることができる。
Ox = Px + OffsetX ・・・・・・式(2)
Oy = Py + OffsetY ・・・・・・式(3)
OffsetX,OffsetYはオフセット値であり、全ての要素について同一の値を用いる。
(About the display control unit 112)
Next, processing contents of the display control unit 112 will be described. The display control unit 112 calculates drawing coordinates indicating the positional relationship with the content display area from the arrangement coordinates obtained by the layout changing unit 111 for each element constituting the document image. Specifically, when the arrangement coordinates of each element is (Px, Py), the drawing coordinates (Ox, Oy) can be obtained from the following expressions (2) and (3).
Ox = Px + OffsetX Expression (2)
Oy = Py + OffsetY (Equation 3)
OffsetX and OffsetY are offset values, and the same value is used for all elements.

ここで、文書画像が横書きの場合(文書の行方向と表示画面の水平方向とが一致する場合)、全ての要素において、OffsetXを0で固定し、OffsetYをスクロールの度に変更する。文書画像が縦書きの場合(文書の行方向と表示画面の垂直方向とが一致する場合)、OffsetYを0で固定し、OffsetXをスクロールの度に変更する。   Here, when the document image is horizontally written (when the line direction of the document coincides with the horizontal direction of the display screen), OffsetX is fixed to 0 and OffsetY is changed every time the scroll is performed. When the document image is vertically written (when the line direction of the document coincides with the vertical direction of the display screen), OffsetY is fixed at 0, and OffsetX is changed every time the scroll is performed.

図8は、描画座標に基づいて文書画像を表示する場合の表示例を示す。文書画像の先頭の要素について、配置座標のY座標値は0であるが(図10の(a))、描画座標のY座標値はOffsetYに変更される(図8)。また、配置座標が(0,−OffsetY)であった位置が描画座標では(0,0)になり、この位置がコンテンツ表示領域の原点となる。   FIG. 8 shows a display example when a document image is displayed based on the drawing coordinates. For the first element of the document image, the Y coordinate value of the arrangement coordinate is 0 ((a) in FIG. 10), but the Y coordinate value of the drawing coordinate is changed to OffsetY (FIG. 8). Further, the position where the arrangement coordinates are (0, −OffsetY) becomes (0, 0) in the drawing coordinates, and this position becomes the origin of the content display area.

図8に示すように、コンテンツ表示領域の横幅をDW、縦の長さをDHとし、コンテンツ表示領域の左上を原点(0,0)、右下を(DW−1,DH−1)とする。そして、各要素について、式(2)および式(3)で得られた描画座標(Ox,Oy)を左上とし、横幅SW、縦の長さSHで描画したときの矩形範囲の一部ないし全部がコンテンツ領域に重複する場合、当該要素に対する描画処理を行う(当該要素を表示させる)。   As shown in FIG. 8, the horizontal width of the content display area is DW, the vertical length is DH, the upper left of the content display area is the origin (0, 0), and the lower right is (DW-1, DH-1). . For each element, the rendering coordinates (Ox, Oy) obtained by Expression (2) and Expression (3) are set to the upper left, and part or all of the rectangular range when rendered with the horizontal width SW and the vertical length SH. Is overlapped in the content area, the drawing process for the element is performed (the element is displayed).

図9は、図8のように描画座標が求められた場合の携帯端末10のコンテンツ表示領域の様子を示した図である。図8の要素1(「こ」)や要素5(「で」)は、コンテンツ表示領域に重複しないため表示されない。これに対し、図8の要素2(「の」)や要素4(「落」)は、一部がコンテンツ表示領域と重複しており、重複箇所が表示される。また、図8の要素3(「第」)は、全体がコンテンツ領域と重複しているため表示される。   FIG. 9 is a diagram showing a state of the content display area of the mobile terminal 10 when the drawing coordinates are obtained as shown in FIG. Element 1 (“ko”) and element 5 (“de”) in FIG. 8 are not displayed because they do not overlap in the content display area. On the other hand, the element 2 (“no”) and the element 4 (“drop”) in FIG. 8 partially overlap the content display area, and the overlapped portion is displayed. Further, the element 3 (“No.”) in FIG. 8 is displayed because it entirely overlaps the content area.

また、表示制御部112は、入力部14bからの信号によってスクロール指示(スクロール操作)を検出すると、スクロール指示に応じてオフセット値を変更することにより、文書画像をスクロールさせるようになっている。以下では、この点を説明する。   Further, when the display control unit 112 detects a scroll instruction (scroll operation) based on a signal from the input unit 14b, the display control unit 112 changes the offset value according to the scroll instruction to scroll the document image. This point will be described below.

図10は、オフセット値を変化させるとコンテンツ表示領域に描画される範囲が変化する様子を説明するための図である。図10では、DW=1000,DH=1500としている。   FIG. 10 is a diagram for explaining how the range drawn in the content display area changes when the offset value is changed. In FIG. 10, DW = 1000 and DH = 1500.

図10の(a)は、レイアウト変更部111にて求められた配置座標に基づいて各要素が配置される文書画像を示す。図10の(b)は、図10の(a)に示す文書画像のうち、OffsetY=−200とした場合にコンテンツ表示領域に描画される範囲を示す。図10の(c)は、図10の(a)に示す文書画像のうち、OffsetY=−400とした場合にコンテンツ表示領域に描画される範囲を示す。なお、図10の(b)および(c)において、網掛けされている範囲がコンテンツ表示領域(画像が表示される領域)である。すなわち、OffsetYを0以下の値とする場合、OffsetYの値が減少するほど(絶対値が大きくなるほど)、文書画像のうちの表示範囲が下側にシフトし、OffsetYの値が増加するほど(絶対値が小さくなるほど)、文書画像のうちの表示範囲が上側にシフトする。それゆえ、スクロール指示(タッチ操作)に応じてオフセット値を調整すれば、スクロール指示に追随させて文書画像をスクロールさせることができる。   FIG. 10A shows a document image in which each element is arranged based on the arrangement coordinates obtained by the layout changing unit 111. FIG. 10B shows a range to be drawn in the content display area when OffsetY = −200 in the document image shown in FIG. FIG. 10C shows a range to be drawn in the content display area when OffsetY = −400 in the document image shown in FIG. In FIGS. 10B and 10C, the shaded range is a content display area (area where an image is displayed). That is, when OffsetY is set to a value of 0 or less, the display range of the document image shifts downward as the value of OffsetY decreases (the absolute value increases), and the value of OffsetY increases (absolutely). As the value decreases, the display range of the document image shifts upward. Therefore, if the offset value is adjusted according to the scroll instruction (touch operation), the document image can be scrolled in accordance with the scroll instruction.

つぎに、スクロール指示(スクロール操作)に応じてオフセット値を変更して画像をスクロールさせる処理を詳細に説明する。図11は、タッチ操作によるスクロール指示を説明するための図である。スクロール指示開始時(時刻t=0)におけるタッチ検出位置を点A0、時刻t=T1におけるタッチ検出位置を点Aとするとき、表示制御部112は、点A0から点Aへの変位量(距離)に応じてオフセット値を変更する。   Next, a process for scrolling an image by changing an offset value according to a scroll instruction (scroll operation) will be described in detail. FIG. 11 is a diagram for explaining a scroll instruction by a touch operation. When the touch detection position at the start of the scroll instruction (time t = 0) is the point A0 and the touch detection position at the time t = T1 is the point A, the display control unit 112 detects the displacement amount (distance) from the point A0 to the point A. ) To change the offset value.

例えば、横書きの文書画像の場合において、点A0のY座標をay0、点AのY座標をayとし、時刻tにおけるオフセット値をOffsetY(t)としたとき、表示制御部112は、時刻t=Tのオフセット値OffsetY(T)を、式(4)によって求める。
OffsetY(T)=OffsetY(0)−f(ay−ay0)・・・式(4)
関数f(x)は、xに正の相関を持ち、f(0)=0となる奇関数である。たとえばf(x)=xを挙げることができる。
For example, in the case of a horizontally written document image, when the Y coordinate of the point A0 is ay0, the Y coordinate of the point A is ay, and the offset value at time t is OffsetY (t), the display control unit 112 sets the time t = An offset value OffsetY (T) of T is obtained by Expression (4).
OffsetY (T) = OffsetY (0) −f (ay−ay0) (4)
The function f (x) is an odd function having a positive correlation with x and f (0) = 0. For example, f (x) = x can be mentioned.

図11の場合、ay<ay0であるため、OffsetY(T)>OffsetY(0)となり、上方向に文書画像がスクロールされる。   In the case of FIG. 11, since ay <ay0, OffsetY (T)> OffsetY (0), and the document image is scrolled upward.

同様にして、時刻t=T2におけるタッチ検出位置A’のY座標をay’とすると、ay’<ayであるため、点A’の方が、点Aよりも、点A0との間の垂直方向距離(Y座標の差)が大きく、OffsetY(T2)>OffsetY(T1)となり、より上方向にスクロールされることになる。なお、OffsetYの算出は、タッチ操作におけるY方向の変位量を用いて行われるが、タッチ操作におけるX方向の変位量や符号は無関係である。   Similarly, when the Y coordinate of the touch detection position A ′ at time t = T2 is ay ′, since ay ′ <ay, the point A ′ is more perpendicular to the point A0 than the point A. The directional distance (difference in the Y coordinate) is large, and OffsetY (T2)> OffsetY (T1) is satisfied, and scrolling is further upward. OffsetY is calculated using the amount of displacement in the Y direction in the touch operation, but the amount of displacement and the sign in the X direction in the touch operation are irrelevant.

さらに、時刻t=T3におけるタッチ検出位置A’’のY座標をay’’とすると、ay’’>ay0であることから、OffsetY(0)>OffsetY(T3)となり、タッチ開始位置から下側へ向けた方向に画像がスクロールされることになる。   Furthermore, if the Y coordinate of the touch detection position A ″ at time t = T3 is ay ″, since ay ″> ay0, OffsetY (0)> OffsetY (T3), and the lower side from the touch start position. The image is scrolled in the direction toward.

つまり、本実施形態によれば、各要素の配置座標(Px,Py)のうち、画像のスクロールの方向と平行な座標軸の座標値(横書きの場合はPy)に対してスクロールの量に応じたオフセット値(各要素に共通の値)を加算する加算処理を行うことによって各要素の描画座標(Ox,Oy)を求める形態である。この形態では、文書画像がスクロールされる場合、各要素において、スクロール方向と平行な座標軸の座標値に加算されるオフセット値(各要素に共通値)を変更するだけで描画座標(Ox,Oy)を更新できる。それゆえ、スクロールの度に、各要素のx座標値およびy座標値の両方を再演算していた従来構成よりも処理負荷を抑制できる効果を奏する。   That is, according to the present embodiment, among the arrangement coordinates (Px, Py) of each element, the coordinate value of the coordinate axis parallel to the scroll direction of the image (Py in the case of horizontal writing) corresponds to the scroll amount. This is a form in which drawing coordinates (Ox, Oy) of each element are obtained by performing an addition process of adding an offset value (a value common to each element). In this form, when the document image is scrolled, the drawing coordinates (Ox, Oy) are simply changed for each element by changing the offset value (common value for each element) added to the coordinate value of the coordinate axis parallel to the scroll direction. Can be updated. Therefore, there is an effect that the processing load can be suppressed as compared with the conventional configuration in which both the x-coordinate value and the y-coordinate value of each element are recalculated each time the scroll is performed.

〔実施形態2〕
実施形態2では、ユーザに文書ファイルが指定されてレイアウト変更部111および表示制御部112の処理によって文書画像がタッチパネル14に表示された後、ユーザがズーム指示(ズーム操作)を行った場合の表示倍率の変更処理について説明する。
[Embodiment 2]
In the second embodiment, after the document file is designated by the user and the document image is displayed on the touch panel 14 by the processing of the layout changing unit 111 and the display control unit 112, the display is performed when the user gives a zoom instruction (zoom operation). The magnification changing process will be described.

なお、実施形態1で説明したように、制御部11は、コンテンツ表示領域上にて2点以上の同時タッチを検出した場合、画像のズーム指示(ズーム操作)の開始であると識別するようになっている。また、制御部11は、ズーム指示が開始されてから、ズーム指示開始時に検出したタッチ点数と同じ点数のタッチがコンテンツ表示領域上で検出され続けている間はズーム指示が継続されていると識別し、コンテンツ表示領域上で検出されるタッチ点数が異なる点数に変化した場合はズーム指示が終了したと識別するようになっている。また、2点タッチの場合、2点の間隔を広げる動きで画像拡大となり、2点の間隔を狭める動きで画像縮小となる(3点タッチの場合、3点を頂点とした三角形を広げる動きで画像拡大となり、三角形を狭める動きで画像縮小となる)。   As described in the first embodiment, when detecting two or more simultaneous touches on the content display area, the control unit 11 identifies the start of an image zoom instruction (zoom operation). It has become. Further, the control unit 11 identifies that the zoom instruction is continued while the touch with the same number of touch points detected at the start of the zoom instruction is continuously detected on the content display area after the zoom instruction is started. When the number of touch points detected on the content display area changes to a different number, the zoom instruction is identified as being completed. In the case of two-point touch, the image is enlarged by a movement that widens the interval between the two points, and the image is reduced by a movement that narrows the interval between the two points (in the case of three-point touch, the movement that widens the triangle with the three points as vertices) The image is enlarged and the image is reduced by the movement of narrowing the triangle).

ズーム指示開始時(時刻t=0)におけるタッチ検出点数をNとし、第i番目(i=1,2,…,N)のタッチ検出位置を点Ai0とし、最終検出時(t=T)における第i番目のタッチ検出位置を点Aiとするとき(タッチ検出点数がN以外になるとズーム指示が終了する)、N個のタッチ検出位置の変位を用いたよく知られた方法により表示倍率を変更することができる。   The number of touch detection points at the start of zoom instruction (time t = 0) is N, the i-th (i = 1, 2,..., N) touch detection position is point Ai0, and the last detection time (t = T). When the i-th touch detection position is a point Ai (the zoom instruction ends when the number of touch detection points is other than N), the display magnification is changed by a well-known method using the displacement of the N touch detection positions. can do.

たとえば、N個のタッチ検出位置から得られる評価値を各時刻で算出し、時刻t=0における評価値と、時刻t=Tにおける評価値との差異により表示倍率を変更する方法が挙げられる。より具体的に説明すると、表示制御部112は、N個のタッチ位置の平均座標値に相当する点Mを求め、点Mと各点Aとの距離の総和を評価値Eとして、下記の式(5A)を用いて表示倍率を求めることができる。   For example, an evaluation value obtained from N touch detection positions is calculated at each time, and the display magnification is changed depending on the difference between the evaluation value at time t = 0 and the evaluation value at time t = T. More specifically, the display control unit 112 obtains the point M corresponding to the average coordinate value of the N touch positions, and uses the sum of the distances between the point M and each point A as the evaluation value E as The display magnification can be obtained using (5A).

Zoom(T)=Zoom(0)+g(E(T)−E(0))・・・式(5A)
Zoom(t)は時刻tにおける表示倍率を示し(Zoom(t)=1.0のとき表示倍率100%とする)、E(t)は時刻tにおける評価値を示すものとする。
関数g(x)は、xに正の相関を持ち、g(0)=0となる奇関数である。たとえば、g(x)=c・xが挙げられる。
cは、所定係数である。たとえば、cは、コンテンツ表示領域の水平方向の画素数と垂直方向の画素数のうち小さい方の逆数に16を乗じた数とすることができる。このようにcを設定する場合、評価値E(T)が、評価値E(0)よりも、コンテンツ表示領域の短辺の長さ(水平方向の長さ)の1/16だけ大きくなると表示倍率を100%増加させることができる。
Zoom (T) = Zoom (0) + g (E (T) −E (0)) (5A)
Zoom (t) indicates the display magnification at time t (when Zoom (t) = 1.0, the display magnification is 100%), and E (t) indicates the evaluation value at time t.
The function g (x) is an odd function having a positive correlation with x and g (0) = 0. An example is g (x) = c · x.
c is a predetermined coefficient. For example, c may be a number obtained by multiplying the reciprocal of the smaller one of the number of pixels in the horizontal direction and the number of pixels in the vertical direction by 16 in the content display area. When c is set in this way, the display is performed when the evaluation value E (T) is larger than the evaluation value E (0) by 1/16 of the length of the short side (the length in the horizontal direction) of the content display area. The magnification can be increased by 100%.

図12、図13および図14は、表示倍率の変更方法を説明するための図である。図12は、ズーム操作開始時(時刻t=0、タッチ検出点数N=2)のタッチ位置を示したものである。図13は、ズーム操作開始時よりタッチ位置を互いに遠ざけた場合(時刻t=T)の様子を示したものである。図13の状態の場合、時刻t=0の場合に比べて各タッチ位置と点Mとの距離が大きくなり、評価値が大きくなるために表示倍率が大きくなる。これに対し、図14は、ズーム操作開始時よりタッチ位置を互いに近づけた場合(時刻t=T’)の様子を示したものである。図14の状態の場合、時刻t=0の場合に比べて各タッチ位置と点Mとの距離が小さくなり、評価値が小さくなるために表示倍率が小さくなる。   12, 13 and 14 are diagrams for explaining a method of changing the display magnification. FIG. 12 shows the touch position at the start of the zoom operation (time t = 0, number of touch detection points N = 2). FIG. 13 shows a state when the touch positions are moved away from each other from the start of the zoom operation (time t = T). In the case of the state of FIG. 13, the distance between each touch position and the point M is larger than in the case of time t = 0, and the evaluation value is large, so that the display magnification is large. On the other hand, FIG. 14 shows a state where the touch positions are close to each other from the start of the zoom operation (time t = T ′). In the case of the state of FIG. 14, the distance between each touch position and the point M is smaller than in the case of time t = 0, and the evaluation value is small, so the display magnification is small.

以上のようにタッチパネル14に対するタッチ操作がズーム指示である場合、制御部11は、入力部14bからの入力信号に基づいて検出したタッチ点数、タッチ位置を参照して、式(5A)により表示倍率を求める。   As described above, when the touch operation on the touch panel 14 is a zoom instruction, the control unit 11 refers to the number of touch points and the touch position detected based on the input signal from the input unit 14b and displays the display magnification according to the equation (5A). Ask for.

このようにして表示倍率が求められると、レイアウト変更部111は、算出された表示倍率を用いてレイアウト変更処理を再度行って配置座標を求める。これは、表示倍率の変化に応じて各要素の配置座標も変える必要があるからである。すなわち、レイアウト変更部111は、図6、図7、または図23の処理を実行することになるが、算出された表示倍率は要素変倍処理(S105)において用いられる。続いて、表示制御部112は、レイアウト変更部111にて求められた配置座標から描画座標を求め、描画座標に基づいて文書画像を表示部14aに表示させる。このようにして、更新された表示倍率で文書画像が表示されるのである。   When the display magnification is obtained in this way, the layout changing unit 111 performs layout change processing again using the calculated display magnification to obtain the arrangement coordinates. This is because it is necessary to change the arrangement coordinates of each element in accordance with the change in display magnification. That is, the layout changing unit 111 executes the process of FIG. 6, 7, or 23, but the calculated display magnification is used in the element scaling process (S105). Subsequently, the display control unit 112 obtains drawing coordinates from the arrangement coordinates obtained by the layout changing unit 111, and causes the display unit 14a to display a document image based on the drawing coordinates. In this way, the document image is displayed at the updated display magnification.

以上示した本実施形態によれば、表示倍率を変更する場合(変倍処理を行う場合)、各要素の表示位置(描画座標)を決定する前に、文書画像全体のうちの各要素の座標(配置座標)を求めるようになっているため、インデントの位置がずれるといった事態(例えば図47の符号500)が起こり難いというメリットがある。   According to the present embodiment described above, when the display magnification is changed (when scaling processing is performed), before determining the display position (drawing coordinates) of each element, the coordinates of each element in the entire document image are determined. Since (placement coordinates) are obtained, there is an advantage that a situation (for example, reference numeral 500 in FIG. 47) that the position of the indent is shifted hardly occurs.

これに対し、先行技術によれば、表示倍率を変更する場合(変倍処理を行う場合)、先ず文書画像の中で表示される文字の位置を設定するようになっているため、図47の符号500に示すようにインデントの位置がずれるといった事態が発生し易い。例えば、表示倍率変更前において、図46に示す文書画像全体のうち、最上段を含まない範囲が表示されており、表示範囲の先頭位置(最上段の左隅)に符号650の「文」という文字が配されている場合を想定する。先行技術によれば、この場合に表示倍率を変更すると、先ず、表示倍率変更前に表示範囲の先頭位置に配されていた文字(符号650)の表示位置を決定するようになっている。具体的には、表示倍率変更前に表示範囲の先頭位置に配されていた文字を、表示倍率変更後も表示範囲の先頭位置に配置する。そして、符号650の文字の位置を基準として、符号650の文字の前後の各文字の配置が順次決定されていく。それゆえ、本来は各段落のインデントの位置が図48のようになるべきところ、先行技術によれば図47の符号500のようにインデントの位置がずれるといった事態が起こり得る。   On the other hand, according to the prior art, when the display magnification is changed (when scaling processing is performed), first, the position of the character displayed in the document image is set. As shown by the reference numeral 500, the indentation position is likely to be shifted. For example, before changing the display magnification, a range that does not include the uppermost portion of the entire document image shown in FIG. 46 is displayed, and the character “sentence” denoted by reference numeral 650 is displayed at the top position of the display range (the upper left corner). Is assumed. According to the prior art, when the display magnification is changed in this case, first, the display position of the character (reference numeral 650) arranged at the head position of the display range before the display magnification change is determined. Specifically, the character arranged at the head position of the display range before changing the display magnification is placed at the head position of the display range after changing the display magnification. Then, with reference to the position of the character 650, the arrangement of characters before and after the character 650 is sequentially determined. Therefore, the indentation position of each paragraph should originally be as shown in FIG. 48. However, according to the prior art, the indentation position may be shifted as indicated by reference numeral 500 in FIG.

〔実施形態3〕
ズーム指示により表示倍率を変更した場合、この変更に応じてオフセット値を調整しなければ、表示倍率変更前に表示されていた要素が表示倍率変更後には表示部14aからはみ出してしまい、表示倍率変更前に表示部14aからはみ出していた要素が表示倍率変更後には表示部14aに表示される場合がある。この場合、ユーザからすれば、文書画像全体のうち、意図せぬ範囲が突然表示されることになるという問題が生じる。
[Embodiment 3]
When the display magnification is changed according to the zoom instruction, if the offset value is not adjusted in accordance with this change, the elements displayed before the display magnification change will protrude from the display unit 14a after the display magnification change, and the display magnification change will occur. An element that has previously protruded from the display unit 14a may be displayed on the display unit 14a after the display magnification is changed. In this case, there is a problem that an unintended range of the entire document image is suddenly displayed for the user.

この問題を、図15を用いてより詳細に説明する。図15は、ズーム指示により拡大表示させる場合(表示倍率を高くする場合)、表示倍率の変更の前後でオフセット値を一定とした場合の描画座標と、コンテンツ表示領域に描画されている範囲とを示した図である。図15の(a)は、拡大前(表示倍率変更前)の描画座標および描画範囲であり、図15の(b)は、拡大後(表示倍率変更後)の描画座標および描画範囲である。コンテンツ領域の横幅はDW=1000,コンテンツ領域の縦の長さはDH=1500であり、拡大前および拡大後のいずれもOffsetY=−1500である。なお、図15において網掛け部分がコンテンツ表示領域である。図15に示す例では、拡大前では、図15の(a)に示すように、第2章の第3段落の先頭がコンテンツ表示領域の左上に位置している。オフセット値をそのままにして拡大処理を行うと、図15の(b)に示すように、拡大前にコンテンツ表示領域に含まれていた範囲が全く含まれない状態になる。   This problem will be described in more detail with reference to FIG. FIG. 15 shows the drawing coordinates when the offset value is constant before and after the change of the display magnification and the range drawn in the content display area when the display is enlarged according to the zoom instruction (when the display magnification is increased). FIG. FIG. 15A shows the drawing coordinates and drawing range before enlargement (before changing the display magnification), and FIG. 15B shows the drawing coordinates and drawing range after enlargement (after changing the display magnification). The horizontal width of the content area is DW = 1000, the vertical length of the content area is DH = 1500, and OffsetY = −1500 for both before and after enlargement. In FIG. 15, the shaded portion is the content display area. In the example shown in FIG. 15, before the enlargement, as shown in (a) of FIG. 15, the top of the third paragraph of Chapter 2 is located at the upper left of the content display area. When the enlargement process is performed with the offset value as it is, the range included in the content display area before the enlargement is not included as shown in FIG.

そこで、本実施形態では、表示制御部112は、ズーム指示が入力された場合、ユーザに注目されている要素をコンテンツ表示領域に残しつつ拡大または縮小できるようにオフセット値を調整する。以下では、ズーム指示がなされたときのオフセット値の調整手法を述べる。   Therefore, in the present embodiment, when a zoom instruction is input, the display control unit 112 adjusts the offset value so that the element being noticed by the user can be enlarged or reduced while remaining in the content display area. Hereinafter, a method for adjusting an offset value when a zoom instruction is given will be described.

タッチパネル14を用いてズーム指示を入力する場合、ユーザは、自身が注目している部分を中心としてタッチ操作を行う傾向にある。そのため、ズーム操作時における複数のタッチ位置の平均座標値に対応する地点から最も近い位置にある要素を、ユーザが注目している要素とみなすことができる。それゆえ、前記の平均座標値の位置からの距離が最も近い要素を選択し、この要素が拡大縮小後も表示されるようにオフセット値を調整すればよいと考えることができる。   When inputting a zoom instruction using the touch panel 14, the user tends to perform a touch operation centering on a portion that the user is paying attention to. Therefore, the element that is closest to the point corresponding to the average coordinate value of the plurality of touch positions during the zoom operation can be regarded as the element that the user is paying attention to. Therefore, it can be considered that an element having the closest distance from the position of the average coordinate value is selected and the offset value is adjusted so that this element is displayed even after the enlargement / reduction.

しかし、単純な距離を算出する場合、次に示す不具合が生じることもある。段落最終行は前後の行よりも短くなることが多いが、ユーザが段落最終行に注目していて前記の平均座標値の位置が段落最終行の余白箇所に位置することになる場合、その行末の要素よりも前後の行に含まれる要素の方が前記の平均座標値の位置から近くなることがあり、ユーザが実際に注目している要素が選択されにくくなる。   However, when calculating a simple distance, the following problems may occur. The last line of a paragraph is often shorter than the preceding and following lines, but if the user is paying attention to the last line of the paragraph and the position of the average coordinate value is located at the margin of the last line of the paragraph, the end of the line The elements included in the preceding and following lines may be closer to the position of the average coordinate value than the element of, so that it is difficult to select the element that the user is actually paying attention to.

これに対し、ズーム指示開始時にコンテンツ表示領域に表示されている各要素について、式(5B)に示す重み付きユークリッド距離を算出することで、行の方向(縦書き、横書き)に適した距離を得ることができるようになり、前記の不具合が抑制される。   On the other hand, by calculating the weighted Euclidean distance shown in Expression (5B) for each element displayed in the content display area at the start of the zoom instruction, a distance suitable for the row direction (vertical writing, horizontal writing) is obtained. It becomes possible to obtain the above-mentioned problems.

Dist(i)=kx×{gx−mx(i)}+ky×{gy−my(i)}
・・・・・・式(5B)
式(5B)において、(gx,gy)は、時刻t=0(ズーム指示開始時)に検出された複数点のタッチ位置の平均座標値である(例えば、図12の点Mの座標値である)。式(5B)において、(mx(i),my(i))は、図16に示すように、参照リストにおけるi番目の要素が時刻t=0においてコンテンツ表示領域上に描画された際の当該要素の外接矩形の中心座標である。
式(5B)において、kxおよびkyは正の所定係数である。たとえば、図18のように、円の中心点P0と、円周上の各点Pi(i=1,2,…,8)とを設定し、点Pi毎に、中心点P0とのユークリッド距離(Dist(i))を算出する場合を想定する。この場合においてkx=kyとすると、Dist(i)は単純なユークリッド距離(もしくはそれに定数を乗じた値)となり、いずれの点Piについても、Dist(i)は同じ値となる。また、kx>kyとすると、垂直方向よりも水平方向の距離(中心点P0との座標値の差分の2乗値)に対する重みが大きくなるため、水平方向の距離がゼロとなる点P1および点P5は最もDist(i)が小さく、水平方向の距離が大きい点PiほどDist(i)が大きくなり、垂直方向の距離がゼロとなる点P3および点P7でDist(i)が最大となる。一方、kx<kyのとき、垂直方向よりも水平方向の距離に対する重みが小さくなるため、点P3および点P7は最もDist(i)が小さく、垂直方向の距離が大きい点PiほどDist(i)が大きくなり、点P1および点P5でDist(i)が最大となる。
Dist (i) = kx × {gx−mx (i)} 2 + ky × {gy−my (i)} 2
・ ・ ・ ・ ・ ・ Formula (5B)
In Expression (5B), (gx, gy) is an average coordinate value of a plurality of touch positions detected at time t = 0 (at the start of zoom instruction) (for example, the coordinate value of the point M in FIG. 12). is there). In the equation (5B), (mx (i), my (i)) is obtained when the i-th element in the reference list is drawn on the content display area at time t = 0 as shown in FIG. The center coordinates of the bounding rectangle of the element.
In Expression (5B), kx and ky are positive predetermined coefficients. For example, as shown in FIG. 18, the center point P0 of the circle and the points Pi (i = 1, 2,..., 8) on the circumference are set, and the Euclidean distance from the center point P0 for each point Pi. Assume that (Dist (i)) is calculated. In this case, when kx = ky, Dist (i) is a simple Euclidean distance (or a value obtained by multiplying it by a constant), and Dist (i) has the same value for any point Pi. Further, when kx> ky, the weight for the horizontal distance (the square value of the difference in coordinate value with respect to the center point P0) is larger than that in the vertical direction. P5 has the smallest Dist (i), and the point Pi having the largest horizontal distance has a larger Dist (i), and Dist (i) is the largest at the points P3 and P7 where the vertical distance is zero. On the other hand, when kx <ky, the weight for the distance in the horizontal direction is smaller than that in the vertical direction. Therefore, the point P3 and the point P7 have the smallest Dist (i) and the point Pi having the largest distance in the vertical direction Dist (i). Increases, and Dist (i) is maximized at points P1 and P5.

式(5B)を用いて各要素のDist(i)を求める際、表示制御部112は、文書画像が横書きである場合はkx≦ky(たとえばkx=1,ky=4)とし、文書画像が縦書きである場合kx≧ky(たとえばkx=4,ky=1)と設定する。   When obtaining Dist (i) of each element using Expression (5B), the display control unit 112 sets kx ≦ ky (for example, kx = 1, ky = 4) when the document image is horizontal writing, and the document image In the case of vertical writing, kx ≧ ky (for example, kx = 4, ky = 1) is set.

これにより、横書きの場合においては、タッチ位置の左または右に行が存在すれば、前記行に含まれる要素は、前記行と垂直方向に並ぶ異なる行に含まれる要素よりも、Dist(i)が小さくなりやすくなる。また、縦書きの場合においては、タッチ位置の上または下に行が存在すれば、前記行に含まれる要素は、前記行と水平方向に並ぶ異なる行に含まれる要素よりも、Dist(i)が小さくなりやすくなる。   Accordingly, in the case of horizontal writing, if there is a line to the left or right of the touch position, the element included in the line is more distant than the elements included in different lines arranged in a direction perpendicular to the line. Tends to be smaller. Also, in the case of vertical writing, if there is a line above or below the touch position, the element included in the line is more distant than the elements included in different lines aligned with the line in the horizontal direction. Tends to be smaller.

なお、Dist(i)が最小値をとるような要素が複数存在する場合、所定のルールに従って、最も近い要素を1つに決定しても良い。最も近い要素を選択するための所定のルールとして、たとえば当該複数の要素のうち、対応する参照リストのリスト番号が最も近い要素、すなわち最も早く参照される要素としても良いし、対応するリスト番号の順に並べた場合に中央に位置する要素としても良い。   When there are a plurality of elements such that Dist (i) has a minimum value, the closest element may be determined as one according to a predetermined rule. As a predetermined rule for selecting the closest element, for example, among the plurality of elements, the element with the closest reference list number, that is, the element referred to earliest may be used. It is good also as an element located in the center when arranging in order.

したがって、段落最終行の余白のような箇所が複数点のタッチ位置の平均座標値の位置になった場合、平均座標値に対応する位置が最終行の末尾の要素から多少離れた位置であれば末尾の要素が選択され、平均座標値に対応する位置が最終行の末尾の要素から大きく離れた位置であれば前後の行の要素が選択されるようになる。それゆえ、段落最終行の余白のような箇所が複数点のタッチ位置の平均座標値になった場合であっても、ユーザが実際に注目している要素が選択されにくくなるという不具合を抑制できる。   Therefore, if a location such as the margin of the last line of a paragraph is the position of the average coordinate value of multiple touch positions, if the position corresponding to the average coordinate value is slightly away from the last element of the last line The last element is selected, and if the position corresponding to the average coordinate value is far away from the last element of the last line, the elements on the previous and next lines are selected. Therefore, even when a part such as a margin in the last line of the paragraph becomes an average coordinate value of a plurality of touch positions, it is possible to suppress a problem that it is difficult to select an element that the user is actually paying attention to. .

以上のようにして、表示制御部112は、複数点のタッチ位置の平均座標値の位置から最も近い第j番目の要素を選択した後、第j番目の要素の時刻tにおける配置座標を(Pxj(t),Pyj(t))とすると、時刻t=Tにおけるオフセット値を、式(6)を用いて求める。   As described above, the display control unit 112 selects the jth element closest to the position of the average coordinate value of the touch positions of the plurality of points, and then determines the arrangement coordinate of the jth element at time t (Pxj (T), Pyj (t)), an offset value at time t = T is obtained using equation (6).

OffsetX(T)=OffsetX(0)
OffsetY(T)=OffsetY(0)+Pyj(0)−Pyj(T)
・・・・・・式(6)
OffsetX(t)は、時刻tにおけるX成分のオフセット値を示し、OffsetY(t)は、時刻tにおけるY成分のオフセット値を示す。なお、式(6)は、横書きの文書画像用のものであり、X成分のオフセット値は調整されず(0で一定)、Y成分のオフセット値が調整される。
OffsetX (T) = OffsetX (0)
OffsetY (T) = OffsetY (0) + Pyj (0) −Pyj (T)
・ ・ ・ ・ ・ ・ Formula (6)
OffsetX (t) indicates the offset value of the X component at time t, and OffsetY (t) indicates the offset value of the Y component at time t. Expression (6) is for a horizontally written document image, and the offset value of the X component is not adjusted (constant at 0), and the offset value of the Y component is adjusted.

以上の通り、表示制御部112は、ズーム指示を入力した場合、式(5B)を用いて各要素のDist(i)を求めて、最もDist(i)の小さい要素を選択し、この要素の配置座標を用いて式(6)からオフセット値を求めるようになっている。   As described above, when the zoom instruction is input, the display control unit 112 obtains Dist (i) of each element using Expression (5B), selects the element having the smallest Dist (i), and selects the element of this element. An offset value is obtained from Expression (6) using the arrangement coordinates.

これにより、ズーム後の第j番目の要素のY座標値(Pyj(T)+OffsetY(T))を、ズーム前の第j番目の要素のY座標値(Pyj(0)+OffsetY(0))と等しくすることができるため、ズーム指示により表示倍率が変更されても、変更の前後で同じY座標値で第j番目の要素をタッチパネル14に表示させることができる。   Thereby, the Y coordinate value (Pyj (T) + OffsetY (T)) of the jth element after zooming is changed to the Y coordinate value (Pyj (0) + OffsetY (0)) of the jth element before zooming. ), The jth element can be displayed on the touch panel 14 with the same Y coordinate value before and after the change even if the display magnification is changed by a zoom instruction.

〔実施形態4〕
実施形態3の式(6)によれば、選択された第j番目の要素(以下要素jと称す)のズーム前の描画座標のY座標値とズーム後の描画座標のY座標値との差をΔYとすると、ΔY=0になる。しかし、ΔY=0になるようにオフセット値を調整する必要はなく、ΔYが所定範囲に収まっていればよい。
[Embodiment 4]
According to Expression (6) of Embodiment 3, the difference between the Y coordinate value of the drawing coordinates before zooming and the Y coordinate value of the drawing coordinates after zooming of the selected j-th element (hereinafter referred to as element j) If ΔY is ΔY, then ΔY = 0. However, it is not necessary to adjust the offset value so that ΔY = 0, and ΔY only needs to be within a predetermined range.

ここで、所定範囲は、要素jの表示倍率変更前の高さをSH1、要素jの表示倍率変更後の高さをSH2とするとき、−|SH1−SH2|以上かつ|SH1−SH2|以下に設定される。所定範囲をこのように設定することにより、表示倍率を変更する前後で要素jの下端を揃えるようにオフセット値を調整したり(図20参照)、表示倍率を変更する前後で要素jの上端を揃えるようにオフセット値を調整し(図19参照)、或いは表示倍率を変更する前後でスクロールの方向において要素jの中心を揃えるようにオフセット値を調整できる(このとき、表示倍率を変更する前後で、スクロールの方向と直交する方向における要素jの位置の違いは考慮しないものとする。)。   Here, when the height of the element j before the change of the display magnification is SH1 and the height of the element j after the change of the display magnification is SH2, the predetermined range is − | SH1−SH2 | or more and | SH1−SH2 | Set to By setting the predetermined range in this way, the offset value is adjusted so as to align the lower end of the element j before and after changing the display magnification (see FIG. 20), or the upper end of the element j is changed before and after changing the display magnification. The offset value can be adjusted so as to be aligned (see FIG. 19), or the offset value can be adjusted so that the center of the element j is aligned in the scroll direction before and after changing the display magnification (at this time, before and after changing the display magnification. The difference in the position of the element j in the direction orthogonal to the scroll direction is not considered.)

なお、要素jの上端を揃えるためには式(6)を用いてオフセット値を調整すればよく、要素jの下端を揃えるためには以下に示す式(7)を用いてオフセット値を調整すればよい。   In order to align the upper end of element j, the offset value may be adjusted using equation (6). To align the lower end of element j, the offset value should be adjusted using equation (7) shown below. That's fine.

OffsetX(T)=OffsetX(0)
OffsetY(T)=OffsetY(0)+(Pyj(0)+SH1)−(Pyj(T)+SH2)・・・・・・式(7)
もちろん、表示倍率変更前後で要素jの上端、下端、またはスクロールの方向の中心を揃えるようにオフセット値を調整する必要はなく、所定範囲内に収まるようになっていればよい。
OffsetX (T) = OffsetX (0)
OffsetY (T) = OffsetY (0) + (Pyj (0) + SH1) − (Pyj (T) + SH2) (7)
Of course, it is not necessary to adjust the offset value so as to align the upper end, the lower end, or the center of the scroll direction of the element j before and after the display magnification change, and it is sufficient that the offset value falls within a predetermined range.

〔実施形態5〕
また、実施形態3では、表示制御部112は、式(5B)によって求めたDist(i)に基づいて、複数点のタッチ位置の平均座標から最も近い要素を選択するようになっているが、常にDist(i)に基づいて要素を選択するとなると、複数のタッチ位置の平均座標が文字を囲む最小矩形内に入っているにも拘わらず、隣接する文字の方が近いとみなされることもまれにある。
[Embodiment 5]
In the third embodiment, the display control unit 112 selects the closest element from the average coordinates of the touch positions of a plurality of points based on Dist (i) obtained by the equation (5B). When an element is always selected based on Dist (i), it is rare that an adjacent character is considered closer even though the average coordinates of a plurality of touch positions are within the smallest rectangle that encloses the character. It is in.

図17は、英単語「Will」を構成する各アルファベットがそれぞれ要素として認識されており、レイアウト変更部111によるレイアウト変更処理によって各要素が順に再配置された後の様子を示している。図17において、平均座標は、要素91(Wの文字)を囲む最小矩形内に含まれている一方で、要素91の中心座標よりも、要素92(iの文字)の中心座標の方が近くなっている。それゆえ、表示制御部112は、複数のタッチ位置の平均座標から最も近い要素を要素92と判定する可能性がある。   FIG. 17 shows a state after each alphabet constituting the English word “Will” is recognized as an element and each element is rearranged in order by the layout changing process by the layout changing unit 111. In FIG. 17, the average coordinates are included in the minimum rectangle surrounding the element 91 (W character), but the center coordinates of the element 92 (i character) are closer than the center coordinates of the element 91. It has become. Therefore, the display control unit 112 may determine the element closest to the average coordinates of the plurality of touch positions as the element 92.

このことを抑制するために、表示制御部112は、文字を囲む最小矩形内に平均座標(gx,gy)が位置している場合、ユークリッド距離(Dist(i))は関係なく、その文字を平均座標から最も近い要素として選択するようになっていてもよい。   In order to suppress this, when the average coordinates (gx, gy) are located within the minimum rectangle surrounding the character, the display control unit 112 selects the character regardless of the Euclidean distance (Dist (i)). You may select as an element nearest from an average coordinate.

〔実施形態6〕
また、携帯端末10は、文書を撮影して文書画像を生成する撮影装置を備えていてもよい。この場合、携帯端末10は、画像を入力する画像入力装置としても機能することになる。
[Embodiment 6]
Further, the mobile terminal 10 may include a photographing device that photographs a document and generates a document image. In this case, the mobile terminal 10 also functions as an image input device that inputs an image.

そして、携帯端末10において、撮影装置から得られた文書画像に基づいて参照リストを生成し、この参照リストおよび文書画像を用いて配置座標および描画座標を求め、これら座標を用いてリフロー表示を行う。   Then, in the mobile terminal 10, a reference list is generated based on the document image obtained from the photographing apparatus, the arrangement coordinates and the drawing coordinates are obtained using the reference list and the document image, and reflow display is performed using these coordinates. .

ここで、表示制御部112は、リフロー表示される文書画像を閲覧したユーザに対して、可読性の適否を示す適否判定結果を入力することを促すガイド画像を表示部14aに表示させてもよい。ここで、表示制御部112は、「適」を示す判定結果をユーザが入力部14bを介して入力した場合、文書画像データや参照リストを記憶部12に保存し、「不適」を示す判定結果をユーザが入力部14bを介して入力した場合、表示処理を中断して文書画像データや参照リストを消去して、処理を再実行してもよい(撮影、参照リスト生成、リフロー表示を再実行する)。これにより、撮像に失敗した場合の手間を減らすことができる。   Here, the display control unit 112 may cause the display unit 14a to display a guide image that prompts the user who browsed the document image to be reflow-displayed to input a suitability determination result indicating suitability of readability. Here, when the user inputs the determination result indicating “appropriate” via the input unit 14b, the display control unit 112 stores the document image data and the reference list in the storage unit 12, and determines the determination result indicating “inappropriate”. When the user inputs via the input unit 14b, the display process may be interrupted, the document image data and the reference list may be deleted, and the process may be re-executed (photographing, reference list generation, and reflow display are re-executed) To do). Thereby, it is possible to reduce time and labor when imaging fails.

また、同じ文書画像データに対してリフロー表示を再度行いたい場合は、一度取得した文書画像データおよび参照リストを記憶部12に保存しておくことで参照リストの生成処理を省略することができる。   When reflow display is desired to be performed again on the same document image data, the reference list generation process can be omitted by storing the document image data and the reference list once acquired in the storage unit 12.

〔実施形態7〕
以上にて述べた各実施形態では、横書きの文書画像を例にして説明しているが、縦書きの文書画像に対しても勿論本発明の実施形態を適用可能である。
[Embodiment 7]
In each of the embodiments described above, a horizontally written document image has been described as an example. However, the embodiment of the present invention is naturally applicable to a vertically written document image.

但し、本実施形態において、横書き文書画像では、左上を原点とし、左から右方向をx軸(表示部の水平方向)の正方向、上から下方向をy軸(表示部の垂直方向)の正方向として配置座標や描画座標を設定しているが、縦書き文書画像では、右上を原点とし、右から左方向をx軸(表示部の水平方向)の正方向、上から下方向をy軸(表示部の垂直方向)の正方向として配置座標や描画座標を設定することになる。   However, in this embodiment, in a horizontally written document image, the upper left is the origin, the left to right direction is the positive direction of the x axis (horizontal direction of the display unit), and the upper direction is the y axis (vertical direction of the display unit). Placement coordinates and drawing coordinates are set as the positive direction, but in vertically written document images, the upper right is the origin, the right to left direction is the positive direction of the x axis (horizontal direction of the display unit), and the upper to lower direction is y The arrangement coordinates and drawing coordinates are set as the positive direction of the axis (vertical direction of the display unit).

それゆえ、縦書きの場合、以上にて述べた式(1)を下記の式(1)’に置き換えて使用することになる。具体的には、S106の配置処理において、配置座標(Px,Py)を右上として要素の配置を行う場合、その左下座標は(Px+SW−1,Py+SH−1)となる。配置座標は、最初にPx=0、Py=IndentY1として初期化される。そして、注目要素が下記の式(1)’を満たす場合、スクロール方向(水平方向)と直交する方向においてコンテンツ領域をはみ出さずに注目要素を配置することができ、注目要素に対する配置座標を(Px,Py)として確定する。
Py+SH≦DH ・・・・・・ 式(1)’
また、縦書きの場合、以上にて述べた式(4)を下記の式(4)’に置き換えて使用することになる。具体的には、スクロール指示開始時(時刻t=0)のタッチ検出位置を点A0、時刻t=T1におけるタッチ検出位置を点Aとし、点A0のX座標をax0、点AのX座標をaxとし、時刻tにおけるオフセット値をOffsetX(t)とするとき、表示制御部112は、時刻t=Tのオフセット値OffsetX(T)を、式(4)’によって求める。
OffsetX(T)=OffsetX(0)−f(ax−ax0)・・・式(4)’
また、縦書きの場合、以上にて述べた式(6)を下記の式(6)’に置き換えて使用する。
OffsetX(T)=OffsetX(0)+Pxj(0)−Pxj(T)
OffsetY(T)=OffsetY(0)・・・・・・式(6)’
さらに、縦書きの場合、以上にて述べた式(7)を下記の式(7)’に置き換えて使用する。
OffsetX(T)=OffsetX(0)+(Pxj(0)+SW1)−(Pxj(T)+SW2)
OffsetY(T)=OffsetY(0)
・・・・・・式(7)’
但し、要素jの表示倍率変更前の横幅をSW1、要素jの表示倍率変更後の横幅をSW2としている。
Therefore, in the case of vertical writing, the expression (1) described above is replaced with the following expression (1) ′ and used. Specifically, in the arrangement process of S106, when the elements are arranged with the arrangement coordinates (Px, Py) as the upper right, the lower left coordinates are (Px + SW-1, Py + SH-1). The arrangement coordinates are first initialized as Px = 0 and Py = IndentY1. When the target element satisfies the following formula (1) ′, the target element can be arranged without protruding the content area in the direction orthogonal to the scroll direction (horizontal direction), and the arrangement coordinates for the target element are ( Px, Py).
Py + SH ≦ DH Expression (1) ′
In the case of vertical writing, equation (4) described above is used by replacing it with the following equation (4) ′. Specifically, the touch detection position at the start of the scroll instruction (time t = 0) is point A0, the touch detection position at time t = T1 is point A, the X coordinate of point A0 is ax0, and the X coordinate of point A is When ax is set and the offset value at time t is OffsetX (t), the display control unit 112 obtains the offset value OffsetX (T) at time t = T by Expression (4) ′.
OffsetX (T) = OffsetX (0) −f (ax−ax0) Equation (4) ′
In the case of vertical writing, equation (6) described above is used by replacing it with the following equation (6) ′.
OffsetX (T) = OffsetX (0) + Pxj (0) −Pxj (T)
OffsetY (T) = OffsetY (0)... Equation (6) ′
Further, in the case of vertical writing, equation (7) described above is used by replacing it with the following equation (7) ′.
OffsetX (T) = OffsetX (0) + (Pxj (0) + SW1) − (Pxj (T) + SW2)
OffsetY (T) = OffsetY (0)
・ ・ ・ ・ ・ ・ Formula (7) '
However, the horizontal width of the element j before changing the display magnification is SW1, and the horizontal width of the element j after changing the display magnification is SW2.

〔実施形態8〕
実施形態8は、携帯端末10の制御部11が参照リスト作成部を備える形態である。参照リスト作成部は、複合機やスキャナから受信した文書ファイルの文書画像に基づいて、当該文書画像に対応する参照リスト(例えば図4)を作成するブロックである。
[Embodiment 8]
In the eighth embodiment, the control unit 11 of the mobile terminal 10 includes a reference list creation unit. The reference list creation unit is a block that creates a reference list (for example, FIG. 4) corresponding to a document image based on the document image of the document file received from the multifunction peripheral or the scanner.

なお、参照リスト作成部による参照リストの作成方法であるが、文書画像に基づいて図4、図5または図22のリストを作成できる手法であれば、いかなる手法でも構わないが、本実施形態では、本願出願人による先行出願である特願2014−018751号の実施の形態1にて述べられている手法を利用する。以下、特願2014−018751号の実施の形態1にて述べられている手法を詳細に説明する。   Although the reference list creation unit uses the reference list creation method, any method may be used as long as it can create the list of FIG. 4, FIG. 5, or FIG. 22 based on the document image. The technique described in the first embodiment of Japanese Patent Application No. 2014-018751 which is a prior application by the present applicant is used. Hereinafter, the technique described in Embodiment 1 of Japanese Patent Application No. 2014-018751 will be described in detail.

図24は、参照リスト作成部22の構成を示すブロック図である。参照リスト作成部22は、携帯端末10の制御部11に設けられている(図1では図示せず)。参照リスト作成部22は、複合機、スキャナ等から携帯端末10が複合機、スキャナ等の外部装置から受信した文書画像を入力し、この文書画像に基づいて、この文書画像に対応する参照リストを作成するブロックである。   FIG. 24 is a block diagram illustrating a configuration of the reference list creation unit 22. The reference list creation unit 22 is provided in the control unit 11 of the mobile terminal 10 (not shown in FIG. 1). The reference list creation unit 22 inputs a document image received by the portable terminal 10 from an external device such as a multifunction device or a scanner from a multifunction device, a scanner, or the like, and creates a reference list corresponding to the document image based on the document image. This is the block to be created.

参照リスト作成部22は、行解析処理部31と、行ブロック解析処理部34と、レイアウト解析処理部35と、リスト生成部36とを備える。以下では、文書を構成する個々の文字、図表等を纏めて要素と呼ぶ。   The reference list creation unit 22 includes a row analysis processing unit 31, a row block analysis processing unit 34, a layout analysis processing unit 35, and a list generation unit 36. Hereinafter, individual characters, diagrams, and the like constituting the document are collectively referred to as elements.

行解析処理部31は、入力された文書画像から各要素を抽出して、文字から構成される文字列の行と、図表から成る図表行とに分類する。更に、文書の横書き、縦書きといった記述方向を示す文書第1方向を解析する。   The line analysis processing unit 31 extracts each element from the input document image and classifies it into a character string line composed of characters and a chart line composed of diagrams. Further, the first document direction indicating the writing direction such as horizontal writing or vertical writing of the document is analyzed.

行ブロック解析処理部34は、行解析処理部31で抽出された行を、少なくとも1つ以上有する行ブロックに統合する処理を行う。   The row block analysis processing unit 34 performs processing for integrating the rows extracted by the row analysis processing unit 31 into row blocks having at least one or more rows.

レイアウト解析処理部35は、行ブロック解析処理部34で分類された行ブロック同士の位置関係から、段組構成を解析して文書全体の行の順序付けを行い、行の前後関係から改行位置を検出することで、文書を1つ以上の段落に分類し、段落毎に行の情報を格納した文書構造ツリーを生成する。詳細は後述する。文書構造ツリーの各段落は、文字列の行の順序の情報と、図表の順序の情報をそれぞれ分けて格納することで、図表の配置を段落内で修正できるようにする。   The layout analysis processing unit 35 analyzes the column structure from the positional relationship between the row blocks classified by the line block analysis processing unit 34, orders the lines of the entire document, and detects the line feed position from the line context. As a result, the document is classified into one or more paragraphs, and a document structure tree storing line information for each paragraph is generated. Details will be described later. Each paragraph of the document structure tree stores the information on the order of the character string lines and the information on the order of the chart separately, so that the arrangement of the chart can be corrected in the paragraph.

リスト生成部36は、レイアウト解析処理部35で生成された文書構造ツリーに従って、入力文書画像の文字、図、表の各要素を順序通り参照するための命令と、段落の開始及び終了を宣言するための命令とを示した参照リストを生成する。参照リストのフォーマットは特に固定されておらず、例えばCSV(Comma-Separated Values)形式のテキストデータとして生成したものをファイル出力してもよい。   The list generation unit 36 declares an instruction for referring to the elements of the input document image in order according to the document structure tree generated by the layout analysis processing unit 35 and the start and end of the paragraph. A reference list indicating the instructions for generating is generated. The format of the reference list is not particularly fixed. For example, a text list generated as CSV (Comma-Separated Values) text data may be output as a file.

以下、参照リスト作成部22の各処理部について詳述する。   Hereinafter, each processing unit of the reference list creation unit 22 will be described in detail.

[1.行解析処理部]
<1−1.行解析処理部の構成>
行解析処理部31は、入力された文書画像データ(入力文書画像)から各要素画像を抽出し、文字(文字画像)から成る行(文字列行)と、図(図画像)又は表(表画像)から成る行(図表行)とに分類する。行解析処理部31は、文字列抽出処理部32及び図表抽出処理部33を備えて構成される。行解析処理部31は、更に、文書の横書き又は縦書きといった記述方向を示す文書第1方向を解析する。
[1. Line analysis processing section]
<1-1. Configuration of line analysis processing section>
The line analysis processing unit 31 extracts each element image from the input document image data (input document image), a line (character string line) composed of characters (character images), and a diagram (graphic image) or table (table). Into lines (chart lines) consisting of images. The line analysis processing unit 31 includes a character string extraction processing unit 32 and a chart extraction processing unit 33. The line analysis processing unit 31 further analyzes a document first direction indicating a description direction such as horizontal writing or vertical writing of the document.

<1−2.文字列抽出処理部>
文字列抽出処理部32は、入力画像データから個々の文字を検出し切り出し処理を行うと共に、文字が複数並べられて構成される文字列を抽出する処理を行う。個々の文字の検出手段は多数提案されており、例えば、特許文献2(特許第5153857号)では、文書画像中の文字構成要素の領域、及び文字からなる文字列領域を検出する方法が提案されている。
<1-2. Character string extraction processing section>
The character string extraction processing unit 32 detects individual characters from the input image data, performs a cutout process, and performs a process of extracting a character string formed by arranging a plurality of characters. A number of means for detecting individual characters have been proposed. For example, Patent Document 2 (Japanese Patent No. 5153857) proposes a method for detecting a character component region and a character string region made up of characters in a document image. ing.

特許文献2に記載の方法では、文書画像から前景画素を検出し、前景画素から特に文字を構成していると思われる画素の集合を囲む最小外接矩形を文字構成要素として抽出する。更に、上下左右の各方向における近隣の各文字構成要素の矩形同士の距離から文字列として連続する文字構成要素の関係にあるかを判定し、その連続する矩形の連続数から、文字列領域を特定する。このとき、左右方向における連続数が上下方向における連続数を上回る場合は横書きの文字列領域として、上下方向における連続数が左右方向における連続数を上回る場合は縦書きの文字列領域として、文字列の持つ方向(文字列の方向、記述方向)を同時に取得する。   In the method described in Patent Document 2, foreground pixels are detected from a document image, and a minimum circumscribed rectangle surrounding a set of pixels that are considered to constitute a character from the foreground pixels is extracted as a character component. Further, it is determined whether there is a relationship between consecutive character components as a character string from the distance between rectangles of adjacent character components in each of the upper, lower, left, and right directions, and the character string region is determined from the number of consecutive rectangles. Identify. At this time, if the continuous number in the left-right direction exceeds the continuous number in the vertical direction, the character string area is written horizontally.If the continuous number in the vertical direction exceeds the continuous number in the left-right direction, the character string is written as the vertical character string area. The direction (character string direction, description direction) of is simultaneously acquired.

本実施の形態では、一例として、特許文献2に記載の方法を利用して文字及び文字列を抽出するものとする。なお、文字及び文字列の抽出方法は、特許文献2に記載の方法に限らずほかの方法を用いることができる。例えば、光学式文字読取装置(Optical Character Recognition;以下OCR)で個々の文字や、文字列を検出してもよい。   In the present embodiment, as an example, characters and character strings are extracted using the method described in Patent Document 2. The method for extracting characters and character strings is not limited to the method described in Patent Document 2, and other methods can be used. For example, an individual character or a character string may be detected by an optical character reader (hereinafter referred to as OCR).

<1−3.図表抽出処理部>
図表抽出処理部33は、入力画像データから図(図領域)及び表(表領域)を検出し、切り出し処理を行うものである。図領域の検出手段は多数提案されており、例えば、特許文献3(特開2009−194740号)で挙げられる方法により図領域を特定することができる。特許文献3に記載の方法では、入力された画像の所定領域毎に画素値の出現頻度(即ち、ヒストグラム)を求めた場合に、図領域の一つである写真領域上の各画素では濃度変化が広範囲に及ぶヒストグラムが得られることを利用して、ヒストグラムのエントロピー(平均情報量)を算出し、エントロピーが高い領域を抽出することで精度よく写真領域を抽出することが可能となる。
<1-3. Chart Extraction Processing Unit>
The chart extraction processing unit 33 detects a figure (figure area) and a table (table area) from the input image data, and performs cutout processing. Many figure region detection means have been proposed. For example, the figure region can be specified by the method described in Patent Document 3 (Japanese Patent Laid-Open No. 2009-194740). In the method described in Patent Document 3, when the appearance frequency (that is, histogram) of the pixel value is obtained for each predetermined area of the input image, the density change occurs in each pixel on the photographic area which is one of the figure areas. It is possible to accurately extract a photographic region by calculating the entropy (average amount of information) of the histogram by using the fact that a histogram covering a wide range is obtained, and extracting a region having a high entropy.

また、表領域の検出手段も多数提案されており、本実施の形態では既知の方法により表領域を検出する。例えば、特許文献2では、文書画像データからラインとなる可能性のある候補画素を抽出し、前記候補画素が水平方向もしくは垂直方向に所定画素数以上連続する場合に前記連続する候補画素の集合をラインとして抽出し、前記抽出された水平方向及び垂直方向のラインの位置関係から、各ラインが表を構成する罫線であるか単一のラインであるかを判定し、同一の表を構成するラインの集合について、それら全てを囲む最小外接矩形を表領域として抽出する方法を挙げている。この方法を用いることができる。   Many table area detection means have been proposed. In the present embodiment, a table area is detected by a known method. For example, in Patent Document 2, candidate pixels that are likely to be lines are extracted from document image data, and when the candidate pixels are continuous in a horizontal direction or a vertical direction by a predetermined number of pixels, the set of consecutive candidate pixels is obtained. Lines that are extracted as lines, and from the positional relationship between the extracted horizontal and vertical lines, it is determined whether each line is a ruled line or a single line that constitutes a table, and lines that constitute the same table The method of extracting the minimum circumscribed rectangle surrounding all of them as a table area is given. This method can be used.

なお、文字列抽出処理部32で抽出した文字が、図表抽出処理部33で抽出した図又は表として抽出した範囲と重複する場合、該抽出した文字をキャンセルする。特に、抽出された表には文字が含まれる可能性が高いが、表のサイズを表示領域の幅に合わせるためには表を構成する各列の幅を調整する必要がある。結果として、調整後の列幅に合わせて、表内の文字列は折り返し表示されて、かえって可読性を低下させる原因となるため、本実施の形態では、表として抽出された領域については、文字も含めたまま図表として切り取って表示することとする。   If the character extracted by the character string extraction processing unit 32 overlaps the range extracted as a diagram or table extracted by the chart extraction processing unit 33, the extracted character is canceled. In particular, there is a high possibility that characters are included in the extracted table. However, in order to match the size of the table to the width of the display area, it is necessary to adjust the width of each column constituting the table. As a result, the character string in the table is folded and displayed in accordance with the adjusted column width, which causes a decrease in readability.In this embodiment, characters are also included in the region extracted as a table. The figure will be cut out and displayed as it is.

<1−4.行IDの設定>
行解析処理部31は、さらに、以上のようにして抽出された文字列行、もしくは図表行に対して、その行であることを識別する重複しない番号として行ID(Identification)を設定する。1つの行IDについて、その行IDを有する行が2つ以上存在しなければ、必ずしも文書の順序に従って行IDを割り振る必要は無い。行IDの設定方法として、行IDが「0」の場合を存在しない行であるとして無効行とし、例えば、各ページの文書画像において、読み取った原稿の左上を原点(0,0)とし、原点に対して、右方向をX座標、下方向をY座標となる座標系を採用し、行の範囲を表わす最も左上のY座標が小さい順に行IDを1から連番で割り振る方法が挙げられる。なお、Y座標が同じ行同士はX座標が小さい方の行を優先する。この方法を用いる場合、段組構成により必ずしも文書の読み順序通りに行IDが割り振られる訳ではないが、横書き文書であれば行が上にあるほど順序が先である可能性が高いため、比較的文書の順序を反映した行IDの割り振り方になると言える。行IDの設定方法はこれに限らず、自由に選択することができる。
<1-4. Setting of row ID>
The row analysis processing unit 31 further sets a row ID (Identification) as a non-overlapping number for identifying the row of the character string row or chart row extracted as described above. If two or more rows having the row ID do not exist for one row ID, it is not always necessary to assign the row ID according to the document order. As a method of setting the row ID, the case where the row ID is “0” is regarded as an invalid row, and, for example, in the document image of each page, the upper left corner of the read original is set as the origin (0, 0). On the other hand, there is a method of adopting a coordinate system in which the right direction is the X coordinate and the lower direction is the Y coordinate, and the row IDs are assigned sequentially from 1 in ascending order of the top left Y coordinate representing the range of the row. In addition, the line with the smaller X coordinate gives priority to the lines with the same Y coordinate. When this method is used, line IDs are not necessarily assigned according to the reading order of the document due to the column structure. However, in the case of a horizontally written document, there is a high possibility that the order is higher as the line is higher. It can be said that this is a way of allocating row IDs reflecting the order of the target documents. The setting method of the row ID is not limited to this, and can be freely selected.

<1−5.文書第1方向及び文書第2方向の決定>
行解析処理部31は、1ページの文書画像における全ての行について、文字列行か図表行かの分類が終わると、文字列の方向から、文書全体の方向を示す文書第1方向を決定する。文書第1方向は、横書きのとき水平となり、縦書きのとき垂直となる。文書第1方向は、取得した全ての文字列の持つ方向を分類し、その比率により決定する。文書第1方向を決定するための比率の算出方法の簡単な例として、単純に横書きもしくは縦書きの文字列の数をカウントして、その数の比率を算出する方法が挙げられる。この方法の場合、例えば横書きの行数と縦書きの行数を比較して、多い方の方向を文書第1方向として決定(設定)する。文書第1方向の決定は上記の方法に限らず様々な方法を採用することができる。
<1-5. Determination of document first direction and document second direction>
The line analysis processing unit 31 determines the first document direction indicating the direction of the entire document from the direction of the character string when the classification of the character string line or the chart line is completed for all the lines in the document image of one page. The first direction of the document is horizontal for horizontal writing and vertical for vertical writing. The first direction of the document is determined by classifying the directions of all the acquired character strings and by the ratio. As a simple example of the ratio calculation method for determining the document first direction, there is a method of simply counting the number of horizontally or vertically written character strings and calculating the ratio of the number. In the case of this method, for example, the number of horizontal writing lines is compared with the number of vertical writing lines, and the larger direction is determined (set) as the first document direction. The determination of the document first direction is not limited to the above method, and various methods can be adopted.

なお、算出した比率が所定閾値(例えば、0.7)以下である場合、文書には縦書きの行と横書きの行とが無視できない比率で混在しており文書全体の方向を一意に判別できないとして、以降の処理を中断することができる。   When the calculated ratio is equal to or less than a predetermined threshold (for example, 0.7), the vertical writing line and the horizontal writing line are mixed in a ratio that cannot be ignored in the document, and the direction of the entire document cannot be uniquely determined. As a result, the subsequent processing can be interrupted.

さらに、上記の方法によって文書第1方向を決定すると、文書第1方向に直交する方向として文書第2方向を決定(設定)する。すなわち、文書第1方向が水平(横書き)の場合、文書第2方向は垂直、文書第1方向が垂直(縦書き)の場合、文書第2方向は水平となる。   Further, when the document first direction is determined by the above method, the document second direction is determined (set) as a direction orthogonal to the document first direction. That is, when the document first direction is horizontal (horizontal writing), the document second direction is vertical, and when the document first direction is vertical (vertical writing), the document second direction is horizontal.

また、複数のページを入力とする場合、先に全てのページにおいて行の抽出を行い、一部のページ又は全部のページの行の情報から、全てのページで同一の文書第1方向を決定してもよい。前記一部のページの選択方法として、例えば、表紙や扉、挿絵や写真、付録、後付け等、本文とは異なるレイアウトが含まれている可能性が高いとして、事前に先頭ページと最終ページを除いてもよい。   Also, when multiple pages are input, lines are extracted in all pages first, and the same first document direction is determined for all pages from the information of some pages or all pages. May be. As the selection method of the part of the page, for example, the first page and the last page are excluded in advance because there is a high possibility that a layout different from the main body such as a cover or door, an illustration or a photo, an appendix, or a retrofit is included. May be.

<1−6.記号(約物)の統合処理>
なお、個々の文字の切り出しにおいて、以下に示すような記号(約物)の統合処理を追加することができる。記号には、例えば行頭に来ることが禁止とされる(行頭禁則)ものや、行末に来ることが禁止とされる(行末禁則)ものがあり、図25に示すような文字がその一部として挙げられる。切り出した個々の文字を表示した際、行の折り返しによりこれらのルールが守られず可読性が低下する場合がある。そこで、行頭禁則の記号については、1つ前の文字と統合し、行末禁則の記号については、1つ後の文字と統合することで、単独で行頭もしくは行末に来ることがなくなる。
<1-6. Integrated processing of symbols (about items)>
It should be noted that in the extraction of individual characters, a symbol (about object) integration process as shown below can be added. For example, there are symbols that are prohibited from coming to the beginning of a line (prohibition at the beginning of a line) and those that are prohibited from coming to the end of a line (prohibition at the end of line), and characters such as those shown in FIG. Can be mentioned. When individual cut out characters are displayed, these rules may not be observed due to line wrapping, and readability may deteriorate. Therefore, by combining the preceding character with the preceding character for the prohibition symbol and integrating with the succeeding character for the prohibition symbol, the character at the beginning or the end of the line can be prevented.

各文字が、前記したルールを持つ記号であるかの判定方法は公知の方法を使用することができる。例えば、OCR処理を利用して文字種を照合してもよいし、文字の大きさや、文字を構成する画素の特徴から判別してもよい。例えば句読点の場合、図26のように横書きなら行の下半分のみで構成され、また行の高さ(矢印で示された範囲)に比べて半分程度の幅を持つ場合、その文字が句読点である可能性が高いとして、1つ前の文字と統合してもよい。図26では横書きの例を示したが、縦書きの場合も同様に統合を行うことができる。半角英小文字と区別するため、行を構成する他の文字の高さや幅の傾向から和文、英文の判定を加え、和文の場合のみ句読点と判定するようにする等の処理を追加してもよい。例えば、和文ではひらがな、カタカナ及び漢字等の全角文字が文章の大半を占めており、行の上半分もしくは下半分のみで構成される文字が少なくなる傾向がある。また、半角文字に比べて、全角文字では行の高さに対して文字の横幅が半分より大きい文字の種類が多い。従って、(1)行を上下に分割する水平方向の直線をまたぎ、(2)文字の横幅が行の高さに所定係数(例えば0.6)を乗算した値以上である、文字数をカウントし、行を構成する文字数に対して前記(1)及び(2)を満たす文字数の割合が所定閾値(例えば0.5)以上である場合に、その行が和文であるとして判定する処理を適用することができる。和文、英文の判定方法はこの方法に限らず、他の方法により判定してもよい。また、縦書きの文書である場合は自動的に和文とみなしてもよい。ここで、句読点と、「ァ」等小さい和字との区別がつかない可能性もあるが、これらの小さい和字も行頭禁則であるため句読点と同様に統合しても問題無い。そのため、厳密に句読点専用の処理とする必要はない。また、全角文字でも、「I」や「1」等、余白を除けば横幅が小さな文字があり、さらに「_」(アンダーライン)や、上付き文字、下付き文字等、上半分もしくは下半分のみで構成される文字が含まれる場合もある。逆に、半角英字でも、「M」や「W」等はフォントによって横幅が大きくなることもあるので、厳密に、和文と英文との判定を行うのが難しい場合がある。   A known method can be used as a method of determining whether each character is a symbol having the above-described rule. For example, the character type may be collated using OCR processing, or may be determined from the size of the character and the characteristics of the pixels constituting the character. For example, in the case of a punctuation mark, if it is written horizontally as shown in FIG. 26, it is composed of only the lower half of the line, and if the width is about half the height of the line (the range indicated by the arrow), the character is a punctuation mark. As there is a high possibility, it may be integrated with the previous character. In FIG. 26, an example of horizontal writing is shown, but integration can be similarly performed in vertical writing. In order to distinguish it from single-byte lower-case letters, processing such as adding Japanese and English sentences based on the tendency of the height and width of other characters that make up the line, and determining punctuation marks only for Japanese sentences may be added. . For example, in Japanese, full-width characters such as hiragana, katakana, and kanji occupy most of the sentence, and there is a tendency that characters composed of only the upper half or the lower half of a line are reduced. In addition, compared to half-width characters, there are many types of characters with full-width characters whose width is greater than half of the line height. Therefore, (1) straddling a horizontal straight line that divides the line up and down, and (2) counting the number of characters whose horizontal width is equal to or greater than the value obtained by multiplying the line height by a predetermined coefficient (for example, 0.6). When the ratio of the number of characters satisfying the above (1) and (2) with respect to the number of characters constituting the line is equal to or greater than a predetermined threshold (for example, 0.5), a process for determining that the line is a Japanese sentence is applied. be able to. The determination method of Japanese and English is not limited to this method, and may be determined by other methods. If the document is vertically written, it may be automatically regarded as a Japanese sentence. Here, there is a possibility that punctuation marks cannot be distinguished from small Japanese characters such as “a”. However, since these small Japanese characters are also prohibited from beginning of line, there is no problem even if they are integrated in the same manner as punctuation marks. Therefore, it is not necessary to strictly process punctuation. In addition, even full-width characters such as “I” and “1” have a small width except for white space, and “_” (underline), superscripts, subscripts, etc. In some cases, a character consisting only of Conversely, even for half-width English letters, the width of “M”, “W”, etc. may increase depending on the font, so it may be difficult to strictly determine the Japanese text and the English text.

<1−7.処理例>
行解析処理部31が実行する処理の具体例として、図27に示す構造の文書画像(1ページ)に対して行解析処理を適用する場合について説明する。行解析処理部31は、図28に示すように、その行の要素を全て含んだ最小サイズの外接矩形の範囲を各行の領域として分離し、それぞれの行に、行IDを、外接矩形の左上の垂直座標(Y座標)位置の順で割り当てる。図28に示す文書画像では、行IDが105の行が図表の行であることを除いては、残りの行はいずれも横書きの文字列の行であり、縦書きの文字列の行は1つも含まれていない。そのため、行解析処理部31は、この文書画像における文書第1方向は水平方向であると決定する。
<1-7. Processing example>
As a specific example of the process executed by the line analysis processing unit 31, a case where the line analysis process is applied to a document image (one page) having the structure shown in FIG. 27 will be described. As shown in FIG. 28, the row analysis processing unit 31 separates a range of a circumscribed rectangle having a minimum size including all the elements of the row as a region of each row, and assigns a row ID to each row and an upper left corner of the circumscribed rectangle. Are assigned in the order of their vertical coordinates (Y coordinates). In the document image shown in FIG. 28, the remaining lines are horizontal character string lines except that the line ID 105 is a chart line, and the vertical character string line is 1. No one is included. Therefore, the line analysis processing unit 31 determines that the first document direction in the document image is the horizontal direction.

[2.行ブロック解析処理部]
<2−1.行ブロック解析処理部の処理>
行ブロック解析処理部34は、行解析処理部31で分類された行を、行を少なくとも1つ以上有する行ブロックに統合する処理を行う。行ブロック解析処理部34は、行解析処理部31で分類された文字列行を、少なくとも1つ以上の文字列行から成る文字列の行ブロックに統合し、重複しない行ブロックIDを持つ新規行ブロックとして記憶部12に記憶(登録)する。図表行については、単一行で1つの行ブロックを構成するものとし、それぞれ重複しない行ブロックIDを持つ新規行ブロックとして登録する。
[2. Row block analysis processing unit]
<2-1. Processing of line block analysis processing section>
The row block analysis processing unit 34 performs processing for integrating the rows classified by the row analysis processing unit 31 into a row block having at least one row. The row block analysis processing unit 34 integrates the character string rows classified by the row analysis processing unit 31 into a character string row block including at least one character string row, and creates a new row having a non-overlapping row block ID. Store (register) in the storage unit 12 as a block. As for the chart row, a single row constitutes one row block, and is registered as a new row block having a row block ID that does not overlap each other.

文字列の行ブロック統合処理について以下で詳細に説明する。初めに、行解析処理部31で分類された行のうち文字列行のグループから、注目行L1を選択する。続いて、注目行L1に関して、前方及び後方(定義は、後述の(2−5)章を参照)に連続する文字列行を探索する。具体的には、文字列行のグループの、注目行L1とは異なる文字列行から、注目行L1の前方もしくは後方に連続する文字列行を最大1つずつ選択する。注目行L1の連続行の候補となる文字列行は注目行L1を除く全ての文字列行であり、連続行の候補となる条件については後述する。全ての文字列行について、前方及び後方に連続する文字列行を選択すると、連続する文字列行同士の繋がりから、前方及び後方の両方において連続する文字列行がなくなるまで1つの行ブロックとして分類、統合し、未割り当ての行ブロックIDを持つ新規行ブロックとして記憶部12に登録する。全ての文字列行がいずれかの行ブロックに登録されるまで処理を繰り返し、全ての文字列行についての登録が完了すると、行ブロック解析処理部34は処理を終了する。   The character string row block integration processing will be described in detail below. First, the target line L1 is selected from the group of character string lines among the lines classified by the line analysis processing unit 31. Subsequently, with respect to the attention line L1, a character string line that continues forward and backward (for definition, refer to the later-described (2-5) chapter) is searched. Specifically, at most one character string row that is continuous forward or backward of the target line L1 is selected from a character string line that is different from the target line L1 in the group of character string lines. The character string rows that are candidates for the continuous line of the target line L1 are all the character string lines except the target line L1, and the conditions that are candidates for the continuous line will be described later. For all the character string lines, if a character string line that is continuous forward and backward is selected, it is classified as one line block from the connection of consecutive character string lines until there is no continuous character string line in both the forward and backward directions. Then, they are integrated and registered in the storage unit 12 as a new row block having an unassigned row block ID. The process is repeated until all the character string lines are registered in any one of the line blocks, and when the registration for all the character string lines is completed, the line block analysis processing unit 34 ends the process.

<2−2.連続行の候補の判定>
注目行L1とは別に選択された文字列行L2が、注目行L1の連続行の候補であるか否かを判定する方法について説明する。行L2が行L1の連続行の候補である条件として、少なくとも下記2つの条件を満たすものとする。
条件1:一方の行の先頭から末尾までの範囲において、もう一方の行の先頭もしくは末尾のうち少なくとも一方が存在する。
条件2:2つの行の行間変位量linespace(L1,L2)が下記の式(8)を満たす。
TH_MIN_LS≦linespace(L1,L2)≦TH_MAX_LS ・・・式(8)
(TH_MIN_LS、TH_MAX_LSは、予め設定される閾値)
なお、条件1は、異なる段に属する行を連続行の候補として判定しないために用いる。条件2は、行間が広過ぎる又は狭過ぎる行を連続行の候補として判定しないために用いる。
<2-2. Judgment of candidates for continuous lines>
A method for determining whether or not the character string row L2 selected separately from the attention row L1 is a candidate for a continuous row of the attention row L1 will be described. It is assumed that at least the following two conditions are satisfied as a condition that the row L2 is a candidate for a continuous row of the row L1.
Condition 1: In the range from the beginning to the end of one line, at least one of the beginning or the end of the other line exists.
Condition 2: The inter-line displacement amount linespace (L1, L2) of the two rows satisfies the following equation (8).
TH_MIN_LS ≦ linespace (L1, L2) ≦ TH_MAX_LS (8)
(TH_MIN_LS and TH_MAX_LS are preset threshold values)
Condition 1 is used so that lines belonging to different stages are not determined as continuous line candidates. Condition 2 is used in order not to determine a line whose line spacing is too wide or too narrow as a candidate for a continuous line.

図29の(a)は、2段組の横書きの文書の例、図29の(b)は、2段組の縦書きの文書の例である。条件1を満たすために、行L1と行L2とは、文書第1方向で一部もしくは全部が重複している必要がある。例えば、図29の例の場合、行aと行b、行cと行d、行eと行f、行gと行hは、条件1を満たすため、これらの組合せは互いに連続行の候補となる。しかし、行aと行d、行eと行h等の組合せでは条件1を満たさないため、これらの組合せは互いに連続行の候補とならない。   FIG. 29A shows an example of a horizontally written document with two columns, and FIG. 29B shows an example of a vertically written document with two columns. In order to satisfy the condition 1, part or all of the lines L1 and L2 need to overlap in the first direction of the document. For example, in the example shown in FIG. 29, row a and row b, row c and row d, row e and row f, row g and row h satisfy condition 1, and therefore these combinations are considered as consecutive row candidates. Become. However, since the condition 1 is not satisfied in the combination of the row a and the row d, the row e and the row h, these combinations are not candidates for continuous rows.

条件2で示す行L1と行L2との行間変位量linespace(L1,L2)は、図30に示すように、横書きであれば行L1と行L2とのうち下側にある方の行の上端座標と、もう一方の行の下端座標との差分値(図30の(a)〜(c)参照)、縦書きであれば行L1と行L2とのうち左にある方の行の右端座標ともう一方の行の左端座標との差分値(図30の(d)〜(f)参照)である。行L1と行L2とが重複しないとき、行間変位量linespace(L1,L2)は2つの行の行間距離を示す。また、TH_MIN_LS及びTH_MAX_LSは、連続行同士の行間変位量として許容される差分値の最小値及び最大値を示す所定係数である。例えば、行L1の文字サイズに所定係数r1(例えばr1=0.1)を乗算したものを閾値TH_MIN_LSと設定し、所定係数r2(r2は正の数とする、例えばr2=1.5等)を乗算したものを閾値TH_MAX_LSとして設定する。閾値TH_MIN_LS及び閾値TH_MAX_LSは、他の方法により設定されてもよく、例えば行L1と行L2の文字サイズの平均値に所定係数を乗算したものとしてもよい。また閾値TH_MIN_LSを正値に設定することで、重複のある2つの行同士を連続行として認めないようにすることができる。逆に閾値TH_MIN_LSを負値に設定することで、図30の(c)及び(f)のように、行L1と行L2とが多少重複する場合も許容することができる。なお、行間変位量linespace(L1,L2)は、行L1と行L2とが重複する場合は0を与えるように定義することもできる。これは、次のような事前処理の性能不足を補う場合に用いられる。原稿の読み取りを行う際、原稿の傾きを十分補正しきれずに、ごくわずかな傾きが残っている場合、最小外接矩形で文字列を囲むと、文字自体は重複していなくても矩形同士が重複する場合が存在する。   As shown in FIG. 30, the interline displacement amount spacespace (L1, L2) between the rows L1 and L2 indicated by the condition 2 is the upper end of the lower row of the rows L1 and L2 in the case of horizontal writing. The difference value between the coordinates and the lower end coordinates of the other line (see (a) to (c) of FIG. 30), and in the case of vertical writing, the right end coordinates of the left line of lines L1 and L2 And the difference value between the left end coordinates of the other line (see (d) to (f) of FIG. 30). When the line L1 and the line L2 do not overlap, the interline displacement amount linespace (L1, L2) indicates the interline distance between the two lines. Moreover, TH_MIN_LS and TH_MAX_LS are predetermined coefficients indicating the minimum value and the maximum value of the difference value allowed as the inter-row displacement amount between consecutive rows. For example, a value obtained by multiplying the character size of the line L1 by a predetermined coefficient r1 (for example, r1 = 0.1) is set as a threshold TH_MIN_LS, and the predetermined coefficient r2 (r2 is a positive number, for example, r2 = 1.5). Is multiplied by the threshold TH_MAX_LS. The threshold value TH_MIN_LS and the threshold value TH_MAX_LS may be set by other methods. For example, the average value of the character sizes of the lines L1 and L2 may be multiplied by a predetermined coefficient. Moreover, by setting the threshold value TH_MIN_LS to a positive value, it is possible to prevent two overlapping rows from being recognized as continuous rows. Conversely, by setting the threshold value TH_MIN_LS to a negative value, it is also possible to allow a case where the row L1 and the row L2 slightly overlap as shown in (c) and (f) of FIG. The inter-line displacement amount linespace (L1, L2) can also be defined to give 0 when the line L1 and the line L2 overlap. This is used when the following shortage of preprocessing performance is compensated. When scanning a document, if the document tilt cannot be corrected sufficiently and a slight tilt remains, enclosing the character string with the minimum circumscribed rectangle causes the rectangles to overlap even if the characters themselves do not overlap There is a case to do.

<2−3.条件の強化:インデントの範囲指定>
また、連続行の候補を判定する条件を強化するために、上記条件1,2に加えて、別の条件を設定してもよい。例えば、次式(9)を満たすことを条件として追加することができる。
indent(L1,L2)≦TH_INDENT ・・・式(9)
ここで、indent(L1,L2)は行L1の開始位置の文書第1方向成分と行L2の開始位置の文書第1方向成分の差の大きさであり、すなわちインデントの大きさを意味する。また、閾値TH_INDENTは行の先頭のインデントとして許容される距離を示す所定係数である。閾値TH_INDENTは、例えば行L1の文字サイズに所定係数α(αは正の数とする、例えばα=1.5等)を乗算した値を与え、α文字以内のインデントを許容することができる。閾値TH_INDENTは他の方法により設定してもよく、例えば行L1と行L2の文字サイズの平均値に所定係数αを乗算したものとしてもよい。
<2-3. Strengthening of conditions: Specifying the indent range>
In addition to the above conditions 1 and 2, another condition may be set in order to reinforce the condition for determining candidates for continuous lines. For example, it can be added as a condition that the following expression (9) is satisfied.
indent (L1, L2) ≦ TH_INDENT (9)
Here, indent (L1, L2) is the magnitude of the difference between the document first direction component at the start position of line L1 and the document first direction component at the start position of line L2, that is, the magnitude of indentation. Further, the threshold value TH_INDENT is a predetermined coefficient indicating a distance allowed as an indent at the beginning of a line. The threshold value TH_INDENT gives, for example, a value obtained by multiplying the character size of the line L1 by a predetermined coefficient α (α is a positive number, for example α = 1.5), and allows indentation within α characters. The threshold value TH_INDEX may be set by other methods, for example, an average value of the character sizes of the lines L1 and L2 may be multiplied by a predetermined coefficient α.

<2−4.条件の強化:行終了位置の差異の許容範囲指定>
連続行の候補を判定する条件を強化する他の条件として、例えば次式(10)を満たすことを条件として追加することで、行の終了位置がある程度近い行同士を連続行の候補とすることができる。
|L1MAX1−L2MAX1|≦TH_DIFF_ENDPOS ・・・式(10)
ここで、L1MAX1は行L1の文書第1方向成分の最大値、L2MAX1は行L2の文書第1方向成分の最大値である。例えば、文書第1方向が水平方向(横書き)である場合、L1MAX1及びL2MAX1は、行L1及び行L2の右端のX座標を指す。また、閾値TH_DIFF_ENDPOSは行の終了位置の差として許容される距離を示す所定係数である。例えば行L1の文字サイズの平均値に所定係数β(βは正の数とする、例えばβ=0.5等)を乗算したものを閾値TH_DIFF_ENDPOSとすることで、β文字以内のインデントを許容することになる。
<2-4. Strengthening of conditions: Specifying tolerance range for line end position differences>
As another condition for strengthening the condition for determining the candidate for the continuous line, for example, by adding the condition that the following equation (10) is satisfied as a condition, the lines whose close end positions are close to each other are made candidates for the continuous line. Can do.
| L1MAX1-L2MAX1 | ≦ TH_DIFF_ENDPOS (10)
Here, L1MAX1 is the maximum value of the document first direction component of the row L1, and L2MAX1 is the maximum value of the document first direction component of the row L2. For example, when the first direction of the document is the horizontal direction (horizontal writing), L1MAX1 and L2MAX1 indicate the X coordinates of the right ends of the rows L1 and L2. The threshold value TH_DIFF_ENDPOS is a predetermined coefficient indicating a distance allowed as a difference between the end positions of rows. For example, by multiplying the average value of the character size of the line L1 by a predetermined coefficient β (β is a positive number, for example, β = 0.5, etc.) as a threshold value TH_DIFF_ENDPOS, indentation within β characters is allowed. It will be.

<2−5.前方又は後方の連続行の選択>
行L1の連続行の候補として抽出された行から、行L1の前方で最も近い位置にある行、及び、後方で最も近い位置にある行を、それぞれ最大1つずつ選択する。なお、文書第1方向が水平方向(横書き)である場合、行L1より上にある行を前方の行、行L1より下にある行を後方の行とし、文書第1方向が垂直方向(縦書き)である場合、行L1より右にある行を前方の行、行L1より左にある行を後方の行とする。また、行の近さを表わす値として、例えば、前述の行間変位量linespace(L1,L2)を使用し、linespace(L1,L2)が小さい程、行が近いとみなすことができる。なお前方、後方とも、連続行は最大で1つずつであり、必ずしも連続行が存在する必要はない。
<2-5. Select forward or backward continuous lines>
From the rows extracted as candidates for the continuous row of the row L1, the row closest to the front of the row L1 and the row closest to the rear are selected one at a time. When the document first direction is the horizontal direction (horizontal writing), the line above the line L1 is the front line, the line below the line L1 is the back line, and the document first direction is the vertical direction (vertical). In the case of writing), a line on the right side of the line L1 is a front line and a line on the left side of the line L1 is a rear line. Further, for example, the above-described interline displacement amount linespace (L1, L2) is used as a value representing the closeness of the rows, and the smaller the linespace (L1, L2), the closer the rows can be considered. Note that there is a maximum of one continuous line for both the front and rear, and it is not always necessary to have a continuous line.

<2−6.行ブロックへの分類及び統合>
以上のようにして、全ての文字列行について前方及び後方の連続行を選択すると、行ブロックへの分類、統合を行う。但し、複数の行から連続行として選択されるケースもあり得るため、相互に連続行であるとされていない行のペアについては、その間の連続関係を事前に解消しておく。例えば、文書画像が図31の(a)である場合、前方の連続行として行L3を選択する行は、行L4と行L5との2つ存在するが、行L5は行L3の後方の連続行として選択されていない。そのため、行L3と行L5との間の連続関係は解消される。同様にして行L4と行L6との間の連続関係も解消される。このことにより、図31の(a)に示すような例では、行L3及び行L4において注目行L1からの連続関係が断たれるため、注目行L1と同一の行ブロックとして分類できなくなるケースも起こり得る。しかし、図31の(b)に示すように複数の行ブロックとして分類することができ、後段のレイアウト解析処理部35における段組解析処理部37で、同一の段組、及びその段組を構成する同一の段(カラム)として統合できるため、この時点でブロックが分かれてしまっても、問題とはならない。
<2-6. Classification and integration into row blocks>
As described above, when front and rear continuous lines are selected for all character string lines, classification and integration into line blocks are performed. However, since there may be a case where a plurality of rows are selected as continuous rows, the continuous relationship between the pairs of rows that are not considered to be continuous rows is canceled in advance. For example, when the document image is (a) in FIG. 31, there are two lines L4 and L5 for selecting the line L3 as the front continuous lines, but the line L5 is a continuous line behind the line L3. Not selected as a row. Therefore, the continuous relationship between row L3 and row L5 is canceled. Similarly, the continuous relationship between the rows L4 and L6 is also eliminated. As a result, in the example shown in FIG. 31A, the continuous relationship from the target row L1 is broken in the rows L3 and L4, so that it may not be classified as the same row block as the target row L1. Can happen. However, as shown in FIG. 31 (b), it can be classified as a plurality of row blocks, and the same column set and its column set are constituted by the column set analysis processing unit 37 in the layout analysis processing unit 35 at the subsequent stage. Therefore, even if the blocks are separated at this point, there is no problem.

行ブロックへの分類及び統合処理は、次のように行う。まず。行ブロックとして分類されていない文字列行のうち任意の行L1(注目行L1)について、まず、行L1を新規の行ブロックとして設定する。続いて、行L1から前後の連続行をたどり、行ブロックの範囲を拡大する。前方及び後方とも、連続行が無くなると、行ブロックの拡大を終了し、その行ブロックに含まれる先頭の行から順に行IDを取得する。また、行ブロックの情報として、行ブロックに含まれる全ての行に外接する最小矩形の左上座標、幅及び高さ、並びに含まれる行数を取得する。以上のようにして得られた行の順序と各種情報とを持つ行ブロックを、既に登録済みの行ブロックと重複しないIDを持つ新規の行ブロックとして登録を行い、またその行ブロックに含まれる各行の所属行ブロックIDを更新する。このようにして行われる行ブロックへの分類及び統合処理を、全ての文字列行がいずれかの行ブロックに分類されるまで繰り返す。   The classification and integration processing into row blocks is performed as follows. First. Regarding an arbitrary line L1 (target line L1) among character string lines not classified as a line block, first, the line L1 is set as a new line block. Subsequently, the continuous line before and after the line L1 is traced to expand the range of the line block. When there are no consecutive rows in both the front and rear, the expansion of the row block is terminated, and row IDs are acquired in order from the first row included in the row block. Further, as the row block information, the upper left coordinates, the width and the height of the smallest rectangle circumscribing all the rows included in the row block, and the number of included rows are acquired. The row block having the row order and various information obtained as described above is registered as a new row block having an ID that does not overlap with an already registered row block, and each row included in the row block is registered. Update the belonging row block ID. The classification and integration processing into the row blocks performed in this way is repeated until all the character string rows are classified into any row block.

<2−7.同一の行ブロックに分類できる(連続行の候補とできる)行の条件>
なお、文書第1方向の文字列行は文書第1方向の文字列行とのみ、文書第2方向の文字列行は文書第2方向の文字列行とのみ、行ブロックを構成する。すなわち、1つの行ブロックに、文書第1方向の文字列行と文書第2方向の文字列行とが混在することは無い。従って、注目行L1の連続行の候補を探索する際、注目行L1の文字列方向と異なる方向の文字列行は連続行の候補としない。
<2-7. Conditions for rows that can be classified into the same row block (can be candidates for continuous rows)>
A character string line in the first direction of the document constitutes a line block only with a character string line in the first direction of the document, and a character string line in the second direction of the document constitutes a character string line in the second direction of the document. That is, the character string line in the document first direction and the character string line in the document second direction are not mixed in one line block. Therefore, when searching for a candidate for a continuous line of the target line L1, a character string line in a direction different from the character string direction of the target line L1 is not a candidate for a continuous line.

<2−8.処理例>
行ブロック解析処理部34が実行する行ブロック解析処理を、具体例を用いて説明する。既に示した図28のように文書画像から検出された複数の行に対して行ブロック解析処理を適用すると、文書画像は、図32のように行ブロックとして分類される。図32に示す例では、行ブロックB3は、章の見出しの行であり、行ブロックB4に比べて文字が大きい。このように文字のサイズが大きく異なる2つの行同士を連続行の候補として選択しないような、連続行の候補の判定の条件を追加することも有効な手段である。
<2-8. Processing example>
The row block analysis process executed by the row block analysis processing unit 34 will be described using a specific example. When the row block analysis process is applied to a plurality of lines detected from the document image as shown in FIG. 28, the document image is classified as a row block as shown in FIG. In the example shown in FIG. 32, the row block B3 is a chapter heading row, and has larger characters than the row block B4. It is also an effective means to add a condition for determining candidates for continuous lines so that two lines having greatly different character sizes are not selected as candidates for continuous lines.

[3.レイアウト解析処理部]
<3−1.レイアウト解析処理部の構成>
図33は、レイアウト解析処理部35の詳細構成を示すブロック図である。レイアウト解析処理部35は、前段の行ブロック解析処理部34で分類された行ブロック同士の上下左右の位置関係から、行ブロック構成を解析し、文書画像中の文章(本文)の読み順を推定する処理を行うものであり、段組解析処理部37、行順序付け処理部38、段落解析処理部39を備えて構成される。
[3. Layout analysis processing unit]
<3-1. Configuration of layout analysis processing unit>
FIG. 33 is a block diagram illustrating a detailed configuration of the layout analysis processing unit 35. The layout analysis processing unit 35 analyzes the row block configuration from the vertical and horizontal positional relationships between the row blocks classified by the previous row block analysis processing unit 34, and estimates the reading order of the sentences (text) in the document image. And includes a column analysis processing unit 37, a line ordering processing unit 38, and a paragraph analysis processing unit 39.

<3−2.段組解析処理部>
段組解析処理部37は、複数の行ブロックの上下及び左右の位置関係から、段組及び段組を構成する各段(カラム)を分類する段組解析処理を実行する。文書は文書第2方向に段組が配置され、各段組構成内で文書第1方向にカラムが配置されているものとして、ページ内の行ブロックの集合を、適切に境界線を設定して行ブロックをまたぐことなく分割して初期段組とする。そして、同一の初期段組に含まれる行ブロックの集合を、適切に境界線を設定して行ブロックをまたぐことなく分割して、該初期段組を構成する初期カラムとする。
<3-2. Multi-column analysis processing section>
The column analysis processing unit 37 executes column analysis processing for classifying the columns and the respective columns (columns) constituting the columns from the vertical and horizontal positional relationships of the plurality of row blocks. Assuming that the document is arranged in columns in the second direction of the document, and columns are arranged in the first direction of the document in each column structure, the set of row blocks in the page is appropriately set with a boundary line. Divide without crossing the row block to the initial column. Then, a set of row blocks included in the same initial column is divided without setting a boundary line so as to cross the row block, and used as an initial column constituting the initial column.

境界線の設定方法は特に指定はなく、最も簡単な例として、初期段組の分類には文書第2方向と平行な直線を使用し、初期カラムの分類には文書第1方向と平行な直線を使用することが挙げられる。例えば、図34の(a)のように横書きの文書画像から行ブロックの構造が解析された場合、図34の(b)のように行ブロックを初期段組に分類され、さらに初期段組は図34の(c)のようにそれぞれ初期カラムとして分類される。なお、図34の(b)及び(c)では、段組間の境界線は実線で、カラム間の境界線は一点鎖線で示されている。   The method of setting the boundary line is not particularly specified. As the simplest example, a straight line parallel to the second direction of the document is used for classification of the initial column, and a straight line parallel to the first direction of the document is used for classification of the initial column. Can be used. For example, when the structure of a row block is analyzed from a horizontally written document image as shown in FIG. 34 (a), the row block is classified into an initial column as shown in FIG. 34 (b). Each is classified as an initial column as shown in FIG. In FIGS. 34B and 34C, the boundary lines between the columns are indicated by solid lines, and the boundary lines between the columns are indicated by alternate long and short dash lines.

<3−3.段組の分割禁止(同一段組として許容される行ブロック間距離の算出)>
本来は同一段組であるが、偶然、行ブロックを分割することができるために複数の段組に分かれてしまうようなケースもまれに存在する。こうしたケースに対応するため、例えば連続する2つの行ブロック間の距離を算出し、その距離が所定値(例えば行ブロックの平均行間距離の2倍)以下の2つのブロック間には境界線を引くことを禁止する条件を追加することができる。図35は、行ブロックB10,B11,B12を左側のカラム、行ブロックB20,B21を右側のカラムとした2段組構成の例を示す。行ブロックB10と行ブロックB11との間、行ブロックB20と行ブロックB21との間が空いているため、行ブロックB10と行ブロックB20から成る2段組構成、及び、行ブロックB11とB12と行ブロックB21とから成る2段組構成として分割してしまう恐れもある。しかし、行ブロックB20の平均行間距離(20)に対して、行ブロックB20と行ブロックB21とのブロック間距離(30)が所定値(20×2=40)以下であるとして、行ブロックB20と行ブロックB21との間に境界線を引くことを禁止することで、これらの行ブロックが2つの異なる段組に分かれることを防ぐことができる。
<3-3. Prohibition of column division (calculation of distance between row blocks allowed for the same column)>
Although it is originally the same column, there is a rare case where a row block can be divided by chance and thus divided into a plurality of columns. In order to cope with such a case, for example, a distance between two consecutive row blocks is calculated, and a boundary line is drawn between two blocks whose distance is equal to or less than a predetermined value (for example, twice the average inter-row distance of the row blocks). You can add a condition that prohibits this. FIG. 35 shows an example of a two-column configuration in which the row blocks B10, B11, and B12 are on the left column, and the row blocks B20 and B21 are on the right column. Since the space between the row block B10 and the row block B11 and the space between the row block B20 and the row block B21 are vacant, the two-stage configuration including the row block B10 and the row block B20, and the row blocks B11 and B12 and the row block There is also a possibility that it is divided as a two-stage configuration composed of the block B21. However, assuming that the inter-block distance (30) between the row block B20 and the row block B21 is equal to or less than a predetermined value (20 × 2 = 40) with respect to the average inter-row distance (20) of the row block B20, By prohibiting the boundary line from being drawn with the row block B21, it is possible to prevent these row blocks from being divided into two different columns.

また、見出しによる広い行間に境界線が引かれてしまう場合に、以下のように行ブロックの分割を防ぐようにしてもよい。行ブロックが見出しであるかどうかの判定を行い、見出しである場合には、その行ブロックと、その直後の行ブロックとを分割禁止とする距離の所定値を変更する(例えば、所定係数1.5を乗算する)等の方法により、分割を防ぐことも可能である。行ブロックが見出しか否かの判定は、例えば、横書きの文書であれば、上又は下の行ブロックと比較して左右に所定値以上(第1閾値、例えば、各文字のサイズ(行の高さ)など)の余白が存在し、左の余白と右の余白の大きさの差が所定値以下(例えば、第1閾値×0.1など)である、つまり左詰めでなくセンタリングされており、また他の行ブロックより各文字のサイズ(行の高さ)が大きい場合に、その行ブロックが見出し行であるとして判定する方法が挙げられる。なお、他の条件と組み合わせて判定しても構わない。   In addition, when a boundary line is drawn between wide lines due to a heading, division of a row block may be prevented as follows. It is determined whether or not the row block is a headline. If the row block is a headline, a predetermined value of a distance that prohibits division of the row block and the immediately following row block is changed (for example, a predetermined coefficient of 1. It is also possible to prevent division by a method such as 5). For example, in the case of a horizontally written document, whether or not the line block is a headline is equal to or larger than a predetermined value (first threshold, for example, the size of each character (line height Etc.) and the difference between the size of the left margin and the right margin is not more than a predetermined value (for example, the first threshold value × 0.1, etc.), that is, centered instead of left-justified. In addition, when the size of each character (line height) is larger than other line blocks, there is a method of determining that the line block is a heading line. The determination may be made in combination with other conditions.

なお、上記のような平均行間距離を基準とした所定値でも適切に分割できないような場合、タッチパネル14のタッチ操作(手動)でレイアウトを修正できるようになっていてもよい。   In addition, when it cannot divide | segment appropriately even with the predetermined value on the basis of the above average line distance, a layout may be able to be corrected by the touch operation (manual) of the touch panel 14.

<3−4.位置関係以外の情報の活用>
また、行ブロックの位置関係に加えて、行ブロックが持つ各種情報を利用して、段組及びカラムの分類(すなわち境界線の設定)を行うことができる。行ブロックが持つ各種情報の例として、行の長さや主要な文字のサイズ等が挙げられる。隣り合う行ブロック同士でこれらの情報が大きく異なる場合は同一の段組に分類することを避けるようにすることができるし、逆に位置が大きく離れた行ブロック同士でも、例えば同じカラム境界線を共有することができ、かつ類似する情報を持つ場合、同一段組として分類してもよい。
<3-4. Utilization of information other than positional relationships>
Further, in addition to the positional relationship of the row blocks, it is possible to classify columns and columns (that is, set boundary lines) by using various information held by the row blocks. Examples of various information held by the line block include the length of the line and the size of main characters. If these pieces of information differ greatly between adjacent row blocks, it can be avoided to classify them into the same column set. Conversely, even in row blocks that are far apart, for example, the same column boundary line is used. If they can be shared and have similar information, they may be classified as the same column.

<3−5.行ブロックが0個もしくは1個しかない場合>
なお、段組解析処理部37に入力されたページ画像が、ただ1つの行ブロックを持つ場合、そのページ画像は1段構成の文書であるとして、境界線の設定は行わない。また、該ページ画像が、1つも行ブロックを持たない場合(すなわち白紙ページの場合)も境界線の設定は行わない。
<3-5. When there are only 0 or 1 row block>
If the page image input to the column analysis processing unit 37 has only one row block, the page image is a one-stage document, and no boundary line is set. Even when the page image has no row block (that is, a blank page), no border is set.

また、文書画像に文書第1方向の文字列行と文書第2方向の文字列行とが混在する場合は、文書第2方向の文字列行の行ブロックを図表行の行ブロックに置き換える。このことにより、文書第1方向に記述された文章の最中に、文書第2方向に記述された文章が混じることを防ぐことができる。   Further, when the document image includes character string rows in the first direction of the document and character string rows in the second direction of the document, the row block of the character string rows in the second direction of the document is replaced with the row block of the chart row. Thus, it is possible to prevent a sentence described in the second direction of the document from being mixed with a sentence described in the first direction of the document.

<3−6.処理例>
段組解析処理部37が実行する処理の具体例として、例えば既に示した図32に示す文書画像から検出された複数の行ブロックに対して段組解析処理を適用する場合について説明する。段組解析処理部37は、図32に示す文書画像を、図36に示す段組及びカラムに分類する。カラムC1及びカラムC2は、それぞれ1段構成の段組G1及び段組G2を成し、カラムC3及びカラムC4は2段組構成の段組G3における左右のカラムを成している。なお、図36では、行(文字列行及び図表行)を直線、行ブロックを点線、カラムを一点鎖線で囲んでいる。
<3-6. Processing example>
As a specific example of the processing executed by the column analysis processing unit 37, a case where the column analysis processing is applied to a plurality of row blocks detected from the document image shown in FIG. The column analysis processing unit 37 classifies the document image shown in FIG. 32 into columns and columns shown in FIG. The column C1 and the column C2 respectively constitute a column set G1 and a column set G2 having a one-stage configuration, and the column C3 and the column C4 constitute left and right columns in the column set G3 having a two-stage configuration. In FIG. 36, lines (character string lines and chart lines) are surrounded by straight lines, line blocks are surrounded by dotted lines, and columns are surrounded by alternate long and short dash lines.

<3−7.行順序付け処理部>
図33に示される行順序付け処理部38は、段組、カラム、行ブロック、及び行の位置関係から文書全体における行の順序を解析し、行順序リストを生成する処理を、以下の(1)〜(9)に従って行う。
(1)同じ行ブロックに属する行同士については、横書き文書であれば上から下、縦書き文書であれば右から左の順に優先順位を設定する。ここでは、上記のように既に、行ブロックに分類する際に、その行ブロックに含まれる行についての順序の情報も取得しているため、この情報を利用する。
(2)同じカラムに属する行ブロック同士については、横書き文書であれば上から下、縦書き文書であれば右から左の順に優先順位を設定する。
(3)連続する2つの行ブロック間では、優先順位の高い方の行ブロックの末尾の行の次に、優先順位の低い方の行ブロックの先頭の行が優先されるように設定する。
(4)同じ段組に属するカラム同士については、横書き文書であれば左から右、縦書き文書であれば上から下の順に優先順位を設定する。
(5)連続する2つのカラム間では、優先順位の高い方のカラムの末尾の行ブロックの次に、優先順位の低い方のカラムの先頭の行ブロックが優先されるように設定する。
(6)同じページに属する段組については、横書き文書であれば上から下、縦書き文書であれば右から左の順に優先順位を設定する。
(7)連続する2つの段組間では、優先順位の高い方の段組の末尾のカラムの次に、優先順位の低い方の段組の先頭のカラムが優先されるように設定する。
(8)同じ文書画像ファイルに属するページ同士については、ページ番号の小さい順に優先順位が高くなるよう設定する。
(9)連続する2つのページ間では、優先順位の高いページの末尾の段組の次に、優先順位の低い方のページの先頭の段組が優先されるように設定する。
<3-7. Line ordering processing section>
The line ordering processing unit 38 shown in FIG. 33 analyzes the order of lines in the entire document from the column, column, line block, and line positional relationship, and generates the line order list by the following (1). To (9).
(1) For the rows belonging to the same row block, priorities are set in the order from top to bottom for horizontal writing documents and from right to left for vertical writing documents. Here, as described above, since the information on the order of the rows included in the row block is already acquired when the data is classified into the row blocks, this information is used.
(2) For row blocks belonging to the same column, priorities are set in order from top to bottom for horizontal writing documents and from right to left for vertical writing documents.
(3) Between two consecutive row blocks, the first row of the row block with the lower priority is set to be given priority after the last row of the row block with the higher priority.
(4) For columns belonging to the same column, priorities are set in order from left to right for horizontally written documents and from top to bottom for vertically written documents.
(5) Between two consecutive columns, the first row block of the lower priority column is set to be given priority after the last row block of the higher priority column.
(6) For columns belonging to the same page, priorities are set in order from top to bottom for horizontal writing documents and from right to left for vertical writing documents.
(7) Between two consecutive columns, setting is performed so that the first column in the column with the lower priority is given priority after the column at the end of the column with the higher priority.
(8) For pages belonging to the same document image file, settings are made so that the priorities are higher in order of increasing page numbers.
(9) Between two consecutive pages, setting is made so that the top column of the page with the lower priority is given priority after the last column of the page with the higher priority.

行順序付け処理部38は、上記のルール(1)〜(9)に従って、ページの順序、段組の順序、カラムの順序、行ブロックの順序を決定し、それらにより行の順序付けを行う。順序付けされた行は、各行が属する行ブロック、カラム、段組及びページの順序を示す番号を保有すると共に、先頭から順に各行の行IDを行順序リストに格納する。
行順序リストは、下記の規定(a)〜(c)に従う形式であれば特に構造は問わない。
(a)上記順序付けルールに従って決定された順序通りに行を呼び出すことができる。
(b)呼び出した行について、その座標情報や種類(文字列行か図表行か)等の各種情報を参照することができる。
(c)呼び出した行について、段落情報(後述)を格納することができる。
The row ordering processing unit 38 determines the order of pages, the order of columns, the order of columns, and the order of row blocks in accordance with the above rules (1) to (9), and performs ordering of rows by them. The ordered rows hold numbers indicating the order of row blocks, columns, columns and pages to which each row belongs, and store the row ID of each row in the row order list in order from the top.
The structure of the line order list is not particularly limited as long as it conforms to the following rules (a) to (c).
(A) Rows can be called in the order determined according to the ordering rules.
(B) With respect to the called line, various information such as coordinate information and type (whether it is a character string line or a chart line) can be referred to.
(C) Paragraph information (described later) can be stored for the called line.

<3−8.処理例>
行順序付け処理部38が、上記の規定に従って、図36の構成の文書画像について行順序リストを生成した例を、図37に示す。行順序リストは、決定された順序の先頭から順に、行のIDと、行の情報として、所属する行ブロックID、行の種別(文字列行であるか図表行であるか)、及び行の範囲を示す外接矩形の左上座標及び右下座標、の情報とを格納し、さらに行毎に段落情報を格納している。なお、図37の例では、改行が発生するときに、その行から新たな段落が始まるとして、段落情報を改行の有無を有る(Yes)か無し(No)かの2通りで示しており、事前に「No」で初期化している。図38のように行ブロックの情報やカラムの情報、段組の情報を別途作成し、相互参照により各行及び各行ブロックが所属するカラム、段組、ページを参照できるようにしておくことで、冗長の少ない行順序リストを構成することができる。もちろん、行順序リスト単独で各行に関する情報を全て抽出できるようにしてもよい。
<3-8. Processing example>
FIG. 37 shows an example in which the line ordering processing unit 38 generates a line order list for the document image having the configuration shown in FIG. 36 in accordance with the above rules. The line order list includes, from the head of the determined order, the line ID, the line block ID to which the line belongs, the line type (whether it is a character string line or a chart line), and the line information The information of the upper left coordinate and the lower right coordinate of the circumscribed rectangle indicating the range is stored, and the paragraph information is stored for each line. In the example of FIG. 37, when a line break occurs, a new paragraph starts from that line, and paragraph information is shown in two ways, whether or not there is a line break (Yes) or not (No), It is initialized with “No” in advance. As shown in FIG. 38, by separately creating row block information, column information, and column information, it is possible to refer to the columns, columns, and pages to which each row and each row block belong by cross-reference. It is possible to construct a line order list with a small number of lines. Of course, all the information regarding each line may be extracted by the line order list alone.

<3−9.段落解析処理部>
図33に示される段落解析処理部39は、各行の前後の位置関係等の情報から、その行の位置で改行が発生しているかどうかを判定し、文書画像中の各行を1つ以上の段落に分類する処理を行う。具体的には、行順序リストから複数の行を参照して段落の切れ目、すなわち改行位置を判定し(改行判定処理)、段落毎に行の順序を記述した文書構造ツリーを生成する(文書構造ツリー生成処理)。
<3-9. Paragraph analysis processing section>
The paragraph analysis processing unit 39 shown in FIG. 33 determines whether or not a line break has occurred at the position of the line from information such as the positional relationship before and after each line, and sets each line in the document image to one or more paragraphs. Perform processing to classify. Specifically, a plurality of lines are referenced from the line order list to determine paragraph breaks, that is, line break positions (line break determination processing), and generate a document structure tree describing the line order for each paragraph (document structure) Tree generation processing).

ところで、文書中の図表は、必ずしも段落の切れ目に配置されるとは限らず、例えばページの端に挿入される場合が多く、それにより文章が図表を挟んで前後に分かれることがある。この順序のまま行を呼び出し、行を構成する要素(文字、図表)を挿入していくと、図表の挿入によって不自然に途切れた文章が出力されてしまう。そこで、本実施の形態では、段落毎に、文字列行と図表行とが混在した順序ではなく、文字列行の順序と図表行の順序をそれぞれ別に保有する文書構造ツリーを生成する。図39は、文書構造ツリーの構造を示す図である。それにより、文書画像を構成する文字列のみの順序を把握しながら、その段落に係る図表を、段落の先頭や末尾等にまとめて配置できるようにする。   By the way, charts in a document are not necessarily arranged at paragraph breaks, and are often inserted, for example, at the end of a page, so that a sentence may be divided before and after the chart. If the lines are called in this order and the elements (characters, charts) constituting the lines are inserted, sentences that are unnaturally interrupted by the insertion of the charts are output. Therefore, in the present embodiment, for each paragraph, a document structure tree is generated in which the order of character string lines and the order of chart lines are held separately, not the order in which character string lines and chart lines are mixed. FIG. 39 is a diagram showing the structure of a document structure tree. Thereby, while grasping the order of only the character strings constituting the document image, the chart relating to the paragraph can be arranged collectively at the beginning or end of the paragraph.

<3−10.改行判定処理>
図40は、段落解析処理部39における、改行判定処理の概要を示すイメージ図である。改行判定処理は、判定の対象となる注目行と、注目行より前に順序づけられるM個の行と、注目行より後に順序づけられるN個の行と、のM+N+1個の行によって判定される。なお、図40に示す例では、M=N=2としている。なお、改行判定の対象となる行、及びその前後の行は、いずれも文字列行である。本実施の形態では、M+N+1個の行IDバッファL[0],L[1]・・・,L[M+N]を記憶部12に備え、行順序リストで参照されるM+N+1個の行IDをそれぞれ格納することで、注目行と、注目行の前後の行との比較を行う。
<3-10. Line feed judgment processing>
FIG. 40 is an image diagram showing an outline of a line feed determination process in the paragraph analysis processing unit 39. The line break determination process is determined by M + N + 1 lines of a target line to be determined, M lines ordered before the target line, and N lines ordered after the target line. In the example shown in FIG. 40, M = N = 2. Note that the line that is subject to line feed determination and the lines before and after it are both character string lines. In the present embodiment, M + N + 1 row ID buffers L [0], L [1]..., L [M + N] are provided in the storage unit 12, and M + N + 1 row IDs referenced in the row order list are respectively provided. By storing, the attention line is compared with the lines before and after the attention line.

以下、段落解析処理部39の処理内容について詳細に説明する。図41は、段落解析処理部39の処理手順を示すフローチャートである。段落解析処理の開始にあたり、事前に初期化を済ませておく。具体的には、リスト参照番号をLNOW=1とし、行IDバッファには全て無効行(0)を格納しておく。初期化が終わると、注目行にあたる行IDバッファL[M]に、行IDを選択して格納する(S1)。任意の行IDバッファL[k](k=0,1,・・・,M+N)の選択方法は以下の(1A)〜(1C)の通り行われる。
(1A)行順序リストにおいて、第LNOW番目から順に、文字列行を探索する。
(1B)最初に見つかった文字列行の行IDを行IDバッファL[k]に格納し、そのときの行順序リストの位置(リスト番号)に1を加えた番号を新たなリスト参照番号LNOWとして更新する。
(1C)文字列行が見つからないまま行順序リストの末尾まで探索が終了した場合、行IDバッファL[k]には無効行(0)を格納する。
Hereinafter, the processing content of the paragraph analysis processing unit 39 will be described in detail. FIG. 41 is a flowchart showing the processing procedure of the paragraph analysis processing unit 39. Before starting the paragraph analysis process, initialize it in advance. Specifically, the list reference number is LNOW = 1, and all invalid rows (0) are stored in the row ID buffer. When the initialization is completed, the row ID is selected and stored in the row ID buffer L [M] corresponding to the target row (S1). A method of selecting an arbitrary row ID buffer L [k] (k = 0, 1,..., M + N) is performed as follows (1A) to (1C).
(1A) In the line order list, the character string lines are searched in order from the LNOWth.
(1B) The row ID of the first found character string row is stored in the row ID buffer L [k], and a number obtained by adding 1 to the position (list number) of the row order list at that time is a new list reference number LNOW. Update as.
(1C) When the search is completed up to the end of the line order list without finding a character string line, an invalid line (0) is stored in the line ID buffer L [k].

行L[M]の更新後、行L[M]が有効行(ゼロでない行IDを持つ行)であるかどうかを判定し(S2)、有効行である場合(S2の判定がYES)、S3に移る。一方、L[M]が無効行である場合(S2の判定がNO)、入力した文書画像には文字列行が存在しない図表行のみの文書画像であるとして、文書構造ツリーの生成処理(後述)を実行する(S7)。   After updating the row L [M], it is determined whether or not the row L [M] is a valid row (a row having a non-zero row ID) (S2). If the row L [M] is a valid row (YES in S2), Move on to S3. On the other hand, when L [M] is an invalid line (NO in S2), the document structure tree generation process (described later) is performed assuming that the input document image is a document image of only a chart row in which no character string row exists. ) Is executed (S7).

次に、注目行より後の行に当たる行IDバッファL[M+1],・・・,L[M+N]に、行IDを選択して格納する(S3)。各バッファにおける行IDの選択方法は上記と同様であるため省略する。続いて、注目行L[M]の改行判定を実行する(S4)。改行判定は、改行判定対象となる注目行L[M]と、注目行より前に位置する行L[0],・・・,L[M−1]及び注目行より後に位置する行L[M+1],・・・,L[M+N]からなる複数の行を用いた公知の方法で行うことができる。簡単な例として、改行判定対象のインデントの有無を確認する方法がある。行L[M]の開始位置が、他の行に比べて文書第1方向に正値のずれが生じている場合に、行L[M]はインデントを持ち、行L[M]の位置で改行がなされているとみなすことができる。また、改行判定対象行L[M]の1つ前の行L[M−1]が、他の行に比べて短い場合、行L[M]の位置で改行がなされているとみなすことができる。例えば、図40(M=N=2)のような横書きの文字列行が存在している場合、注目行L[2]の開始位置が、他の行に比べて右側(横書きの場合の正方向)にずれており、また1行前の行L[1]が他の行に比べて短いという特徴を持っており、これらの結果から、注目行L[2]は総合的に改行位置であるとして判定され易くなる。なお、文書編集者の好み等により段落の先頭行でインデントが付加されない場合もあり、また1つ前の段落の最終行が必ずしも短くなるとは限らないため注意する。   Next, the row ID is selected and stored in the row ID buffers L [M + 1],..., L [M + N] corresponding to the row after the target row (S3). Since the selection method of the row ID in each buffer is the same as described above, the description is omitted. Subsequently, line feed determination for the target line L [M] is executed (S4). Line break determination is performed by the attention line L [M] to be the line break determination target, the lines L [0],..., L [M−1] positioned before the target line, and the line L [ M + 1],..., L [M + N] can be performed by a known method using a plurality of rows. As a simple example, there is a method of confirming whether or not there is an indent to be detected as a line feed. When the start position of the line L [M] has a positive shift in the first direction of the document compared to the other lines, the line L [M] has an indent, and the position of the line L [M] It can be considered that a line feed has been made. In addition, when the line L [M−1] immediately before the line feed determination target line L [M] is shorter than the other lines, it may be considered that a line break is made at the position of the line L [M]. it can. For example, when there is a horizontally written character string line as shown in FIG. 40 (M = N = 2), the start position of the target line L [2] is on the right side (the correct line in the case of horizontal writing) as compared to the other lines. And the previous line L [1] is shorter than the other lines. From these results, the target line L [2] It becomes easy to determine that there is. Note that indentation may not be added to the first line of a paragraph depending on the preference of the document editor, and the last line of the previous paragraph is not necessarily shortened.

他に改行位置であるかどうかの判定の例として、注目行の文字サイズが周辺の行に比べて大きく異なるかどうかを判定することで、見出し行のように文字サイズが大きくなっている行、また補足コメント等のように逆に文字サイズが小さくなっている行等で改行位置と判定することができる。また、周辺の連続する2つの行の行間距離に比べて、注目行とその1つ前の行との行間距離が大きくなっている場合に、1つ前の行で段落が終了している可能性が高くなる。上記挙げられた条件を例として、様々な条件を複合的に判定して、注目行における改行の有無を設定するのが好ましい。   Another example of determining whether or not it is a line feed position is a line that has a large character size, such as a heading line, by determining whether the character size of the target line is significantly different from the surrounding lines, On the contrary, a line break position can be determined by a line having a smaller character size such as a supplementary comment. In addition, when the distance between the target line and the previous line is larger than the distance between two adjacent consecutive lines, the paragraph may end at the previous line. Increases nature. Taking the above-mentioned conditions as an example, it is preferable to determine whether or not there is a line break in the line of interest by determining various conditions in combination.

行L[M]の改行判定の結果は、行順序リストのL[M]に該当する行情報に段落情報として反映させる。段落情報は段落の切れ目が判るものであれば何でもよく、最も簡単な例として、改行の有無をYesあるいはNoの2通りで示すだけでもよい。   The result of line feed determination for line L [M] is reflected as paragraph information in the line information corresponding to L [M] in the line order list. The paragraph information may be anything as long as the break of the paragraph is known. As the simplest example, the presence / absence of a line feed may be indicated in two ways, Yes or No.

改行判定対象行L[M]の改行判定が終了すると、注目行の次の行L[M+1]が有効行であるかどうかを判定し(S5)、L[M+1]が有効行である場合(S5の判定がYES)、行IDバッファの更新を行い、次の行についての改行判定を行う準備をする(S6)。行IDバッファの更新は、具体的には、図42に示すように、L[0]=L[1],・・・,L[M+N−1]=L[M+N]としてバッファを1つずつずらすとともに、バッファL[M+N]を新たに行順序リストから選択する。バッファL[M+N]の選択方法は前述の方法と同様であるため省略する。バッファの更新後、S4に戻り、更新された注目行L[M]について、改行判定を行う。これを、S5で判定がNOとなるまで反復する。S5の判定がNOとなると、全ての文字列行について改行判定が終了したことになり、文書構造ツリーの生成処理を実行する(S7)。   When the line feed determination of the line feed determination target line L [M] is completed, it is determined whether or not the line L [M + 1] next to the target line is a valid line (S5), and if L [M + 1] is a valid line ( If the determination in S5 is YES), the line ID buffer is updated, and preparations are made for line feed determination for the next line (S6). Specifically, as shown in FIG. 42, the row ID buffer is updated by setting L [0] = L [1],..., L [M + N−1] = L [M + N] one by one. At the same time, the buffer L [M + N] is newly selected from the row order list. Since the method for selecting the buffer L [M + N] is the same as that described above, a description thereof will be omitted. After updating the buffer, the process returns to S4, and a line feed is determined for the updated attention line L [M]. This is repeated until the determination is NO in S5. If the determination in S5 is NO, the line feed determination has been completed for all the character string rows, and the document structure tree generation process is executed (S7).

<3−11.文書構造ツリー生成処理>
段落解析処理部39による文書構造ツリー生成処理は、段落情報を考慮した行順序リストに格納された段落情報に従って実行される。但し、文書構造ツリーは事前に、図43に示すような1つの空の段落(第0段落)を持つ状態に初期化されているものとする。初期段落番号をPNOW=0として、行順序リストの先頭から順に行の情報を参照し、段落情報から該行が段落開始行と判定された場合(段落情報がYES)のみ、PNOW=PNOW+1として段落番号の更新を行い、また文書構造ツリーに空の段落(第PNOW段落)を新たに追加する。そして、該行が文字列行である場合、文書構造ツリーの第PNOW段落が持つ文字列ツリーの末尾に該行の行IDを追加する。一方、該行が図表行である場合、文書構造ツリーの第PNOW段落が持つ図表ツリーの末尾に該行の行IDを追加する。これを行順序リストの各行について反復し、末尾まで探索が終了すると、文書構造ツリーの生成処理を終了する。なお、文字列行の改行位置から次の改行位置までが1つの段落となるので、図表行が段落の分類から漏れるということはない。そのため、ひと固まりの文字列行の後に図表行があり、その後新しい段落が始まる(改行が発生する)場合は、その図表行は1つ前の段落に含まれることになる。
<3-11. Document structure tree generation processing>
The document structure tree generation process by the paragraph analysis processing unit 39 is executed according to the paragraph information stored in the line order list considering the paragraph information. However, it is assumed that the document structure tree is initialized in advance to have a single empty paragraph (0th paragraph) as shown in FIG. The initial paragraph number is set to PNOW = 0, the line information is referred to in order from the top of the line order list, and the paragraph is set to PNOW = PNOW + 1 only when the line is determined to be the paragraph start line from the paragraph information (the paragraph information is YES). The number is updated, and an empty paragraph (the PNOW paragraph) is newly added to the document structure tree. If the line is a character string line, the line ID of the line is added to the end of the character string tree held in the PNOW paragraph of the document structure tree. On the other hand, when the line is a chart line, the line ID of the line is added to the end of the chart tree of the PNOW paragraph of the document structure tree. This is repeated for each line in the line order list, and when the search is completed to the end, the document structure tree generation process is terminated. Note that a line from the line feed position of the character string line to the next line feed position is one paragraph, so that the chart line is not leaked from the paragraph classification. Therefore, when there is a chart row after a group of character strings and a new paragraph starts (a line break occurs), the chart row is included in the previous paragraph.

<3−12.処理例>
段落解析処理部39が実行する処理の具体例として、図28の構成の文書画像(図37に示す初期の行順序リストを持つ)に段落解析処理部39での処理を適用する場合について説明する。見出しに当たる行ID:101、行ID104、行ID:129の各行は、行の文字サイズや1つ前の行間距離等の条件から、改行位置と判定される。また行ID:106、行ID:112、行ID:119及び行ID:131の各行は、前後の複数の行に比べ、行の開始位置が文書第1方向において正方向にシフトしている。よってインデントが存在するとして、改行位置と判定される。行ID:102の行も、見出し行の行ID:101の次の行であることから、改行位置と判定することができる。従って、行ID:101、102、104、106、112、129、131、119の各行が改行位置として設定され、行順序リストの段落情報は、図44のように更新される。
<3-12. Processing example>
As a specific example of the processing executed by the paragraph analysis processing unit 39, a case where the processing in the paragraph analysis processing unit 39 is applied to a document image having the configuration shown in FIG. 28 (having the initial line order list shown in FIG. 37) will be described. . Each line of the line ID: 101, line ID 104, and line ID: 129 corresponding to the headline is determined to be a line feed position based on conditions such as the character size of the line and the distance between the previous lines. In addition, the line ID: 106, the line ID: 112, the line ID: 119, and the line ID: 131 have their line start positions shifted in the positive direction in the first document direction as compared to the preceding and following lines. Therefore, it is determined that there is a line break position because there is an indent. Since the line with the line ID: 102 is also the line next to the line ID: 101 of the heading line, it can be determined as a line feed position. Therefore, each line of line ID: 101, 102, 104, 106, 112, 129, 131, 119 is set as a line feed position, and the paragraph information of the line order list is updated as shown in FIG.

例えば、行順序リストが図44のように、段落情報として改行の有無(YesもしくはNo)が表されている場合、改行がある行から新しい段落が開始するとみなせるため、改行がある(Yes)場合に該行が段落開始行として判定することができる。また、段落が開始してから、次の改行位置が見つかるまでの行を同一の段落の範囲とみなす。更新された行順序リストの段落情報に従い、図28の文書画像を段落毎に分類すると、図3Aに示すように分類することができる。図3Aにおいて、段落R7は、左下の3行の文字列行(行ID:131,133,135)から、右上の図表行(行ID:105)及び4行の文字列行(行ID:111,113,115,117)までを同一の段落の範囲としており、行ID:135と行ID:111との文字列行の間に改行位置は存在しないため、一続きの文章を構成することが可能となる。更に、この行順序リストに従って文書構造ツリーを生成すると、図45に示すような文書構造ツリーを得ることができる。   For example, as shown in FIG. 44, when the line order list indicates whether or not there is a line break (Yes or No) as paragraph information, it can be considered that a new paragraph starts from a line with a line break, and therefore there is a line break (Yes). The line can be determined as the paragraph start line. Also, the line from the start of the paragraph until the next line feed position is found is regarded as the same paragraph range. If the document image of FIG. 28 is classified for each paragraph according to the updated paragraph information of the line order list, it can be classified as shown in FIG. 3A. In FIG. 3A, the paragraph R7 starts from the lower left three character string lines (line ID: 131, 133, 135), the upper right chart line (line ID: 105), and the four character string lines (line ID: 111). , 113, 115, 117) are the same paragraph range, and there is no line break position between the character string lines of line ID: 135 and line ID: 111, so that a series of sentences can be formed. It becomes possible. Furthermore, when a document structure tree is generated according to this line order list, a document structure tree as shown in FIG. 45 can be obtained.

[4.リスト生成部]
リスト生成部36は、図44の行順序リストおよび図45の文書構造ツリーに従って、各行を呼び出し、呼び出した行が文字列行である場合は対応する文字列行の先頭から順に文字を呼び出し、呼び出した行が図表行である場合は対応する図又は表を呼び出して、各要素の参照情報(要素を呼び出すための情報)を順に記述した参照リストを生成する。更に、要素が、改行位置が含まれる行の末尾の要素である場合、改行命令を挿入して参照リストを生成する。
[4. List generator]
The list generation unit 36 calls each line according to the line order list of FIG. 44 and the document structure tree of FIG. 45. If the called line is a character string line, the list generation unit 36 calls the characters in order from the top of the corresponding character string line. If the row is a diagram row, the corresponding diagram or table is called to generate a reference list in which the reference information (information for calling the element) of each element is described in order. Further, when the element is the last element of the line including the line feed position, a line feed command is inserted to generate the reference list.

具体的には、リスト生成部36は、図45に示される文書構造ツリーに示される段落番号(R1〜R8)の順に各段落を注目段落としていく。リスト生成部36は、注目段落において、各文字列行を行ID(図44)の順に参照していき、参照している文字列行の先頭から順に要素の参照情報を参照リストに記述していく(つまり、参照している文字列行について全ての要素の記述を終えると、次の文字列行を参照する)。リスト生成部36は、注目段落において、文字列行を全て参照した後、図表行の要素の参照情報を参照リストに記述していく。そして、全ての段落を注目段落として扱って処理し終えると、参照リストが完成することになる。作成される参照リストにおいては、各要素に対してリスト番号(図4参照)を対応付けることになるが、このリスト番号は参照リストに対して記述された順序を示した番号である。また、参照リストに記述される要素の参照情報は、図4に示すように、要素種別、左上座標、横幅および高さとなる。横幅および高さではなく、右下座標が記述されてもよい。なお、リスト生成部36は、参照リストに対して参照情報を記述している要素が、段落を有する(段落情報がYesである)文字列行の末尾である場合、若しくは、図表である場合、次に記述する要素を「改行」とする。これにより、リスト生成部36は、図4に示す参照リストを作成できるようになっている。   Specifically, the list generation unit 36 sets each paragraph as a target paragraph in the order of the paragraph numbers (R1 to R8) shown in the document structure tree shown in FIG. The list generation unit 36 refers to each character string row in the order of the row ID (FIG. 44) in the target paragraph, and describes element reference information in the reference list in order from the beginning of the character string row being referred to. (In other words, when all the elements are described for the character string being referred to, the next character string is referred to). The list generator 36 refers to all the character string rows in the target paragraph, and then describes the reference information of the elements of the chart row in the reference list. When all the paragraphs are handled as the target paragraph and processed, the reference list is completed. In the created reference list, a list number (see FIG. 4) is associated with each element, and this list number is a number indicating the order described in the reference list. Further, the reference information of the elements described in the reference list includes the element type, the upper left coordinate, the horizontal width, and the height as shown in FIG. Instead of the horizontal width and height, the lower right coordinate may be described. The list generation unit 36, when the element describing the reference information with respect to the reference list is the end of a character string line having a paragraph (the paragraph information is Yes) or a chart, The element to be described next is “new line”. As a result, the list generation unit 36 can create the reference list shown in FIG.

また、リスト生成部36は、図5に示す参照リストを作成するようになっていてもよい。この場合、リスト生成部36は、各要素の参照情報として記述する段落IDを、直前に参照情報を記述した要素の段落IDと同じとする(初期値は1)。但し、リスト生成部36は、段落を有する(段落情報がYesである)文字列行の末尾の要素の次の要素については、前の要素の段落IDに1を加算した段落IDを記述する。また、リスト生成部36は、文字の次の図表については、当該文字の段落(図5の段落ID7)に属する小段落のID(図5の段落7−2)を記述し、図表の次の文字については、当該図表の小段落の属する段落の段落IDに1を加算した段落IDを記述することとなる。   Further, the list generation unit 36 may generate a reference list shown in FIG. In this case, the list generation unit 36 sets the paragraph ID described as the reference information of each element to be the same as the paragraph ID of the element in which the reference information was described immediately before (initial value is 1). However, the list generation unit 36 describes the paragraph ID obtained by adding 1 to the paragraph ID of the previous element for the element next to the last element of the character string row having a paragraph (paragraph information is Yes). Further, the list generation unit 36 describes the ID of a small paragraph (paragraph 7-2 in FIG. 5) belonging to the paragraph (paragraph ID 7 in FIG. 5) of the character for the chart next to the character, For characters, a paragraph ID is added by adding 1 to the paragraph ID of the paragraph to which the small paragraph of the chart belongs.

リスト生成部36は、以上のようにして作成した参照リスト(図4または図5)を、当該参照リストに対応する文書ファイル(文書画像のデータ)と対応付けて記憶部12に保存する。これにより、レイアウト変更部111は、参照リストを用いてレイアウト変更処理を行うことが可能になる。なお、参照リストは、例えばCSV形式のデータとして出力されるようになっている。   The list generation unit 36 stores the reference list (FIG. 4 or FIG. 5) created as described above in the storage unit 12 in association with the document file (document image data) corresponding to the reference list. Thereby, the layout change unit 111 can perform the layout change process using the reference list. The reference list is output as CSV format data, for example.

以上のようにして作成された参照リストを用いてレイアウト変更処理を行うことにより、図3Aに示すように段組構成を持つ文書画像についても適切な順序で各要素を再配置できることになる。これに対し、特許文献1等の先行技術によれば、横書きの場合、左から右へ順序付け且つ上から下へ順序づけられた位置座標リストを用いて再配置しているだけであるため、段組構成を持つ文書については適用が困難である。   By performing the layout changing process using the reference list created as described above, each element can be rearranged in an appropriate order even for a document image having a column structure as shown in FIG. 3A. On the other hand, according to the prior art such as Patent Document 1, in the case of horizontal writing, it is simply rearranged using a position coordinate list that is ordered from left to right and from top to bottom. It is difficult to apply to documents with a structure.

〔変形例〕
図1のレイアウト変更部111は、レイアウト変更処理前の文書画像に図表が示されている場合、レイアウト変更処理によって、文書画像には、図表の代わりに、前記図表のサムネイルを配置させるようになっていてもよい。この場合、表示制御部112は、表示部14aにリフロー形式で文書画像を表示させている際に前記サムネイルがユーザにタッチ(選択)されたことを入力信号から検出した場合、前記サムネイルに対応する前記図表を表示部14aに表示させるようになっている。
[Modification]
The layout changing unit 111 in FIG. 1 arranges thumbnails of the chart in the document image instead of the chart by the layout changing process when the chart is shown in the document image before the layout changing process. It may be. In this case, when the display control unit 112 detects that the thumbnail is touched (selected) by the user while displaying the document image in the reflow format on the display unit 14a, the display control unit 112 corresponds to the thumbnail. The chart is displayed on the display unit 14a.

これにより、図表のサイズが大きい場合、図表を無理に文書内に挿入せずに、サムネイルが選択された場合にのみ該当する図表をリンク表示させることにより、文書および図表の視認性を向上させることができる。なお、図1の表示制御部112は、前記サムネイルがユーザに選択された場合、スクロール無しで図表の全体を表示部14aに表示させることができる程度に前記図表を拡大または縮小した上で表示部14aに表示させるようになっていてもよいし、垂直および/または水平方向のスクロールが必要なサイズで図表を表示部14aに表示させるようになっていてもよい。   As a result, when the size of a diagram is large, it is possible to improve the visibility of the document and the diagram by linking the corresponding diagram only when a thumbnail is selected without forcibly inserting the diagram into the document. Can do. The display control unit 112 in FIG. 1 enlarges or reduces the chart to such an extent that the entire chart can be displayed on the display unit 14a without scrolling when the thumbnail is selected by the user. 14a may be displayed, or a chart may be displayed on the display unit 14a in a size that requires vertical and / or horizontal scrolling.

また、タッチパネル以外のユーザインターフェイスが用いられてもよい。例えば、マウスやキーボード等の入力手段を用いてもよい。この場合、図1の表示部14aにスクロールバーを表示することによってユーザにスクロール指示を行わせることができる。また、表示倍率を入力するためのボックスおよび変倍処理ボタンを示したGUIを表示させ、このGUIによって変倍の指示を入力可能である。   A user interface other than the touch panel may be used. For example, input means such as a mouse or a keyboard may be used. In this case, a scroll instruction can be given to the user by displaying a scroll bar on the display unit 14a of FIG. Further, a GUI for displaying a box for inputting a display magnification and a scaling process button is displayed, and an instruction for scaling can be input using this GUI.

また、以上の各実施形態では、携帯端末10は、図2に示すように、略長方形の表示部14aの長辺方向を表示部14aの垂直方向(スクロール方向)とし、表示部14aの短辺方向を表示部14aの水平方向として、文書画像を表示させているが、勿論、表示部14aの短辺方向を表示部14aの垂直方向(スクロール方向)とし、表示部14aの長辺方向を表示部14aの水平方向として、文書画像を表示させることも可能である。但し、この場合においても、図49に示されるように、表示部14aに表示される左横書の文書画像の右側から左側に向けた方向を左方向とし、その逆方向を右方向とし、当該左横書きの文書画像の上側から下側に向けた方向を下方向とし、その逆方向を上方向とする(なお、図49に示す上下左右の各方向は、短辺方向を垂直方向として長辺方向を水平方向とした略長方形の表示部14aに縦書きの文書画像を表示させる場合の当該縦書きの文書画像における上下左右の各方向とも一致することになる)。   Further, in each of the above embodiments, as shown in FIG. 2, the mobile terminal 10 sets the long side direction of the substantially rectangular display unit 14a as the vertical direction (scroll direction) of the display unit 14a, and the short side of the display unit 14a. The document image is displayed with the direction as the horizontal direction of the display unit 14a. Of course, the short side direction of the display unit 14a is set as the vertical direction (scroll direction) of the display unit 14a, and the long side direction of the display unit 14a is displayed. It is also possible to display a document image as the horizontal direction of the section 14a. In this case, however, as shown in FIG. 49, the direction from the right side to the left side of the left horizontal document image displayed on the display unit 14a is the left direction, and the opposite direction is the right direction. The direction from the upper side to the lower side of the left-side written document image is the downward direction, and the opposite direction is the upward direction (Note that each of the upper, lower, left, and right directions shown in FIG. When the vertically-written document image is displayed on the substantially rectangular display unit 14a having the horizontal direction, the vertical and horizontal directions in the vertically-written document image coincide with each other).

つまり、図2に示すように、表示部14aの長辺方向を表示部14aの垂直方向とし、表示部14aの短辺方向を表示部14aの水平方向とするケースでは、長辺方向と上下方向(垂直方向)とが一致し、短辺方向と左右方向(水平方向)とが一致することになるが、図49に示すように、表示部14aの長辺方向を表示部14aの水平方向とし、表示部14aの短辺方向を表示部14aの垂直方向とするケースでは、長辺方向と左右方向(水平方向)とが一致し、短辺方向と上下方向(垂直方向)とが一致することになる。   That is, as shown in FIG. 2, in the case where the long side direction of the display unit 14a is the vertical direction of the display unit 14a and the short side direction of the display unit 14a is the horizontal direction of the display unit 14a, the long side direction and the vertical direction (Vertical direction) matches, and the short side direction and left-right direction (horizontal direction) match, but as shown in FIG. 49, the long side direction of the display unit 14a is the horizontal direction of the display unit 14a. In the case where the short side direction of the display unit 14a is the vertical direction of the display unit 14a, the long side direction and the left-right direction (horizontal direction) match, and the short side direction and the vertical direction (vertical direction) match. become.

また、図1の制御部11は、上述の通り、CPUを用いてソフトウェアにて実現してもよいし、集積回路等に形成された論理回路によって実現してもよい。なお、ソフトウェアによる場合、携帯端末10は、前記ソフトウェアであるプログラムがコンピュータ(またはCPU)で読み取り可能に記録されたROMまたは記憶装置等の記録媒体を備えている。上記記録媒体としては、例えば、カード、ディスク、半導体メモリ、プログラマブルな論理回路などの「一時的でない有形の媒体」であってもよい。また、上記プログラムは、任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに伝送されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。   1 may be realized by software using a CPU as described above, or may be realized by a logic circuit formed in an integrated circuit or the like. In the case of software, the portable terminal 10 includes a recording medium such as a ROM or a storage device in which a program that is the software is recorded so as to be readable by a computer (or CPU). The recording medium may be a “non-temporary tangible medium” such as a card, a disk, a semiconductor memory, or a programmable logic circuit. The program may be transmitted to the computer via any transmission medium (communication network, broadcast wave, etc.). Note that one embodiment of the present invention can also be realized in the form of a data signal embedded in a carrier wave, in which the program is embodied by electronic transmission.

〔まとめ〕
本発明の態様1の携帯端末(表示制御装置)10によれば、文書を撮像して得られる文書画像をリフロー形式でコンテンツ表示領域に表示させるために前記文書画像のレイアウトを変更するレイアウト変更部111と、レイアウト変更後の文書画像をリフロー形式で前記コンテンツ表示領域に表示させる表示処理を行う表示制御部112とを備え、レイアウト変更部(変更部)111は、前記文書画像を構成する要素毎に、レイアウト変更後の文書画像全体のなかでの位置を示す配置座標(座標値)を求め、表示制御部112は、前記配置座標のうち、画像のスクロールの方向と平行な座標軸の座標値に、前記スクロールの量に応じたオフセット値を加算する加算処理を行い、前記加算処理後の配置座標を、前記コンテンツ表示領域と前記要素との位置関係を示す描画座標(表示用座標)として前記表示処理を行うことを特徴とする。
[Summary]
According to the mobile terminal (display control apparatus) 10 of the aspect 1 of the present invention, the layout changing unit that changes the layout of the document image in order to display the document image obtained by capturing the document in the content display area in the reflow format. 111, and a display control unit 112 that performs display processing for displaying the document image after the layout change in the reflow format in the content display area. The layout change unit (change unit) 111 includes elements for each element constituting the document image. Then, an arrangement coordinate (coordinate value) indicating a position in the entire document image after the layout change is obtained, and the display control unit 112 sets the coordinate value of the coordinate axis parallel to the scroll direction of the image among the arrangement coordinates. Then, an addition process for adding an offset value according to the scroll amount is performed, and the arrangement coordinates after the addition process are set as the content display area and the required element. And performing the display processing as rendering coordinates (display coordinates) showing the positional relationship between the.

本発明の一態様によれば、文書画像がスクロールされる場合、画像のスクロールの方向と平行な座標軸の座標値に加算されるオフセット値(各要素において共通)をスクロール量に応じて変更するだけで前記描画座標を更新できる。これに対し、従来構成では、スクロールがされる場合、各要素のx座標値およびy座標値を再演算することで表示用座標を更新するようになっている。それゆえ、本発明の一態様によれば、従来構成よりも処理負荷を抑制できる効果を奏する。   According to one aspect of the present invention, when a document image is scrolled, an offset value (common to each element) added to the coordinate value of the coordinate axis parallel to the scroll direction of the image is only changed according to the scroll amount. The drawing coordinates can be updated. On the other hand, in the conventional configuration, when scrolling is performed, the display coordinates are updated by recalculating the x-coordinate value and the y-coordinate value of each element. Therefore, according to one aspect of the present invention, the processing load can be suppressed more than in the conventional configuration.

また、本発明の態様2の携帯端末10においては、態様1に加え、レイアウト変更部111が、前記文書画像に対する変倍処理の指示が入力されると、前記変倍処理の表示倍率に応じて前記文書画像のレイアウトを変更するようになっており、表示制御部112は、前記変倍処理の前に前記コンテンツ表示領域に表示させている要素のなかからいずれか一つの要素を選択する選択処理を行い、前記選択処理にて選択した要素について、前記変倍処理の前の前記描画座標のうちの前記スクロールの方向と平行な座標軸の座標値と、前記変倍処理の後の前記描画座標のうちの前記スクロールの方向と平行な座標軸の座標値との差が所定範囲に収まるように、前記変倍処理の後の配置座標に加算されるオフセット値を調整するようになっていることを特徴とする。   In addition, in the mobile terminal 10 according to the second aspect of the present invention, in addition to the first aspect, when the layout changing unit 111 receives an instruction for a scaling process for the document image, the layout changing unit 111 according to the display magnification of the scaling process The layout of the document image is changed, and the display control unit 112 selects one of the elements displayed in the content display area before the scaling process. For the element selected in the selection process, the coordinate value of the coordinate axis parallel to the scroll direction of the drawing coordinates before the scaling process, and the drawing coordinates after the scaling process The offset value added to the arrangement coordinates after the scaling process is adjusted so that the difference between the coordinate values of the coordinate axes parallel to the scroll direction is within a predetermined range. And features.

本発明の態様2によれば、変倍処理前にユーザが注目していた要素が変倍処理によってコンテンツ表示領域外にはみ出してしまうことを抑制できるという効果を奏する。   According to the aspect 2 of the present invention, there is an effect that it is possible to prevent the element that the user has focused before the scaling process from protruding outside the content display area due to the scaling process.

また、本発明の態様3の携帯端末10においては、態様2に加え、前記コンテンツ表示領域はタッチパネル14における表示領域であり、タッチパネル14において互いに離れた2箇所以上の領域がタッチされることで前記変倍処理の指示が入力されるようになっており、前記選択処理は、前記文書画像の各要素のうち、前記変倍処理の指示におけるタッチパネル14のタッチ箇所の平均座標値に対応する位置からのユークリッド距離が最も小さい要素を選択する処理であることを特徴とする。   In addition, in the mobile terminal 10 according to the third aspect of the present invention, in addition to the second aspect, the content display area is a display area on the touch panel 14, and two or more areas separated from each other on the touch panel 14 are touched. A scaling process instruction is input, and the selection process starts from a position corresponding to an average coordinate value of a touched portion of the touch panel 14 in the scaling process instruction among the elements of the document image. This is a process for selecting an element having the smallest Euclidean distance.

本発明の態様3によれば、変倍処理前においてユーザが注目していた可能性の高い要素を高精度に選択できるという効果を奏する。   According to the aspect 3 of the present invention, there is an effect that it is possible to select with high accuracy elements that are likely to be noticed by the user before the scaling process.

本発明の態様4の携帯端末10においては、態様3に加え、表示制御部112は、前記平均座標値に対応する位置が前記文書画像のなかのいずれかの要素を囲う外接矩形の内側である場合、前記平均座標値に対応する位置からのユークリッド距離の最も小さい要素が前記外接矩形に囲われる要素でなくても、前記外接矩形に囲われる文字を前記選択処理において選択するようになっていることを特徴とする。   In the mobile terminal 10 according to the fourth aspect of the present invention, in addition to the third aspect, the display control unit 112 has a position corresponding to the average coordinate value inside the circumscribed rectangle surrounding any element in the document image. In this case, even if the element having the smallest Euclidean distance from the position corresponding to the average coordinate value is not the element surrounded by the circumscribed rectangle, the character surrounded by the circumscribed rectangle is selected in the selection process. It is characterized by that.

本発明の態様4によれば、変倍処理前においてユーザが注目していた可能性の高い要素をより高精度に選択できるという効果を奏する。   According to the aspect 4 of the present invention, there is an effect that an element that is likely to be noticed by the user before the scaling process can be selected with higher accuracy.

本発明の態様5の携帯端末10においては、態様1〜4に加えて、前記要素には少なくとも図表が含まれており、レイアウト変更部111は、前記図表に関しては、設定されている表示倍率とは関係なく、前記図表が前記スクロールの方向と直交する方向において前記表示領域に収まるように変倍し、当該変倍した前記図表について前記配置座標を求めることを特徴とする。   In the mobile terminal 10 according to the fifth aspect of the present invention, in addition to the first to fourth aspects, the element includes at least a chart, and the layout changing unit 111 is configured to display a set display magnification. Regardless of the above, the scale is scaled so that the chart fits in the display area in the direction orthogonal to the scroll direction, and the arrangement coordinates are obtained for the scaled chart.

本発明の態様5によれば、小型の表示装置の表示領域にリフロー形式で前記文書画像を表示させる場合であっても、前記スクロールの方向と直交する方向において前記図表を前記表示領域に収まるように表示させることが可能になるという効果を奏する。   According to the fifth aspect of the present invention, even when the document image is displayed in a reflow format on a display area of a small display device, the chart can be accommodated in the display area in a direction orthogonal to the scroll direction. It is possible to display on the screen.

本発明の態様6の携帯端末10においては、レイアウト変更部111は、レイアウト変更前の文書画像に図表が示されている場合、前記レイアウト変更後の文書画像には前記図または表の代わりに前記図表のサムネイルを配置させ、表示制御部112は、前記コンテンツ表示領域に表示させているサムネイルがユーザに選択されると、前記サムネイルに対応する前記図表を前記コンテンツ表示領域に表示させることを特徴とする。   In the mobile terminal 10 according to the sixth aspect of the present invention, when a diagram is shown in the document image before the layout change, the layout change unit 111 displays the document image after the layout change in the document image instead of the figure or the table. A thumbnail of a chart is arranged, and when the user selects a thumbnail displayed in the content display area, the display control unit 112 displays the chart corresponding to the thumbnail in the content display area. To do.

本発明の態様6によれば、図表のサイズが大きい場合、図表を無理に文書内に挿入せずに、サムネイルが選択された場合にのみ該当する図表をリンク表示させることにより、文書、図表の視認性を向上させることができる。また、表示制御部112は、前記サムネイルがユーザに選択された場合、スクロール無しで図表の全体を前記コンテンツ表示領域に表示させることができる程度に前記図表を拡大または縮小した上でコンテンツ表示領域に表示させるようになっていてもよいし、垂直および/または水平方向のスクロールが必要なサイズで図表をコンテンツ表示領域に表示させるようになっていてもよい。   According to Aspect 6 of the present invention, when the size of a diagram is large, the corresponding diagram is displayed in a linked manner only when a thumbnail is selected without forcibly inserting the diagram into the document. Visibility can be improved. In addition, when the thumbnail is selected by the user, the display control unit 112 enlarges or reduces the chart to the content display area so that the entire chart can be displayed in the content display area without scrolling. The display may be displayed, or the chart may be displayed in the content display area at a size that requires vertical and / or horizontal scrolling.

本発明の態様7の携帯端末10においては、態様1〜6に加え、前記文書画像と、前記文書画像を構成する要素の並び順を示す並び順情報とを対応付けて記憶する記憶部を備え、レイアウト変更部111は、前記並び順情報に示される並び順に従って前記文書画像のレイアウトを変更することを特徴とする。   The portable terminal 10 according to the seventh aspect of the present invention includes a storage unit that stores the document image and the arrangement order information indicating the arrangement order of the elements constituting the document image in association with each other in addition to the first to sixth aspects. The layout changing unit 111 changes the layout of the document image according to the arrangement order indicated by the arrangement order information.

本発明の態様7によれば、文書を構成する各要素(文字等)の並び順を崩すことなく、適切に文書画像のレイアウトを変更できるという効果を奏する。   According to the aspect 7 of the present invention, there is an effect that the layout of the document image can be appropriately changed without breaking the arrangement order of the elements (characters, etc.) constituting the document.

本発明の態様8の携帯端末10においては、態様1〜7に加えて、前記文書を撮像することによって前記文書画像を生成する画像入力部を備えたことを特徴とする。   The portable terminal 10 according to the eighth aspect of the present invention is characterized in that, in addition to the first to seventh aspects, an image input unit that generates the document image by capturing the document is provided.

本発明の態様8によれば、撮影による文書画像の生成とリフロー表示とを実現する一体型ツールを提供できるため、データの取捨選択や撮り直しの作業を効率よく行うことができるという効果を奏する。   According to the aspect 8 of the present invention, since an integrated tool that realizes generation of a document image by photographing and reflow display can be provided, the effect of efficiently selecting and re-taking data can be achieved. .

本発明の態様9の携帯端末(表示制御装置)10によれば、表示部14aと、文書を撮像して得られる文書画像をリフロー形式でコンテンツ表示領域に表示させるために前記文書画像のレイアウトを変更するレイアウト変更部111と、レイアウト変更後の文書画像をリフロー形式で表示部14aのコンテンツ表示領域に表示させる表示処理を行う表示制御部112とを備え、レイアウト変更部(変更部)111は、前記文書画像を構成する要素毎に、レイアウト変更後の文書画像全体のなかでの位置を示す配置座標(xy座標値)を求め、表示制御部112は、前記配置座標のうち、画像のスクロールの方向と平行な座標軸の座標値に、前記スクロールの量に応じたオフセット値を加算する加算処理を行い、前記加算処理後の配置座標を、前記コンテンツ表示領域と前記要素との位置関係を示す描画座標(表示用座標)として前記表示処理を行うことを特徴とする。   According to the mobile terminal (display control device) 10 of the aspect 9 of the present invention, the layout of the document image is displayed in order to display the display unit 14a and the document image obtained by imaging the document in the content display area in the reflow format. A layout changing unit 111 to be changed and a display control unit 112 for performing a display process for displaying the document image after the layout change in the content display area of the display unit 14a in a reflow format. The layout changing unit (changing unit) 111 includes: For each element constituting the document image, an arrangement coordinate (xy coordinate value) indicating a position in the entire document image after the layout change is obtained, and the display control unit 112 performs image scrolling among the arrangement coordinates. An addition process for adding an offset value corresponding to the scroll amount to the coordinate value of the coordinate axis parallel to the direction is performed, and the arrangement coordinates after the addition process are Drawing coordinates indicating serial content display region and a positional relationship between the element and performs the display processing as (display coordinates).

本発明の態様1〜9に係る携帯端末10は、コンピュータによって実現してもよく、この場合には、コンピュータを携帯端末10が備える各部として動作させることにより上記表示制御装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。   The mobile terminal 10 according to aspects 1 to 9 of the present invention may be realized by a computer. In this case, the display control device is realized by a computer by causing the computer to operate as each unit included in the mobile terminal 10. A program and a computer-readable recording medium on which the program is recorded also fall within the scope of the present invention.

本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。   The present invention is not limited to the above-described embodiments, and various modifications can be made within the scope shown in the claims. That is, embodiments obtained by combining technical means appropriately modified within the scope of the claims are also included in the technical scope of the present invention.

本発明は、文書画像を表示部に表示させる表示制御装置に適用可能である。例えば、スマートフォン、携帯電話、タブレット、電子書籍用端末、ノート型パソコン等の携帯端末に好適である。汎用のパソコン、テレビ、電子黒板にも勿論適用可能であるし、文書画像を表示させる表示部を備えた複合機やスキャナ等にも勿論適用可能である。   The present invention is applicable to a display control apparatus that displays a document image on a display unit. For example, it is suitable for a mobile terminal such as a smartphone, a mobile phone, a tablet, an electronic book terminal, or a notebook computer. Needless to say, the present invention can be applied to general-purpose personal computers, televisions, and electronic blackboards, and can also be applied to multi-function machines, scanners, and the like having a display unit for displaying document images.

10 携帯端末(表示制御装置,表示装置)
11 制御部
12 記憶部
14 タッチパネル
14a 表示部
14b 入力部
22 参照リスト作成部
111 レイアウト変更部(変更部)
112 表示制御部
10 Mobile terminal (display control device, display device)
DESCRIPTION OF SYMBOLS 11 Control part 12 Memory | storage part 14 Touch panel 14a Display part 14b Input part 22 Reference list creation part 111 Layout change part (change part)
112 Display control unit

Claims (10)

文書を撮像して得られる文書画像をリフロー形式で表示領域に表示させるために前記文書画像のレイアウトを変更する変更部と、レイアウト変更後の文書画像をリフロー形式で前記表示領域に表示させる表示処理を行う表示制御部とを備え、
前記変更部は、前記文書画像を構成する要素毎に、レイアウト変更後の文書画像全体のなかでの位置を示す座標値を求め、
前記表示制御部は、
前記座標値のうち、画像のスクロールの方向と平行な座標軸の座標値に、前記スクロールの量に応じたオフセット値を加算する加算処理を行い、
前記加算処理後の座標値を、前記表示領域と前記要素との位置関係を示す表示用座標として前記表示処理を行い、
前記変更部は、さらに、前記文書画像に対する変倍処理の指示が入力されると、前記変倍処理の表示倍率に応じて前記文書画像のレイアウトを変更するようになっており、
前記表示制御部は、さらに、
前記変倍処理の前に前記表示領域に表示させている要素のなかからいずれか一つの要素を選択する選択処理を行い、
前記選択処理にて選択した要素について、前記変倍処理の前の前記表示用座標のうちの前記スクロールの方向と平行な座標軸の座標値と、前記変倍処理の後の前記表示用座標のうちの前記スクロールの方向と平行な座標軸の座標値との差が所定範囲に収まるように、前記変倍処理の後の前記座標値に加算される前記オフセット値を調整するようになっている表示制御装置。
A change unit that changes the layout of the document image to display the document image obtained by imaging the document in the reflow format in the display area, and a display process that displays the document image after the layout change in the display area in the reflow format A display control unit for performing
The change unit obtains a coordinate value indicating a position in the entire document image after layout change for each element constituting the document image,
The display control unit
Among the coordinate values, an addition process for adding an offset value corresponding to the scroll amount to the coordinate value of the coordinate axis parallel to the scroll direction of the image,
The coordinate values after the addition process, have rows the display processing as display coordinates indicating the positional relationship between the and the display area element,
The changing unit is configured to change the layout of the document image according to the display magnification of the scaling process when an instruction for the scaling process is input to the document image.
The display control unit further includes:
Performing a selection process for selecting any one element from the elements displayed in the display area before the scaling process;
Of the elements selected in the selection process, the coordinate value of the coordinate axis parallel to the scroll direction of the display coordinates before the scaling process, and the display coordinates after the scaling process Display control adapted to adjust the offset value added to the coordinate value after the scaling process so that the difference between the coordinate value of the coordinate axis parallel to the scroll direction is within a predetermined range apparatus.
前記表示領域はタッチパネルにおける表示領域であり、
前記タッチパネルにおいて互いに離れた2箇所以上の領域がタッチされることで前記変倍処理の指示が入力されるようになっており、
前記選択処理は、前記文書画像の各要素のうち、前記変倍処理の指示における前記タッチパネルのタッチ箇所の平均座標値に対応する位置からのユークリッド距離が最も小さい要素を選択する処理である請求項に記載の表示制御装置。
The display area is a display area on the touch panel,
The zoom process instruction is input by touching two or more areas separated from each other on the touch panel,
The selection process is a process of selecting an element having the smallest Euclidean distance from a position corresponding to an average coordinate value of a touch location of the touch panel in the scaling process instruction among elements of the document image. the display control device according to 1.
前記表示制御部は、前記平均座標値に対応する位置が前記文書画像のなかのいずれかの要素を囲う外接矩形の内側である場合、前記平均座標値に対応する位置からのユークリッド距離の最も小さい要素が前記外接矩形に囲われる要素でなくても、前記外接矩形に囲われる要素を前記選択処理において選択する請求項に記載の表示制御装置。 The display control unit has the smallest Euclidean distance from the position corresponding to the average coordinate value when the position corresponding to the average coordinate value is inside a circumscribed rectangle surrounding any element in the document image. The display control apparatus according to claim 2 , wherein an element surrounded by the circumscribed rectangle is selected in the selection process even if the element is not an element surrounded by the circumscribed rectangle. 前記要素には少なくとも図または表が含まれており、
前記変更部は、前記図または表に関しては、設定されている表示倍率とは関係なく、前記図または表が前記スクロールの方向と直交する方向において前記表示領域に収まるように変倍し、当該変倍した前記図または表について前記座標値を求めるようになっている請求項1からのいずれか1項に記載の表示制御装置。
The element includes at least a figure or a table,
The changing unit scales the figure or table so that the figure or table fits in the display area in a direction orthogonal to the scroll direction regardless of the set display magnification. multiplied by the view or display control device according to any one of claims 1-3 adapted to determine said coordinate values for the table.
前記変更部は、レイアウト変更前の文書画像に図または表が示されている場合、前記レイアウト変更後の文書画像には前記図または表の代わりに前記図または表のサムネイルを配置させ、
前記表示制御部は、前記表示領域に表示させているサムネイルがユーザに選択されると、前記サムネイルに対応する前記図または表を前記表示領域に表示させるようになっている請求項1からのいずれか1項に記載の表示制御装置。
When the diagram or table is shown in the document image before the layout change, the change unit arranges a thumbnail of the diagram or table in the document image after the layout change instead of the diagram or table,
The display controller, the thumbnail being displayed on the display area is selected by the user, the view or table from claim 1 adapted to be displayed on the display region 4 corresponding to the thumbnail The display control apparatus according to any one of the above.
前記文書画像と、前記文書画像を構成する要素の並び順を示す並び順情報とを対応付けて記憶する記憶部を備え、
前記変更部は、前記並び順情報に示される並び順に従って前記文書画像のレイアウトを変更する請求項1からのいずれか1項に記載の表示制御装置。
A storage unit that associates and stores the document image and arrangement order information indicating an arrangement order of elements constituting the document image;
The changing unit, the display control device according to any one of claims 1 5 for changing the layout of the document image in accordance with a sequential order shown in the arrangement order information.
前記文書を撮像することによって前記文書画像を生成する画像入力部を備えた請求項1からのいずれか1項に記載の表示制御装置。 The display control device according to any one of claims 1 to 6, comprising an image input unit configured to generate the document image by imaging the document. 表示部と、文書を撮像して得られる文書画像をリフロー形式で前記表示部の表示領域に表示させるために前記文書画像のレイアウトを変更する変更部と、レイアウト変更後の文書画像をリフロー形式で前記表示領域に表示させる表示処理を行う表示制御部とを備え、
前記変更部は、前記文書画像を構成する要素毎に、レイアウト変更後の文書画像全体のなかでの位置を示す座標値を求め、
前記表示制御部は、
前記座標値のうち、画像のスクロールの方向と平行な座標軸の座標値に、前記スクロールの量に応じたオフセット値を加算する加算処理を行い、
前記加算処理後の座標値を、前記表示領域と前記要素との位置関係を示す表示用座標として前記表示処理を行い、
前記変更部は、さらに、前記文書画像に対する変倍処理の指示が入力されると、前記変倍処理の表示倍率に応じて前記文書画像のレイアウトを変更するようになっており、
前記表示制御部は、さらに、
前記変倍処理の前に前記表示領域に表示させている要素のなかからいずれか一つの要素を選択する選択処理を行い、
前記選択処理にて選択した要素について、前記変倍処理の前の前記表示用座標のうちの前記スクロールの方向と平行な座標軸の座標値と、前記変倍処理の後の前記表示用座標のうちの前記スクロールの方向と平行な座標軸の座標値との差が所定範囲に収まるように、前記変倍処理の後の前記座標値に加算される前記オフセット値を調整するようになっている表示装置。
A display unit, a change unit for changing the layout of the document image in order to display a document image obtained by imaging the document in a display area of the display unit in a reflow format, and a document image after the layout change in a reflow format A display control unit that performs display processing to be displayed in the display area,
The change unit obtains a coordinate value indicating a position in the entire document image after layout change for each element constituting the document image,
The display control unit
Among the coordinate values, an addition process for adding an offset value corresponding to the scroll amount to the coordinate value of the coordinate axis parallel to the scroll direction of the image,
The coordinate values after the addition process, have rows the display processing as display coordinates indicating the positional relationship between the and the display area element,
The changing unit is configured to change the layout of the document image according to the display magnification of the scaling process when an instruction for the scaling process is input to the document image.
The display control unit further includes:
Performing a selection process for selecting any one element from the elements displayed in the display area before the scaling process;
Of the elements selected in the selection process, the coordinate value of the coordinate axis parallel to the scroll direction of the display coordinates before the scaling process, and the display coordinates after the scaling process The offset value added to the coordinate value after the scaling process is adjusted so that the difference between the coordinate value of the coordinate axis parallel to the scroll direction is within a predetermined range. .
コンピュータを、請求項1〜のいずれか1項に記載の表示制御装置の各部として機能させるプログラム。 The computer program to function as each section of the display control device according to any one of claims 1-7. 請求項に記載のプログラムを記憶したコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium storing the program according to claim 9 .
JP2014172035A 2014-08-26 2014-08-26 Display control device, display device, program, recording medium Active JP6322086B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014172035A JP6322086B2 (en) 2014-08-26 2014-08-26 Display control device, display device, program, recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014172035A JP6322086B2 (en) 2014-08-26 2014-08-26 Display control device, display device, program, recording medium

Publications (2)

Publication Number Publication Date
JP2016045896A JP2016045896A (en) 2016-04-04
JP6322086B2 true JP6322086B2 (en) 2018-05-09

Family

ID=55636346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014172035A Active JP6322086B2 (en) 2014-08-26 2014-08-26 Display control device, display device, program, recording medium

Country Status (1)

Country Link
JP (1) JP6322086B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019016236A (en) * 2017-07-07 2019-01-31 インターマン株式会社 Character string image display method
CN111695257B (en) * 2020-06-11 2023-04-11 业成科技(成都)有限公司 LED layout generation method and device, computer equipment and readable storage medium
CN114428578B (en) * 2022-01-14 2024-04-05 广州朗国电子科技股份有限公司 Method and device for dynamically selecting page elements in frame mode

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003150296A (en) * 2001-11-14 2003-05-23 Nec Corp Terminal and information display method and program therefor
JP4573817B2 (en) * 2006-08-23 2010-11-04 富士通株式会社 Scroll synchronization system and scroll synchronization method
JP5017687B2 (en) * 2007-10-05 2012-09-05 カシオ計算機株式会社 Client device and program
JP5654851B2 (en) * 2010-11-18 2015-01-14 富士フイルム株式会社 Document image display device, operation control method thereof, and control program thereof
JP5978708B2 (en) * 2012-03-29 2016-08-24 富士通株式会社 External display program and external display device
JP5772802B2 (en) * 2012-11-29 2015-09-02 コニカミノルタ株式会社 Information processing apparatus, information processing apparatus control method, and information processing apparatus control program

Also Published As

Publication number Publication date
JP2016045896A (en) 2016-04-04

Similar Documents

Publication Publication Date Title
US9922400B2 (en) Image display apparatus and image display method
US9007405B1 (en) Column zoom
JP5376795B2 (en) Image processing apparatus, image processing method, program thereof, and storage medium
US20090021530A1 (en) Display control apparatus and display control method
CN107133615B (en) Information processing apparatus, information processing method, and computer program
KR20110091296A (en) Apparatus and method for generating document
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
JP2004295863A (en) Layout system and layout program, as well as layout method
US10684772B2 (en) Document viewing apparatus and program
US11409427B2 (en) Display control device, image forming apparatus, and non-transitory computer readable medium storing program
JP6020191B2 (en) Display control apparatus and program
JP5629509B2 (en) Information processing apparatus, information browsing apparatus, information processing method, and program
JP6322086B2 (en) Display control device, display device, program, recording medium
JP2011070558A (en) Document image processor, document image processing method and document image processing program
JP2008234147A (en) Document image display device, document image display method, and document image display program
JP2003308310A (en) Display method, display, display program, and recording medium recorded with display program
JP5551986B2 (en) Information processing apparatus, information processing method, and program
US8824806B1 (en) Sequential digital image panning
JP5412916B2 (en) Document image processing apparatus, document image processing method, and document image processing program
JP6128898B2 (en) Information processing apparatus, control method for information processing apparatus, and program
JP5881937B2 (en) Information processing apparatus, information processing method, and program
KR101903617B1 (en) Method for editing static digital combined images comprising images of multiple objects
US10789715B2 (en) Image processing device, image processing method, and information storage medium
EP2924684B1 (en) Score displaying method and computer program
JP6152633B2 (en) Display control apparatus and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180406

R150 Certificate of patent or registration of utility model

Ref document number: 6322086

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150