JP2006093880A - Image processing apparatus and control method thereof, computer program, and computer-readable storage medium - Google Patents
Image processing apparatus and control method thereof, computer program, and computer-readable storage medium Download PDFInfo
- Publication number
- JP2006093880A JP2006093880A JP2004273971A JP2004273971A JP2006093880A JP 2006093880 A JP2006093880 A JP 2006093880A JP 2004273971 A JP2004273971 A JP 2004273971A JP 2004273971 A JP2004273971 A JP 2004273971A JP 2006093880 A JP2006093880 A JP 2006093880A
- Authority
- JP
- Japan
- Prior art keywords
- character
- handwritten
- encoding
- image
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
Description
本発明は、画像データを入力し、符号化して出力する技術に関するものである。 The present invention relates to a technique for inputting, encoding, and outputting image data.
近年、スキャナの普及により文書の電子化が進んでいる。A4サイズ1枚の原稿を300dpiの解像度、フルカラーで読取ると、その画像データは実に24Mバイトものデータ量になり、記憶管理するにはメモリを逼迫するし、ネットワークを介して他のデバイスにメール等で転送する場合にはネットワークトラフィックの問題にもなる。よって、画像データに対する圧縮技術は重要である。 In recent years, the digitization of documents has progressed with the spread of scanners. When a single A4 size document is scanned at 300 dpi resolution and full color, the image data will actually be 24 Mbytes in size, and memory will be strained for storage management, and mail etc. will be sent to other devices via the network. In case of transferring with, it becomes a problem of network traffic. Therefore, a compression technique for image data is important.
例えば、フルカラー画像圧縮としてJPEGが知られている。JPEGは写真などの自然画像を圧縮するには非常に効果も高く、画質も良いことで知られている。かかる圧縮技術を用いると、上記のデータ量の問題は緩和される。 For example, JPEG is known as full color image compression. JPEG is known to be very effective for compressing natural images such as photographs and to have good image quality. The use of such a compression technique alleviates the above-described data amount problem.
しかしその一方で、JPEGは原稿中の文字部などの高周波部分を持つ画像についてはモスキートノイズと呼ばれる画像劣化が発生し、圧縮率も悪い。 However, on the other hand, JPEG causes image deterioration called mosquito noise for an image having a high frequency portion such as a character portion in a document, and the compression rate is also bad.
そこで領域分割を行い、写真領域と文字領域が混在する画像から文字成分を抜いた下地部分のJPEG圧縮し、抜いた文字成分は色情報と文字の位置を示す成分としてMMR圧縮する技術が知られている(特許文献1、2)。
上記の圧縮方式では、コンピュータで作成され、プリンタにて印刷された印刷物を読取り対象としている。従って、原稿中の文字に手書きで修正等を加えたりすると、手書き部位は非文字として扱われ、JPEG圧縮対象として処理される。JPEGは先に説明したように、自然画に有効な圧縮技術であるものの、文字や線画については画質劣化が発生しやすいものであるから、手書き画像が重畳された文字は、その周辺の文字(言い変えれば手書き画像が重畳されていない文字)と比べると視覚的な画質が見劣りする場合があった。 In the above compression method, a printed matter created by a computer and printed by a printer is targeted for reading. Accordingly, when a character in the document is corrected by handwriting, the handwritten part is treated as a non-character and processed as a JPEG compression target. As described above, JPEG is a compression technique that is effective for natural images. However, since characters and line drawings are prone to image quality degradation, characters with a handwritten image superimposed on the surrounding characters ( In other words, the visual image quality may be inferior to that of a character on which a handwritten image is not superimposed.
本発明はかかる課題に鑑みなされたものであり、原稿中の文字、手書き画像、自然画が混在するような画像の符号化をする場合に、文字、手書き画像のエッジを明瞭に維持しつつ、自然画がある場合には自然画の階調性も維持し、圧縮率の高いデータファイルを生成する技術を提供しようとするものである。 The present invention has been made in view of such problems, and when encoding an image in which characters, handwritten images, and natural images in a document are mixed, while maintaining the edges of the characters and handwritten images clearly, In the case where there is a natural image, it is intended to provide a technique for maintaining the gradation of the natural image and generating a data file with a high compression rate.
この課題を解決するため、例えば本発明の画像処理装置は以下の構成を備える。すなわち、
入力画像中の文字領域を判定し、文字領域座標情報並びに非文字領域座標情報を生成する文字領域判定手段と、
注目画素が文字・線画にあるか否かを示す属性情報を入力し、当該属性情報と、前記非文字領域座標情報に基づいて手書き領域を判定し、手書き領域座標情報を生成する手書き領域判定手段と、
前記文字領域座標情報及び前記手書き領域座標情報に基づき、前記入力画像中の文字及び手書きされた部位を、周辺の色で塗りつぶす塗り潰し手段と、
該塗り潰し手段で塗り潰して得られた画像全体を階調画像用の符号化手段で符号化する第1の符号化手段と、
前記文字及び手書きされた部位を、文字線画用の符号化手段で符号化する第2の符号化手段と、
前記第1、第2の符号化手段で得られたそれぞれの符号化データを1つのデータファイルに含めて出力する出力手段とを備える。
In order to solve this problem, for example, an image processing apparatus of the present invention has the following configuration. That is,
A character region determination means for determining a character region in the input image and generating character region coordinate information and non-character region coordinate information;
Handwritten region determination means for inputting attribute information indicating whether or not the target pixel is in a character / line drawing, determining a handwritten region based on the attribute information and the non-character region coordinate information, and generating handwritten region coordinate information When,
Based on the character area coordinate information and the handwritten area coordinate information, a painting means for painting a character and a handwritten part in the input image with surrounding colors;
First encoding means for encoding the entire image obtained by filling with the filling means with encoding means for a gradation image;
A second encoding means for encoding the character and the handwritten portion with an encoding means for character line drawing;
And output means for outputting each encoded data obtained by the first and second encoding means in one data file.
本発明によれば、原稿中の文字、手書き画像にかかわらず、そのエッジが明瞭に維持しつつ、且つ、自然画がある場合には自然画の階調性も維持し、圧縮率の高いデータファイルを生成することが可能になる。 According to the present invention, regardless of the character or handwritten image in the document, the edge is maintained clearly, and when there is a natural image, the gradation of the natural image is maintained and data with a high compression rate is obtained. A file can be generated.
以下添付図面に従って、本発明に係る実施形態を詳細に説明する。 Embodiments according to the present invention will be described below in detail with reference to the accompanying drawings.
図1は実施形態におけるシステム構成図である。図示において、100は複合機(MFP)であって、ネットワークスキャナ、ネットワークプリンタ、複写機として機能するものである。200は複合機100で読み取られた原稿画像データ等のファイルを記憶するファイルサーバ、301及び302はパーソナルコンピュータ等のクライアントPCであり、400はこれら各装置を接続するためのいネットワークである。
FIG. 1 is a system configuration diagram in the embodiment. In the figure,
上記構成において、クライアントPCは複合機100をネットワークプリンタとして活用すると共に、ファイルサーバ200にネットワーク上の各クライアントで共有するファイルを格納することになる。
In the above configuration, the client PC uses the multifunction peripheral 100 as a network printer, and stores a file shared by each client on the network in the
本実施形態における複合機100は、上記のようにネットワークプリンタ、複写機としても機能するものであるが、これらの機能は本発明には直接には関係がないので、以下では、複合機100のスキャナ機能にについて説明することとする。
The
図2は読取り対象の原稿の一例を示している。図示に示すように、自然画、文字(文章)を含み、尚且つ、文章の一部に手書きで修正がなされた例を示している。文章は黒のみではなく、赤、青等一般的にプリンターで印刷し得る色文字が混在していても構わない。また、図示では、「開発の新しい技術」という文字列が「新規開発技術」と赤色ペンで手書き修正されている様を示している。なお、この場合にはユーザーに元の文字を修正しようとする意図が有るものとして、修正と表現するが、単なる署名(サイン)やマーキングかもしれない。この様に手書き画像が重畳される(書き込まれる)状況であれば、本実施形態で説明する意図から逸脱するものではない。 FIG. 2 shows an example of a document to be read. As shown in the figure, an example is shown in which a natural image and characters (sentences) are included, and a part of the sentence is corrected by handwriting. The text is not limited to black, and may be mixed with color characters such as red and blue that can be printed by a printer. Further, the drawing shows that the character string “new development technology” is handwritten and corrected with “new development technology” and a red pen. In this case, the user intends to correct the original character and is expressed as correction, but it may be a simple signature or marking. As long as the handwritten image is superimposed (written) in this way, it does not depart from the intention described in the present embodiment.
さて、この原稿を複合機100で読取り(R、G、B各8ビットの256階調とする)、圧縮符号化するわけであるが、文字か否かの判別は、公知の文字認識処理で利用されている手法を採用する。すなわち、文字画像のドットの水平及び垂直方向のドットのヒストグラムを作成し、文字の外接矩形を検出し、その検出された外接矩形の並び方向に文字が並んでいるものを互いに接続し、行間についても所定距離以内であればそれらを文字行として連結して矩形の文字領域として判定する手法である。 Now, this document is read by the multi-function device 100 (256 gradations of 8 bits for each of R, G, and B) and compression-encoded, and whether or not it is a character is determined by a known character recognition process. Adopt the method used. That is, a horizontal and vertical dot histogram of the character image dots is created, the circumscribed rectangle of the character is detected, the characters arranged in the direction of the detected circumscribed rectangle are connected to each other, and the line spacing Is a method of determining a rectangular character region by connecting them as character lines if they are within a predetermined distance.
この場合、「新規開発技術」を活字並で記入できれば、その文字列は文字として認識されるが、ここでは、ここでは文字として認識されなかったとする(勿論、その一部の文字が文字として判断されても構わない)。また、文章中の「開発の新しい技術」という文字であるが、手書きの線分が記入されたことにより、そのそれらが文字として判断されず、且つ、引き出し線が通った文字についても文字として判断されなかったとする。 In this case, if “newly developed technology” can be entered in the same order as the type, the character string is recognized as a character, but here it is assumed that it was not recognized as a character here (of course, part of the characters are determined as characters). May be.) In addition, the characters “new development technology” in the text are not judged as characters because handwritten line segments have been entered, and the characters that have been drawn through are also judged as characters. Suppose not.
さて、上記状態で、文字領域と判断された領域を図3に示すようになる。文字領域は矩形として扱うので、図示のように6個の文字領域が判定される。なお。文字領域を矩形として扱うのは、その矩形領域を対角線上にある左上隅と右下隅の2つの座標で管理するのに都合が良いからであるが、矩形(=4角形)に限らず、それ以上の多角形で管理することを許容しても構わない。 Now, the area determined as the character area in the above state is as shown in FIG. Since the character area is handled as a rectangle, six character areas are determined as shown in the figure. Note that. The character area is treated as a rectangle because it is convenient to manage the rectangular area with two coordinates of the upper left corner and the lower right corner on the diagonal line, but it is not limited to a rectangle (= tetragon). You may allow management with the above polygons.
さて、図3に示す文字領域を符号化する際には、一般に文字画像はエッジが明瞭になっていることが望まれる。そこで、実施形態では、文字領域についてはMMR等の可逆符号化を適用して符号化するものとした(JBIG等他の符号化技術を採用しても構わない)。MMRは2値画像の符号化であるので、図3に示した文字領域を濃度(もしくは輝度)の中間値(8ビットであれば128)を使って単純2値化し、それを符号化する。ただし、文字領域内にある個々の文字の色についても考慮する必要がある。そこで、MMR符号化を行う際には、2値化した際に“1”となる画素が、オリジナル画像データでは何色であったかのか示す色情報を別途保持する。色情報はR,G,Bの値で持つようにしても良いが、文字の色数は、自然画ほどの色数を有することはあり得ないので、パレットに割り当てて記憶する。すなわち、2値化して“1”となった位置のオリジナル画像(多値カラー画像)の色の分布を調べ、幾つの色が存在するかを判定し、それぞれにパレット番号を割り当てる。例えば文字の色が黒(R≒G≒B≒0)であればパレット番号「0」を割り当てる。また、文字の色が赤(例えばR≧200以上、G≒B≒0)の場合であればパレット番号「1」を割り当てる等である。隣接する文字は同じパレットになる確率が高いであろうから、パレット番号もランレングス符号化すると、高い圧縮率で色情報を保持した符号化が可能になる。勿論、復号する際には、文字色まで再現するために、パレット番号と実際のRGBの値との関係を示すテーブルを別途用意する。すなわち、2値画像を復号した際に得られる有意画素“1”の画素データを、パレット番号で示される多値画素データに復元する。なお、文字には、その背景色を伴うことも有り得る。この背景色については後述することとする。 Now, when encoding the character area shown in FIG. 3, it is generally desired that the character image has a clear edge. Therefore, in the embodiment, the character region is encoded by applying lossless encoding such as MMR (other encoding techniques such as JBIG may be adopted). Since MMR is encoding of a binary image, the character region shown in FIG. 3 is simply binarized using an intermediate value (or 128 for 8 bits) of density (or luminance) and encoded. However, it is necessary to consider the color of each character in the character area. Therefore, when performing MMR encoding, color information indicating how many colors the pixels that become “1” when binarized are in the original image data is held separately. Although the color information may have values of R, G, and B, the number of characters cannot be as large as that of a natural image and is therefore assigned to a palette and stored. That is, the color distribution of the original image (multi-valued color image) at the position where it is binarized to “1” is examined to determine how many colors exist, and a palette number is assigned to each. For example, if the character color is black (R≈G≈B≈0), the palette number “0” is assigned. If the character color is red (for example, R ≧ 200 or more, G≈B≈0), the palette number “1” is assigned. Since adjacent characters are likely to have the same palette, if the palette number is also run-length encoded, it is possible to perform encoding that retains color information at a high compression rate. Of course, when decoding, a table indicating the relationship between the palette number and the actual RGB value is prepared separately in order to reproduce even the character color. That is, the pixel data of the significant pixel “1” obtained when the binary image is decoded is restored to the multi-value pixel data indicated by the palette number. A character may be accompanied by its background color. This background color will be described later.
次に、文字領域以外の符号化について説明する。ここで、色ペンによる修正(重畳または書き込み)を考慮しないのであれば、文字領域以外の領域とは自然画領域となる。自然画に優れた符号化技術としてはJPEGが知られている。 Next, encoding other than the character area will be described. Here, if correction (superimposition or writing) by the color pen is not taken into consideration, the area other than the character area is a natural image area. JPEG is known as an encoding technique excellent for natural images.
ここで仮に、文字領域外をJPEG符号化するものとしてしまうと、図2の手書き修正された部分までも含む図4の画像がJPEG符号化対象となってしまう。JPEGは非可逆符号化であり階調画像に優れているものの、文字画像をJPEG符号化してしまうと、そのエッジがボケてしまいうので、例え手書きであっても、その視認性が損なわれるであろう。さらにまた、このような手書きによる修正された活字文字、線分、手書き文字は高周波成分が多く含まれているので、高い圧縮率は得られない。 If it is assumed that the outside of the character area is JPEG-encoded, the image of FIG. 4 including the handwritten corrected portion of FIG. 2 becomes the target for JPEG encoding. JPEG is an irreversible encoding and is excellent in gradation images, but if a character image is JPEG encoded, its edges will be blurred, so even if it is handwritten, its visibility is impaired. I will. Furthermore, since the type characters, line segments, and handwritten characters corrected by such handwriting contain many high-frequency components, a high compression rate cannot be obtained.
そこで、本実施形態では、文字領域以外から、図5に示すように、手書きによって文字とは判断されなかった領域(以下、手書き領域という)を抽出し、手書き領域については文字領域ほぼ同様の符号化処理を行うようにした。この手書き領域の符号化は次の通りである。 Therefore, in the present embodiment, as shown in FIG. 5, an area that is not determined to be a character by handwriting (hereinafter referred to as a handwriting area) is extracted from other than the character area. To make it easier. The handwriting area is encoded as follows.
先ず、非文字領域と判断された領域内に存在する色数は、文字領域の色数と同じか、それより少なくなる傾向が高い。理由は、手書きによる修正対象は、せいぜい数箇所であろうし、修正する際に用いるペンのインク色も実際には1、2種類程度であるからである。そこで、先ず、手書き領域内の画像を減色する。実施形態ではR,G,Bそれぞれ8ビット(256階調)で表わされているので、R、G、Bを2ビットで表現(減色)する。単純には、各成分の最上位の2ビットのみを使うと考えると分かりやすい。 First, the number of colors existing in the area determined to be a non-character area tends to be the same as or less than the number of colors in the character area. The reason is that the number of correction targets by handwriting will be at most several, and the pen ink colors used for correction are actually about one or two. Therefore, first, the color in the handwritten area is reduced. In the embodiment, each of R, G, and B is represented by 8 bits (256 gradations), so R, G, and B are represented (reduced color) by 2 bits. Simply, it is easy to understand if only the most significant 2 bits of each component are used.
そして、減色後の画像の色分布を調べ、色数を算出する。R、G、Bはそれぞれ2ビットであるから、2+2+2=6ビットで色を表現するわけであるから、最大で26=64色で表わすことになる。これは、手書き修正された文字、使用したペンのインクの色を表わすのに十分な数である。 Then, the color distribution of the image after color reduction is examined, and the number of colors is calculated. Since each of R, G, and B is 2 bits, the color is expressed by 2 + 2 + 2 = 6 bits, so that the maximum is expressed by 2 6 = 64 colors. This is a sufficient number to represent the handwritten corrected character and the color of the pen ink used.
色分布によって仮にN色が存在すると判定した場合には、C0、C1、…CN-1の各色の2値プレーンを生成し、それぞれについてMMR符号化を行う。そして、各プレーンを色と対応づけるために、パレットを割り当てる。 If it is determined by the color distribution that there are N colors, binary planes of C 0 , C 1 ,..., C N-1 are generated, and MMR encoding is performed for each. A palette is assigned to associate each plane with a color.
次に、JPEG符号化について説明する。 Next, JPEG encoding will be described.
実施形態におけるJPEG符号化対象は、図2に示す自然画領域だけでなく、1ページ(1画像)の全体をその符号化対象とする。すなわち、元に入力した画像と同じサイズの画像である。このようにしたのは、文字領域、手書き文字領域内に存在していた文字或いは手書き文字や手書き線分の背景色を考慮するためである。図2に示す原稿(手書き部分を除く)をコンピュータ上で動作するアプリケーションで作成し印刷する際、文字の背景色を設定することは、普通に行われているので、その背景色までも含めることで、原画像に忠実にさせるためである。また、既に説明した文字領域、非文字領域の符号化では、このような背景色は符号化対象ではないとも言える。 The JPEG encoding target in the embodiment is not only the natural image region shown in FIG. 2 but also the entire one page (one image). That is, the image is the same size as the originally input image. The reason for this is to consider the background color of characters or handwritten characters or handwritten line segments that existed in the character region or handwritten character region. When creating and printing the manuscript (excluding handwritten parts) shown in Fig. 2 with an application that runs on a computer, it is common to set the background color of characters, so include that background color as well. This is to make the original image faithful. It can also be said that such a background color is not an object to be encoded in the encoding of the character area and non-character area already described.
ここで問題となるのは、JPEGは文字等の高周波成分が含まれると、圧縮率が低くなる点である。そこで、図7に示す如く、文字領域及び手書き領域中の1つの文字に着目した際、その文字を構成する有意画素(その色は何色でも構わない)500をオリジナル画像から抜き出し、その内部を背景色(501)で塗りつぶすことで、下地色或いは背景色のみの状態にする。この処理を全ての文字領域、手書き領域内の有意画素について行う。この結果を示すのが図6である。図示の如く、自然画領域以外の文字領域、或いは手書き領域は、ほぼ一様な輝度分布にさせてから、ページ全体をJPEG符号化することとした。1ページ中に高周波成分が無くなった状態で符号化するので、自然画領域のみをJPEG符号化した場合と比較し、1ページの符号化データ量が極端に多くなることはない。 The problem here is that JPEG has a low compression rate when it contains high-frequency components such as characters. Therefore, as shown in FIG. 7, when focusing on one character in the character area and the handwritten area, significant pixels (any color) 500 constituting the character are extracted from the original image, and the inside is extracted. By painting with the background color (501), only the background color or the background color is set. This process is performed for significant pixels in all character areas and handwritten areas. This result is shown in FIG. As shown in the drawing, the character area other than the natural image area or the handwritten area is made to have a substantially uniform luminance distribution, and then the entire page is subjected to JPEG encoding. Since encoding is performed with no high-frequency components in one page, the amount of encoded data per page does not become extremely large compared to the case where only a natural image area is JPEG encoded.
以上実施形態における符号化処理について説明したが、まとめると図8のようになる。同図は、実施形態における処理の概念図である。 Although the encoding process in the embodiment has been described above, it can be summarized as shown in FIG. FIG. 5 is a conceptual diagram of processing in the embodiment.
読み取った画像500には、文字領域501、手書き領域502、及び、自然画領域503が含まれている。
The read
このうち、文字領域501については、その文字領域に含まれる各文字の色を検出してパレットを生成する(処理504)。そして、文字画像領域を2値化し、MMR符号化を行い(処理505)、文字領域符号化データ506を生成する。この文字領域符号化データは、文字領域の座標データ、パレット、MMR符号化データで構成される。
Among these, for the
また、手書き領域502については、減色処理を行い、パレットを生成する(処理507)。そして、各パレットで示される2値プレーン毎にMMR符号化を行い(処理508)、手書き領域符号化データ509を生成する。手書き領域符号化データ509は、各手書き領域の座標、パレット、各プレーン毎のMMR符号化データで構成される。
For the
一方、自然画を含む1ページ全体については、文字領域、手書き領域における有意な画素(背景画素ではない画素)について、抜き出し、その内部を近傍の背景色で塗り潰し、文字領域に対応する文字領域の背景のみの画像501’、手書き領域の背景のみの画像502’及び自然画領域503で構成されるページ画像500’を生成する。
On the other hand, for an entire page including a natural image, significant pixels (pixels that are not background pixels) in the character area and handwriting area are extracted, and the interior is filled with a nearby background color, and the character area corresponding to the character area is extracted. A
そして、このページ画像500’をJPEG符号化を行い、背景&自然画領域符号化データ511を生成する。JPEG符号化データの構造は、通常通りでよいので、説明するまでもないであろう。
Then, the
こうして、文字領域符号化データ506、手書き領域符号化データ509、及び、背景&自然画領域符号化データ511を内包し、所定のフォーマットにした1つのファイル512を生成し、それをファイルサーバ200に転送することになる。
In this way, the character area encoded
以上説明した処理を実現するための具体的な構成を図9に示し、以下に処理内容について説明する。 A specific configuration for realizing the processing described above is shown in FIG. 9, and the processing content will be described below.
原画像101はイメージスキャナで読み取られた画像データであって、各画素はRGBそれぞれ8ビットで表現されるデータである。画像2値化部102は、原稿画像101から輝度成分のみを抽出し(例えば、RGB→Lab変換して得られたL成分を用いれば良いであろう)、輝度分布にしたがって得られた閾値に基づき2値化し、2値画像データ103を出力する。そして、領域識別部104は、得られた2値画像データ103から、通常の文字認識と同様に、文字外接矩形の分布の検出や外接矩形の結合等を行い文字領域と非文字領域を判定し、文字領域については文字領域座標データ117、非文字領域については非文字領域座標データ105を生成する。
The
ここで注意すべき点は、領域識別部104が生成する非文字領域座標データ105には、手書き領域、自然画領域の識別はないものの、それらの座標が混在した状態にある点である。
The point to be noted here is that the non-character area coordinate
塗りつぶし部106は、文字領域座標データに基づいて、文字領域であると判断され、尚且つ、2値画像データ103の“1”画素(有意画素)を原画像101から抜き出し(除去し)、その抜き出した内部を、2値画像データの近傍の“0”の色で塗りつぶす処理を行う。また、後述する手書き領域座標データ119から、手書き領域と判断され、2値画像データ103の“1”画素(有意画素)となっている原画像の画素を抜き出し、その抜き出した内部を、2値画像データの近傍の“0”の色で塗りつぶす処理を行う。
The
この結果、塗りつぶし部106から出力されるデータは、ちょうど図6に示すような多値画像データとなる。
As a result, the data output from the filling
文字色抽出部113は、文字領域座標データ117で示される領域内にあって、2次画像データで“1”(有意画素)である画素が、文字を構成する画素と判断し、カラー画像データ中の該当する位置の画素の色情報を抽出することを繰り返す。この結果、文字領域内の全文字の色を検出することになるので、その結果をパレットして出力する。そして、各色毎の2値画像プレーンデータを生成し、それをMMR符号化部115で符号化させる。そして、パレット、MMR符号化データ、並びに、各プレーンとパレットとの関係を示す情報を符号化データ121として出力する。つまり、文字色抽出部113、MMR符号化部115は、図3に示す文字領域を符号化することになる。
The character
また、画素判定部109は入力されるカラー画像データの輝度成分の変化が急峻(隣接する画素の輝度成分の差が所定閾値以上)となっている画素を検出し、その結果を手書き領域判定部110に出力する。この判定結果の信号は、文字線画領域の画素であるか否かの信号でもある。
In addition, the
手書き領域判定部110は、画素判定部109での判定結果に基づき、注目画素が文字/線画か、或いはそれ以外かを判別できる。したがって、2値画像データ103内の“1”の画素で、非文字領域座標データ105に合致する画素データのみを出力すれば、その出力画素データは手書き修正された文字や線分データを構成する画素データとなるので、その座標データを手書き領域の座標データ119として出力する。
The handwritten
減色&パレット生成部111は、上記のようにして手書き領域110からの手書き領域内の画素データを減色(実施形態ではR、G、Bそれぞれ2ビット化している)し、その減色後の色を計数し、その色毎の分布(ヒストグラム)を求める。そして、ヒストグラムの谷位置で区切り、各区切り間の中央位置の色情報について1つのパレット番号を割り当てる。この結果、例えばN個のパレットC0、C1、…CN-1(N<64)を生成する。そして、MMR符号化部112にて、パレットC0の色の画素を2値画像としてMMR符号化する。この処理をパレットC1、…CN-1についても同様に行う。この結果、各MMR符号化データをパレット番号と対応づけ、且つ、パレット番号と減色後の色情報とをパレット&MMR符号化データ120として出力する。
The color reduction &
以上の結果、各処理部でデータ117乃至121が生成されるので、これらを所定形式のフォーマットに合成した1つのファイル130にして、出力することになる。
As a result, the
ここで、実施形態における減色&パレット生成部111及びMMR符号化部112の詳細を図10に示し、その処理内容を説明する。
Here, details of the color reduction &
減色部1003には、画素判定部109で判定された文字・線画属性情報1001、原画像データ1002、及び、非文字領域座標データ105が供給される。
Character reduction / line
減色部1003は、注目画素が文字・線画属性を有し、且つ、非文字領域座標内に存在する場合、入力した原画像中の注目画素位置のR、G、B(各8ビット)を、それぞれ2ビット(計6ビット)に減色し、その減色後のデータをカラー情報計数部1004に出力すると共に、2値化部1008に出力する。
When the target pixel has the character / line drawing attribute and exists in the non-character area coordinates, the
カラー情報計数部1004は、R、G、B各2ビットの計6ビットで示される色をカウントするカウンタが内蔵されている。各カウンタをCT(R(2ビット)、G(2ビット)、B(2ビット))で表わし、減色後の注目画素の色(Rr、Gr、Br)であった場合には、
CT(Rr、Gr、Br)←CT(Rr、Gr、Br)+1
を演算することになる。
The color
CT (Rr, Gr, Br) ← CT (Rr, Gr, Br) +1
Will be calculated.
この処理を、1ページ分の画像入力が完了するまで行うと、カウンタCT()には、手書きによって文字と認定されなかった活字文字、手書き線分、手書き文字(正確には、文字として認定されなかった手書き文字)を構成する有意な画素の減色後の頻度が格納されることになる。 If this process is performed until image input for one page is completed, the counter CT () prints characters, handwritten line segments, and handwritten characters that are not recognized as characters by handwriting (accurately, characters are recognized as characters). The frequency after the subtractive color reduction of the significant pixels constituting the handwritten character that did not exist) is stored.
ソート部1005は、上記のようにして得られたR、G、Bの3次元色空間におけるカウンタ値を頻度の多いものからソートする。そして、パレットテーブル生成部1006は、各色毎に頻度の多い順にパレット番号として“0”、“1、”…を割り当て、パレット番号と色との関係を示すパレットテーブル1007を生成する。なお、実施形態の場合、減色は各RGBについて2ビットとしているので、パレット番号は最大で“63”になるが、頻度数が0の色についてはパレット番号を割り当てない。
The
2値化部1008は、減色部1003からの減色後の各画素の色情報と、パレットテーブル生成部1006からの情報に基づき2値化する。具体的には、パレット番号“0”の色(R、G、B)として(1、0、0)が設定された場合、減色部1003からの出力データが(1、0、0)の画素のみ、すなわち、パレット“0”に一致する色を有する画素のみを“1”(1ビット)とし、それ以外を“0”として出力する。
The
この処理を、生成されたパレット番号全てに行うことで、各パレット番号毎の2値画像データ群1009を生成する。
By performing this process for all the generated pallet numbers, a binary
MMR符号化部112は、2値画像データ群1009の各2値画像をMMR符号化を行うことで符号化データ1010を生成することになる。
The
以上説明したように本実施形態によれば、コンピュータ上で作成され、プリンタで印刷された文書に対し、手書き修正(重畳或いは書き込み)を行い、その修正結果を電子化する場合に、もともとプリンタで印刷された活字文字やそれに匹敵する文字、更には、手書きにより修正されて文字とは認定されなかった部分及び手書き線分や手書き文字については、自然画用の符号化(実施形態ではJPEG)対象とはならず、可逆符号化(実施形態ではMMR)で符号化されるので手書き文字や線分、更には、手書きで文字とは認定されなかった活字文字のエッジが保持されることになり、良好な符号化画像データを得ることが可能になる。また、文字の色も、通常の利用する色をほぼ網羅する色数で再現することも可能になり、100%原画像に忠実な文字色ではなくとも、それに近い色で再現することが可能になる。 As described above, according to this embodiment, when a document created on a computer and printed by a printer is subjected to handwriting correction (superimposition or writing) and the correction result is digitized, the printer originally For printed type characters and comparable characters, and parts that were corrected by handwriting and not recognized as characters, and handwritten line segments and handwritten characters are subject to natural image encoding (JPEG in the embodiment). However, since it is encoded by lossless encoding (MMR in the embodiment), handwritten characters and line segments, and furthermore, edges of type characters that are not recognized as characters by handwriting are retained. Good encoded image data can be obtained. In addition, the color of characters can be reproduced with the number of colors that almost cover the colors used normally, and even if it is not 100% faithful to the original image, it can be reproduced with colors close to it. Become.
<第2の実施形態>
図11は上記第1の実施形態における図9に代わる構成を示している。図11が図9と異なる点は、JPEG符号化部108の直前に、縮小部107を配置した点である。
<Second Embodiment>
FIG. 11 shows a configuration in place of FIG. 9 in the first embodiment. FIG. 11 differs from FIG. 9 in that a
JPEG符号化する対象は、自然画領域と、文字を抜き出し背景色で塗りつぶした領域を含む情報であり、文字や線分は含まれない。つまり、解像度よりも階調性が優先される画像ということになる。したがって、イメージスキャナの読取り解像度が十分であれば、解像度を下げても、ページ全体の画質に与える影響は少ないと言える。そこで、JPEG符号化部108で符号化する直前に、塗りつぶし後の画像を縮小する縮小部を設けた。この結果、JPEG符号化データ量を格段に減らすことができるようになる。勿論、出力ファイル130のヘッダ(不図示)には、縮小率を示す情報を格納することで、復号処理に対処する必要はある。
The target for JPEG encoding is information including a natural image area and an area in which characters are extracted and painted with a background color, and does not include characters or line segments. In other words, this is an image in which gradation is prioritized over resolution. Therefore, if the reading resolution of the image scanner is sufficient, it can be said that even if the resolution is lowered, the influence on the image quality of the entire page is small. Therefore, immediately before encoding by the
<第3の実施形態>
複合機には、既に、原稿読取部内に既に第1の実施形態で説明した画素判定部109に相当する構成が備えている場合がある。その場合には、その判定結果を入力すれば良いので、図12に示す構成で実現出来よう。図12と図9との違いは、画素判定部109が無くなった代わりに、該当する判定結果である属性情報125を入力するようにした点にある。また、本第3の実施形態の構成に、第2の実施形態で示した構成を適用しても構わない。
<Third Embodiment>
In some cases, the multifunction peripheral already includes a configuration corresponding to the
以上本発明に係る実施形態では、複合機に適用する例を説明したが、イメージスキャナ等の画像入力装置を接続したコンピュータ上で、図8に示す処理とほぼ同等の処理を行うプログラムを実行しても実現できるのは明らかである。また、通常、コンピュータプログラムはCD−ROM等のコンピュータ可読記憶媒体に格納されていて、それをコンピュータにセットしてシステムにコピーもしくはインストールすることで実行可能になるわけであるから、当然、このようなコンピュータ可読記憶媒体も本発明の範疇に含まれる。 In the embodiment according to the present invention, the example applied to the multifunction machine has been described. However, on the computer connected to the image input device such as an image scanner, a program for executing processing substantially equivalent to the processing shown in FIG. 8 is executed. But it is clear that it can be realized. Further, since the computer program is usually stored in a computer-readable storage medium such as a CD-ROM and can be executed by setting it in the computer and copying or installing it in the system, of course, Such computer-readable storage media are also included in the scope of the present invention.
Claims (8)
注目画素が文字・線画にあるか否かを示す属性情報を入力し、当該属性情報と、前記非文字領域座標情報に基づいて手書き領域を判定し、手書き領域座標情報を生成する手書き領域判定手段と、
前記文字領域座標情報及び前記手書き領域座標情報に基づき、前記入力画像中の文字及び手書きされた部位を、周辺の色で塗りつぶす塗り潰し手段と、
該塗り潰し手段で塗り潰して得られた画像全体を階調画像用の符号化手段で符号化する第1の符号化手段と、
前記文字及び手書きされた部位を、文字線画用の符号化手段で符号化する第2の符号化手段と、
前記第1、第2の符号化手段で得られたそれぞれの符号化データを1つのデータファイルに含めて出力する出力手段と
を備えることを特徴とする画像処理装置。 A character region determination means for determining a character region in the input image and generating character region coordinate information and non-character region coordinate information;
Handwritten region determination means for inputting attribute information indicating whether or not the target pixel is in a character / line drawing, determining a handwritten region based on the attribute information and the non-character region coordinate information, and generating handwritten region coordinate information When,
Based on the character area coordinate information and the handwritten area coordinate information, a painting means for painting a character and a handwritten part in the input image with surrounding colors;
First encoding means for encoding the entire image obtained by filling with the filling means with encoding means for a gradation image;
A second encoding means for encoding the character and the handwritten portion with an encoding means for character line drawing;
An image processing apparatus comprising: output means for including each encoded data obtained by the first and second encoding means in one data file and outputting the data.
各色に対応する2値画像を生成し、当該2値画像の色を示すパレットを生成する手段と、
生成された2値画像を可逆符号化する可逆符号化手段とを有し、
生成されたパレットと色との関係を示すテーブルと、前記可逆符号化手段で得られた符号化データとを符号化結果として出力する
ことを特徴とする請求項1に記載の画像処理装置。 The second encoding means includes
Means for generating a binary image corresponding to each color and generating a palette indicating the color of the binary image;
Lossless encoding means for losslessly encoding the generated binary image,
The image processing apparatus according to claim 1, wherein the table indicating the relationship between the generated palette and color and the encoded data obtained by the lossless encoding unit are output as an encoding result.
注目画素が文字・線画にあるか否かを示す属性情報を入力し、当該属性情報と、前記非文字領域座標情報に基づいて手書き領域を判定し、手書き領域座標情報を生成する手書き領域判定工程と、
前記文字領域座標情報及び前記手書き領域座標情報に基づき、前記入力画像中の文字及び手書きされた部位を、周辺の色で塗りつぶす塗り潰し工程と、
該塗り潰し工程で塗り潰して得られた画像全体を階調画像用の符号化手段で符号化する第1の符号化工程と、
前記文字及び手書きされた部位を、文字線画用の符号化手段で符号化する第2の符号化工程と、
前記第1、第2の符号化手段で得られたそれぞれの符号化データを1つのデータファイルに含めて出力する出力工程と
を備えることを特徴とする画像処理方法。 A character region determination step for determining a character region in the input image and generating character region coordinate information as well as non-character region coordinate information;
A handwritten region determination step of inputting attribute information indicating whether or not the target pixel is in a character / line drawing, determining a handwritten region based on the attribute information and the non-character region coordinate information, and generating handwritten region coordinate information When,
Based on the character region coordinate information and the handwritten region coordinate information, a painting step of painting a character and a handwritten part in the input image with surrounding colors;
A first encoding step of encoding the entire image obtained by the filling step with an encoding means for a gradation image;
A second encoding step of encoding the character and the handwritten portion with an encoding means for character line drawing;
An image processing method comprising: an output step of outputting each encoded data obtained by the first and second encoding means in one data file.
入力画像中の文字領域を判定し、文字領域座標情報並びに非文字領域座標情報を生成する文字領域判定手段と、
注目画素が文字・線画にあるか否かを示す属性情報を入力し、当該属性情報と、前記非文字領域座標情報に基づいて手書き領域を判定し、手書き領域座標情報を生成する手書き領域判定手段と、
前記文字領域座標情報及び前記手書き領域座標情報に基づき、前記入力画像中の文字及び手書きされた部位を、周辺の色で塗りつぶす塗り潰し手段と、
該塗り潰し工程で塗り潰して得られた画像全体を階調画像用の符号化手段で符号化する第1の符号化手段と、
前記文字及び手書きされた部位を、文字線画用の符号化手段で符号化する第2の符号化手段と、
前記第1、第2の符号化手段で得られたそれぞれの符号化データを1つのデータファイルに含めて出力する出力手段
として機能することを特徴とするコンピュータプログラム。 A computer program that is read and executed by a computer,
A character region determination means for determining a character region in the input image and generating character region coordinate information and non-character region coordinate information;
Handwritten region determination means for inputting attribute information indicating whether or not the target pixel is in a character / line drawing, determining a handwritten region based on the attribute information and the non-character region coordinate information, and generating handwritten region coordinate information When,
Based on the character area coordinate information and the handwritten area coordinate information, a painting means for painting a character and a handwritten part in the input image with surrounding colors;
First encoding means for encoding the entire image obtained by filling in the filling step with an encoding means for a gradation image;
A second encoding means for encoding the character and the handwritten portion with an encoding means for character line drawing;
A computer program that functions as output means for outputting each encoded data obtained by the first and second encoding means in one data file.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004273971A JP2006093880A (en) | 2004-09-21 | 2004-09-21 | Image processing apparatus and control method thereof, computer program, and computer-readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004273971A JP2006093880A (en) | 2004-09-21 | 2004-09-21 | Image processing apparatus and control method thereof, computer program, and computer-readable storage medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006093880A true JP2006093880A (en) | 2006-04-06 |
JP2006093880A5 JP2006093880A5 (en) | 2009-09-10 |
Family
ID=36234461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004273971A Pending JP2006093880A (en) | 2004-09-21 | 2004-09-21 | Image processing apparatus and control method thereof, computer program, and computer-readable storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006093880A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008054002A (en) * | 2006-08-24 | 2008-03-06 | Fuji Xerox Co Ltd | Image processing system, image compression system, image editing system, image processing program, and image processor |
JP2010147935A (en) * | 2008-12-19 | 2010-07-01 | Canon Inc | Image processing apparatus and image processing method |
US8582906B2 (en) | 2010-03-03 | 2013-11-12 | Aod Technology Marketing, Llc | Image data compression and decompression |
US9014468B2 (en) | 2012-03-30 | 2015-04-21 | Brother Kogyo Kabushiki Kaisha | Image processing apparatus, computer-readable storage medium storing computer-readable instructions and associated method |
US9300840B2 (en) | 2012-12-27 | 2016-03-29 | Brother Kogyo Kabushiki Kaisha | Image processing device and computer-readable storage medium storing computer-readable instructions |
-
2004
- 2004-09-21 JP JP2004273971A patent/JP2006093880A/en active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008054002A (en) * | 2006-08-24 | 2008-03-06 | Fuji Xerox Co Ltd | Image processing system, image compression system, image editing system, image processing program, and image processor |
US8014620B2 (en) | 2006-08-24 | 2011-09-06 | Fuji Xerox Co., Ltd. | Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus |
JP2010147935A (en) * | 2008-12-19 | 2010-07-01 | Canon Inc | Image processing apparatus and image processing method |
US8320668B2 (en) | 2008-12-19 | 2012-11-27 | Canon Kabushiki Kaisha | Image processing apparatus and image processing method |
US8582906B2 (en) | 2010-03-03 | 2013-11-12 | Aod Technology Marketing, Llc | Image data compression and decompression |
US9014468B2 (en) | 2012-03-30 | 2015-04-21 | Brother Kogyo Kabushiki Kaisha | Image processing apparatus, computer-readable storage medium storing computer-readable instructions and associated method |
US9300840B2 (en) | 2012-12-27 | 2016-03-29 | Brother Kogyo Kabushiki Kaisha | Image processing device and computer-readable storage medium storing computer-readable instructions |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2008212078B2 (en) | Image processing apparatus, image processing method, and image processing program | |
US7542605B2 (en) | Image processing apparatus, control method therefor, and program | |
US8331671B2 (en) | Image processing apparatus and image encoding method related to non-photo image regions | |
US8009908B2 (en) | Area testing method for image processing | |
US7667711B2 (en) | Image processing system, a method thereof, and a recording medium thereof | |
US7421124B2 (en) | Image processing system and image processing method | |
US20090284801A1 (en) | Image processing apparatus and image processing method | |
US7508547B2 (en) | Image processing apparatus, control method therefor, and program | |
US8086040B2 (en) | Text representation method and apparatus | |
US7133559B2 (en) | Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded | |
JP2006014331A (en) | Document compression method, system for compressing document, and image processing apparatus | |
JP2009225422A (en) | Image encoding apparatus, image processing apparatus, and control method thereof | |
AU2009200948A1 (en) | Image processing apparatus, image processing method and image processing program | |
US20030202696A1 (en) | Activity detector | |
JP2004362541A (en) | Image processing device, program, and storage medium | |
JP2008219928A (en) | Image processing apparatus, image processing method, and image processing program | |
JP2004229261A (en) | Image-compressing method, image-compressing device, program, and recording media | |
JP4442651B2 (en) | Image processing apparatus and program | |
US20210110586A1 (en) | Mixed raster content (mrc) to control color changes | |
US10602019B2 (en) | Methods and systems for enhancing image quality for documents with highlighted content | |
JP2006093880A (en) | Image processing apparatus and control method thereof, computer program, and computer-readable storage medium | |
US10931852B2 (en) | Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region | |
JP2003219187A (en) | Image processing method and image processor | |
JP5517028B2 (en) | Image processing device | |
JP7185451B2 (en) | Image processing device, image processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070906 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20070906 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090729 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090916 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090928 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100205 |