[go: nahoru, domu]

JP2001249687A - Method and system for dictation, and portable terminal device - Google Patents

Method and system for dictation, and portable terminal device

Info

Publication number
JP2001249687A
JP2001249687A JP2000062858A JP2000062858A JP2001249687A JP 2001249687 A JP2001249687 A JP 2001249687A JP 2000062858 A JP2000062858 A JP 2000062858A JP 2000062858 A JP2000062858 A JP 2000062858A JP 2001249687 A JP2001249687 A JP 2001249687A
Authority
JP
Japan
Prior art keywords
sentence
partial
unit
dictation
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000062858A
Other languages
Japanese (ja)
Inventor
Takeshi Inoue
剛 井上
Masakatsu Hoshimi
昌克 星見
Akira Ishida
明 石田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000062858A priority Critical patent/JP2001249687A/en
Publication of JP2001249687A publication Critical patent/JP2001249687A/en
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To realize a dictation system with a human interface capable of easily correcting a dictation result in equipment with a narrow display part. SOLUTION: A dictation result 105 in which speech inputted to a speech input part 1 is recognized by a speech recognition part 5 is divided into a morpheme string less than one row of a display part by a partial text generation part 6, and is displayed to be easily seen with the above morpheme string changed in row by a correction part 9. A partial text display part 10 can easily realize an erroneous recognition of the dictation result, the detection and correction of a wrong conversion of Kanji by easily moving the cursor to the correction point by less number of operation.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、例えば、携帯電
話、電子手帳あるいはカーナビゲーション等、1行に入
る文字数が少ない表示部を要する携帯端末機器に用いて
好適なディクテーション方法、ディクテーションシステ
ム及びそれを用いた携帯端末装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dictation method, a dictation system, and a dictation system suitable for use in a portable terminal device requiring a display unit having a small number of characters per line, such as a cellular phone, an electronic organizer, or a car navigation system. The present invention relates to a portable terminal device used.

【0002】[0002]

【従来の技術】従来、ディクテーションはその動作に必
要な計算能力の大きさから、例えば「DIME」No1
8、1999年9月16日号(小学館発行)にあるよう
に大きな計算機やパソコンで行われてきた。
2. Description of the Related Art Conventionally, dictation is performed, for example, in the form of “DIME” No.
8. As described in the September 16, 1999 issue (published by Shogakukan), it has been performed using large computers and personal computers.

【0003】このような機器で行うディクテーションは
ある程度の大きさを持つディスプレイにより表示される
ため、ディクテーション結果も図5のように1行に多く
の文字が入る。このようなインターフェイスにおける入
力された文章での誤認識、漢字変換も見つけやすく、ま
たマウスやキーボードといった複雑な入力を持つので、
その修正も容易に行える技術であった。
Since the dictation performed by such a device is displayed on a display having a certain size, the dictation result includes many characters in one line as shown in FIG. It is easy to find misrecognition and kanji conversion in the input text in such an interface, and it has complicated input such as mouse and keyboard,
It was a technique that could easily be modified.

【0004】[0004]

【発明が解決しようとする課題】このように従来比較的
大きな表示部を持つ機器でディクテーションは行われて
きたが、携帯電話や電子手帳など表示部が小さな機器で
ディクテーションを行った場合、一行に入る文字数がき
わめて少ないのでディクテーション結果が表示部に表示
されるとき、ディクテーション結果の誤認識・漢字変換
間違いを見つけ、修正する事が困難である。
As described above, dictation has been conventionally performed on a device having a relatively large display unit. However, when dictation is performed on a device having a small display unit such as a mobile phone or an electronic organizer, the dictation is performed on one line. When the dictation result is displayed on the display unit, it is difficult to find and correct erroneous recognition / kanji conversion mistake of the dictation result when the dictation result is displayed on the display unit because the number of entered characters is extremely small.

【0005】また、例えば携帯電話のような機器におい
てはマウスやキーボードのような高度な入力手段がない
ので、ディクテーション結果を修正することが困難であ
る課題があった。
Also, for example, in a device such as a portable telephone, there is no advanced input means such as a mouse or a keyboard, and thus there is a problem that it is difficult to correct a dictation result.

【0006】本発明の目的は一行で表示できる文字数が
少ない表示部を持つ機器においてもディクテーション結
果の誤認識・漢字変換誤りを容易に発見、修正できるデ
ィクテーション方法、ディクテーションシステム及びそ
れを用いた携帯端末装置を提供することにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide a dictation method, a dictation system, and a portable terminal using the same that can easily detect and correct erroneous recognition of dictation results and kanji conversion errors even in a device having a display unit having a small number of characters that can be displayed in one line. It is to provide a device.

【0007】[0007]

【課題を解決するための手段】この課題を解決するため
に本発明は、ディクテーション結果を表示部一行に及ば
ない部分文に分け、行を変えて表示、修正する手段とデ
ィクテーション結果の修正時において修正箇所により少
ない操作数でカーソルを容易に移動できる手段を設ける
ことにより、上記目的を達成するものである。
In order to solve this problem, the present invention divides a dictation result into sub-sentences that do not extend over one line of a display unit, and changes and displays and corrects the dictation result. The object is achieved by providing means for easily moving the cursor with a small number of operations at the correction location.

【0008】[0008]

【発明の実施の形態】本発明の請求項1に記載の発明
は、入力音声を認識し、予め設定された表示情報と文法
情報を用いて、前記認識結果から部分文を作成し、必要
に応じて修正された部分文を連結して文とし、前記部分
文または前記連結された文を表示することを特徴とする
ディクテーション方法であり、これにより表示サイズの
情報を用いたユーザーにとって見易いディクテーション
結果表示が可能となる作用を有する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The invention according to claim 1 of the present invention recognizes an input voice, creates a partial sentence from the recognition result using preset display information and grammar information, and The dictation method is characterized in that the partial sentences corrected accordingly are combined to form a sentence, and the partial sentence or the combined sentence is displayed, whereby a dictation result that is easy to see for the user using the display size information. It has the function of enabling display.

【0009】本発明の請求項2に記載の発明は、音声を
入力する入力手段と、前記入力手段からの入力音声を認
識する認識手段と、予め設定された表示情報と文法情報
を用いて、前記認識結果から部分文を作成する部分文作
成手段と、前記作成された部分文を修正する修正手段
と、前記修正手段により修正された部分文を連結し、文
にする部分連結手段と、前記部分文または前記連結され
た文を表示する表示手段とを有することを特徴とするデ
ィクテーションシステムであり、ディクテーション結果
が見易く、簡単に修正も行える作用を有する。
According to a second aspect of the present invention, an input means for inputting a voice, a recognition means for recognizing the input voice from the input means, and display information and grammatical information set in advance are used. A partial sentence creating unit that creates a partial sentence from the recognition result; a correcting unit that corrects the created partial sentence; a partial connecting unit that connects the partial sentences corrected by the correcting unit to form a sentence; A dictation system characterized by having a display unit for displaying a partial sentence or the connected sentence, and has an effect that the dictation result is easy to see and can be easily corrected.

【0010】本発明の請求項3に記載の発明は、請求項
2記載のディクテーションシステムにおいて、表示手段
は、部分文を表示する領域と部分文を連結した文を表示
する領域とが分離していることを特徴とするものであ
り、ディクテーション結果の確認、修正を容易にする作
用を有する。
According to a third aspect of the present invention, in the dictation system according to the second aspect, the display means separates an area for displaying a partial sentence from an area for displaying a sentence connecting the partial sentences. And has the effect of facilitating confirmation and correction of the dictation result.

【0011】本発明の請求項4に記載の発明は、請求項
2記載のディクテーションシステムにおいて、表示情報
は、一行に表示可能な文字数であることを特徴とするも
のであり、様々な表示画面に適したディクテーション結
果の表示ができる作用を有する。
[0011] According to a fourth aspect of the present invention, in the dictation system according to the second aspect, the display information is the number of characters that can be displayed on one line. This has the effect of displaying a suitable dictation result.

【0012】本発明の請求項5に記載の発明は、請求項
2〜4のいずれかに記載のディクテーションシステムに
おいて、部分文は、意味を持つ最小単位である形態素を
基本単位とすることを特徴とするものであり、部分文の
意味を理解し易く、修正を容易にする作用を有する。
According to a fifth aspect of the present invention, in the dictation system according to any one of the second to fourth aspects, the partial sentence has a basic unit of a morpheme which is a minimum unit having a meaning. This has the effect of making it easy to understand the meaning of the partial sentence and making the correction easy.

【0013】本発明の請求項6に記載の発明は、請求項
2記載のディクテーションシステムにおいて、文法情報
は、部分文の始めや終わりを形態素の例えば品詞といっ
た分類結果によって決定することを特徴とするものであ
り、部分文の意味を即座に理解できる作用を有する。
According to a sixth aspect of the present invention, in the dictation system according to the second aspect, the grammatical information is characterized in that the beginning and end of the sub-sentence are determined by a classification result such as a morpheme, such as a part of speech. And has the effect that the meaning of the sub-sentence can be immediately understood.

【0014】本発明の請求項7に記載の発明は、複数の
例文を記憶した例文記憶手段と、例文を予め設定された
表示情報と文法情報を用いて、部分文に変換する部分文
変換手段と、前記部分文の修正位置にカーソルを移動す
る修正入力手段と、音声を入力する入力手段と、前記入
力手段からの入力音声を認識する認識手段と、前記認識
結果から部分文を作成する部分文作成手段と、前記作成
された部分文により前記修正位置に存在する部分文を修
正する修正手段と、前記修正手段により修正された部分
文を連結し、文にする部分連結手段と、前記部分文また
は前記連結された文を表示する表示手段とを有すること
を特徴とするディクテーションシステムであり、記憶し
た例文を簡単に編集できる作用を有する。
According to a seventh aspect of the present invention, there is provided an example sentence storing means for storing a plurality of example sentences, and a partial sentence converting means for converting the example sentences into partial sentences using preset display information and grammatical information. Correction input means for moving a cursor to a correction position of the partial sentence, input means for inputting voice, recognition means for recognizing input voice from the input means, and a part for creating a partial sentence from the recognition result Sentence creating means, correcting means for correcting a partial sentence located at the correction position by the created partial sentence, partial connecting means for connecting the partial sentence corrected by the correcting means to form a sentence, A dictation system characterized by having a display means for displaying a sentence or the connected sentence, and has an operation of easily editing a stored example sentence.

【0015】本発明の請求項8に記載の発明は、請求項
2から7のいずれかに記載のディクテーションシステム
を用いた携帯端末装置において、連結した文を送受信す
る通信手段を設けたことを特徴とする携帯端末装置であ
り、携帯端末における容易なディクテーション操作を提
供できる作用を有する。
According to an eighth aspect of the present invention, in a portable terminal device using the dictation system according to any one of the second to seventh aspects, a communication means for transmitting and receiving connected sentences is provided. The portable terminal device has an operation of providing an easy dictation operation in the portable terminal.

【0016】本発明の請求項9に記載の発明は、請求項
7記載の携帯端末装置において、例文記憶手段は、送受
信した文を例文として記憶することを特徴とするもので
あり、携帯端末における容易な文章作成作用を有する。
According to a ninth aspect of the present invention, in the portable terminal device according to the seventh aspect, the example sentence storage means stores sent / received sentences as example sentences. Has an easy sentence creation effect.

【0017】以下、本発明の実施の形態について、図面
を用いて説明する。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.

【0018】(実施の形態1)図1は、本発明の実施の
形態1におけるディクテーションシステムを用いた携帯
端末装置の一実施例の構成図である。
(Embodiment 1) FIG. 1 is a configuration diagram of an example of a portable terminal device using a dictation system according to Embodiment 1 of the present invention.

【0019】図1において、1は音声を入力し電気信号
に変換する音声入力部、2は入力された音声を音響パラ
メータに変換する特徴抽出部、5は、特徴抽出部2で変
換された音響パラメータと予め求めた音響モデル3と言
語モデル4を用いて認識する音声認識部、16は音声認
識部5から得られた音声入力による例文114やキー等
による音声以外の情報入力による例文で書き換えが可能
な例文記憶部、6は予め設定された表示情報7と文法情
報8を用いて、前記認識結果もしくは例文記憶部16の
選択結果から部分文を作成する部分文作成部、9は作成
された部分文を音声以外の情報入力部11により入力さ
れる情報を元に部分文を修正する修正部、14は修正部
9により修正された部分文を連結し、文にする部分文連
結部、12は部分文または連結された文を表示する表示
部、15は連結文を無線または有線等で送信する通信部
である。
In FIG. 1, 1 is a voice input unit for inputting voice and converting it into an electric signal, 2 is a feature extracting unit for converting the input voice into acoustic parameters, and 5 is a sound converted by the feature extracting unit 2. The voice recognition unit 16 recognizes using the parameters and the acoustic model 3 and the language model 4 obtained in advance. A possible example sentence storage unit 6 is a partial sentence creation unit that creates a partial sentence from the recognition result or the selection result of the example sentence storage unit 16 using display information 7 and grammar information 8 set in advance. A correction unit that corrects a partial sentence based on information input by the information input unit 11 other than the voice, and a partial sentence connection unit that connects the partial sentences corrected by the correction unit 9 to form a sentence, and 12 Is part Or display unit for displaying the linked text, 15 is a communication unit that transmits the connection statement wirelessly or wired, and the like.

【0020】上記のように構成されたディクテーション
システムを用いた携帯端末装置の動作について、以下に
説明する。
The operation of the portable terminal device using the dictation system configured as described above will be described below.

【0021】音声入力部1に入力された音声は、音声入
力部1で電気信号としての入力音声信号101に変換さ
れ、特徴抽出部2でLPCケプストラム係数等の適当な
音響パラメータ104に変換される。音声認識部5は、
特徴抽出部2で得られた音響パラメータ104と、予め
求めておいた音響モデル3からの音響モデルデータ10
2、言語モデル4からの言語モデルデータ103を用い
て入力音声を認識する。部分文作成部6は、音声認識部
5の認識結果であるディクテーション結果105または
例文記憶部16から抽出された文を、表示情報7からの
一行で表示できる文字数等を用いて部分文の文字数を制
御する表示情報データ106と、文法情報8から例えば
名詞、助詞と続いている場合は部分文を名詞で終了しな
いなどの文法制限を行う文法情報データ107を用い
て、形態素を最小単位とした複数の部分文信号BS10
8に変換する。部分文信号BS108は、修正部9に送
られ、その結果である修正状態にある部分文信号109
は部分文表示部10において部分文信号毎に行を変えて
表示する。
The voice input to the voice input unit 1 is converted by the voice input unit 1 into an input voice signal 101 as an electric signal, and is converted by the feature extraction unit 2 into appropriate voice parameters 104 such as LPC cepstrum coefficients. . The voice recognition unit 5
The acoustic parameters 104 obtained by the feature extracting unit 2 and the acoustic model data 10
2. Recognize input speech using language model data 103 from language model 4. The partial sentence creation unit 6 determines the number of characters of the partial sentence using the number of characters that can be displayed in one line from the display information 7 on the dictation result 105 that is the recognition result of the speech recognition unit 5 or the sentence extracted from the example sentence storage unit 16. Using display information data 106 to be controlled and grammatical information data 107 for performing grammatical restrictions such as not ending a partial sentence with a noun when following a noun or a particle from the grammatical information 8, a plurality of morphological units are used as a minimum unit. Partial sentence signal BS10
Converted to 8. The partial sentence signal BS108 is sent to the correction unit 9, and the resulting partial sentence signal 109 in the corrected state is output.
Is displayed by changing the line for each partial sentence signal in the partial sentence display unit 10.

【0022】なお、例文記憶部16における例文は音声
認識結果やキー入力、通信部より受け取った文を記憶し
ておき、それを利用できるものである。
The example sentence stored in the example sentence storage unit 16 is a speech recognition result, a key input, and a sentence received from the communication unit, which can be used.

【0023】また、表示情報7で必要な部分文の文字数
等の表示情報は、ハードウェア固定のものと限らず、ソ
フトウェアや外部からの情報により可変に成りうるもの
である。
The display information such as the number of characters of the partial sentence required in the display information 7 is not limited to the one fixed by hardware, but can be changed by software or external information.

【0024】さらに、部分文信号BS108は、部分文
表示部10において、例えば図2のように各行の先頭に
先頭番号22を表示し、各形態素23を区切る印(例え
ば、/)24を入れる。また、部分文表示部10で部分
文を表示したときカーソル25は自動的にディクテーシ
ョン結果の一番前である一番上の部分文の先頭に来るよ
うにする。
Further, the partial sentence signal BS108 is displayed on the partial sentence display section 10 at the beginning of each line, for example, as shown in FIG. 2, and a mark (for example, /) 24 for separating each morpheme 23 is entered. Also, when a partial sentence is displayed on the partial sentence display section 10, the cursor 25 is automatically set at the head of the uppermost partial sentence which is the foremost of the dictation result.

【0025】修正部9は、続いてこのカーソルを用いて
部分文単位で表示されているディクテーション結果の誤
認識や漢字変換誤りを修正する部分を指摘し、例えばキ
ーやボタンやジョグダイアルといった音声以外の情報入
力部11、もしくは音声認識部5より修正情報信号11
0を入力する。
The correction unit 9 then uses the cursor to point out a part that corrects erroneous recognition of dictation results and kanji conversion errors displayed in units of partial sentences, and, for example, uses keys, buttons, and jog dials other than voices. The correction information signal 11 from the information input unit 11 or the speech recognition unit 5
Enter 0.

【0026】ここで、具体的な修正方法について説明す
る。各行に表示されている部分文単位で修正する場合と
各行に表示されている部分文の先頭の形態素単位で修正
する場合を区別するため、例えば各行に表示されている
部分文を示すときは部分文の前にある数字上にカーソル
を置き、部分文の先頭の形態素を修正したいときは各形
態素を区切る印にカーソルを置いた後修正作業を行うも
のとする。
Here, a specific correction method will be described. In order to distinguish between a case where correction is performed in units of partial sentences displayed in each line and a case where correction is performed in units of the first morpheme of a partial sentence displayed in each line, for example, when indicating a partial sentence displayed in each line, use a partial When the cursor is placed on the numeral in front of the sentence and the morpheme at the head of the partial sentence is to be corrected, the cursor is placed on the mark separating each morpheme and then the correction operation is performed.

【0027】部分文表示部10は、部分文毎に行を変え
て表示してあるので、ディクテーション結果の誤認識や
漢字変換誤りを部分文単位で修正したい場合、カーソル
をそのまま下に動かし、修正したい部分文の前に移動す
るか、行番号を指定して、カーソルを部分文の前に移動
し、誤認識の場合は、その後部分文を発声し直すか文字
を打ち込む等の修正を行い、漢字変換誤りの場合は、カ
ーソルを修正部の前に持ってきた後、変換候補を表示
し、正しい漢字を選択する。
The partial sentence display section 10 displays the partial sentence by changing the line. Therefore, when it is desired to correct erroneous recognition of a dictation result or kanji conversion error in partial sentence units, move the cursor downward as it is and correct it. Move the cursor to the sub-sentence you want to use or specify the line number, move the cursor to the sub-sentence, and in the case of misrecognition, re-utter the sub-sentence or type in characters, etc. In the case of a kanji conversion error, bring the cursor in front of the correction section, display conversion candidates, and select a correct kanji.

【0028】部分文中のある形態素単位で修正したい場
合は修正したい形態素を含む部分文の前までカーソルを
移動し、右に形態素単位で移動させるという修正時のカ
ーソル移動において制限を持つことで早く修正個所に移
動できる。また、一部分文中の形態素はそれほど多くは
ないので、修正したい形態素は何行目部分文の先頭から
何番目にあるかは見て容易に理解できる。そこで、例え
は携帯電話のように数字ボタンがある場合は行番号と形
態素が部分文先頭から何番目にあるかという番号を入力
することにより、容易に修正したい形態素の前にカーソ
ルを移動し、修正を行うことができる。なおこの形態素
を示す2数字は音声認識により行うこともできる。
When it is desired to modify a partial morpheme in a partial sentence, the cursor is moved to the position before the partial sentence including the morpheme to be modified, and the cursor is moved to the right in morpheme units. Can be moved to a location. Also, since there are not so many morphemes in a partial sentence, it is easy to see at what line the morpheme to be corrected is located from the beginning of the partial sentence. So, for example, if there is a number button like a mobile phone, move the cursor to the morpheme that you want to easily modify by entering the line number and the number of the morpheme from the beginning of the partial sentence, Corrections can be made. Note that the two numbers indicating this morpheme can also be obtained by voice recognition.

【0029】修正部9での修正が終わると、確定操作を
行う。これは部分文に分割されているディクテーション
結果111を連結する部分文連結部14で部分文の連結
により修正されたディクテーション結果112を作成
し、それを確定用表示部13に送る。確定用表示部13
では以前に入力された文章に続けて新しく確定されたデ
ィクテーション結果を表示する。
When the correction in the correction section 9 is completed, a fixing operation is performed. In this, a dictation result 112 corrected by concatenation of partial sentences is created in a partial sentence linking unit 14 for linking the dictation results 111 divided into partial sentences, and is sent to the display unit 13 for confirmation. Confirmation display unit 13
Displays the newly determined dictation result following the previously entered text.

【0030】確定した文113は、通信部15により有
線または無線等を用いて送信する。
The determined sentence 113 is transmitted by the communication unit 15 using a wired or wireless communication.

【0031】なお、部分文表示部10と確定用表示部1
3は例えば図3のようにディクテーションシステムの持
つ表示部を二分する形で同時に表示しても良いし、例え
ば図4のようにディクテーション結果を修正するときは
ディクテーションシステムの持つ表示部に部分文表示部
のみを表示し、修正後確定操作を行った後はディクテー
ションシステムの表示部には確定用表示部のみを表示す
る。
It should be noted that the partial sentence display section 10 and the confirmation display section 1
For example, as shown in FIG. 3, the display unit of the dictation system may be displayed in two parts, as shown in FIG. 3, or the dictation result may be corrected as shown in FIG. Only the part is displayed, and after performing the correction operation after correction, only the display part for determination is displayed on the display part of the dictation system.

【0032】ここで、確定用表示部は例えば、メールソ
フトやワープロソフトのアプリケーションの表示画面で
あり、他の表示サイズを持つ機器にディクテーション結
果を送信できる。
Here, the confirmation display section is, for example, a display screen of an application of mail software or word processing software, and can transmit a dictation result to a device having another display size.

【0033】[0033]

【発明の効果】以上説明したように本発明では、一行に
入る文字数が少ない表示形態である機器に対し、ディク
テーション結果を見やすく分け、簡単に修正個所にカー
ソルを移動できる。よってユーザーは自分の発声結果を
容易に修正ができるため、狭い表示部しか持たない機器
でも、ディクテーションによる文章作成が容易なヒュー
マンインターフェイスを実現できる。
As described above, according to the present invention, the dictation result can be easily distinguished and the cursor can be easily moved to the correction position for a device having a display mode in which the number of characters per line is small. Therefore, the user can easily correct his / her own utterance result, so that even a device having only a narrow display unit can realize a human interface that can easily create sentences by dictation.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態1におけるディクテーショ
ンシステムの構成を示すブロック図
FIG. 1 is a block diagram showing a configuration of a dictation system according to Embodiment 1 of the present invention.

【図2】同実施の形態における部分文表示部の表示例を
示す表示画面図
FIG. 2 is a display screen diagram showing a display example of a partial sentence display unit in the embodiment.

【図3】同実施の形態における部分文表示部と確定用表
示部が同時に表示されている表示例を示す表示画面図
FIG. 3 is a display screen diagram showing a display example in which a partial sentence display unit and a display unit for confirmation are simultaneously displayed in the embodiment.

【図4】同実施の形態における部分文表示部と確定用表
示部が別に表示される表示例を示す表示画面図
FIG. 4 is an exemplary display screen showing a display example in which a partial sentence display unit and a confirmation display unit are displayed separately according to the embodiment;

【図5】従来技術の表示例を示す図FIG. 5 is a diagram showing a display example of the related art

【符号の説明】[Explanation of symbols]

1 音声入力部 2 特徴抽出部 3 言語モデル 4 音響モデル 5 音声認識部 6 部分文作成部 7 表示情報 8 文法情報 9 修正部 10 部分文表示部 11 音声以外の情報入力部 12 表示部 13 確定用表示部 14 部分文連結部 15 通信部 16 例文記憶部 101 入力音声信号 102 音響モデルデータ 103 言語モデルデータ 104 音響パラメータ 105 ディクテーション結果 106 表示情報データ 107 文法情報データ 108 部分文信号 109 修正状態にある部分文信号 110 修正情報信号 111、112 ディクテーション結果 113 確定した文 DESCRIPTION OF SYMBOLS 1 Speech input part 2 Feature extraction part 3 Language model 4 Acoustic model 5 Speech recognition part 6 Partial sentence creation part 7 Display information 8 Grammar information 9 Correction part 10 Partial sentence display part 11 Information input part other than voice 12 Display part 13 Confirmation Display unit 14 partial sentence connection unit 15 communication unit 16 example sentence storage unit 101 input speech signal 102 acoustic model data 103 language model data 104 acoustic parameters 105 dictation result 106 display information data 107 grammar information data 108 partial sentence signal 109 part in a corrected state Sentence signal 110 Correction information signal 111, 112 Dictation result 113 Determined sentence

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 551B 561C (72)発明者 石田 明 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 Fターム(参考) 5B009 KB04 RB01 5D015 AA05 KK02 5E501 AA04 AA11 AA23 AB03 AC34 EB15 EB17 EB19 EB20 FA02 FB22 9A001 HH15 HH17 JZ77 ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G10L 15/00 G10L 3/00 551B 561C (72) Inventor Akira Ishida 3-chome, Higashi-Mita, Tama-ku, Kawasaki-shi, Kanagawa Prefecture. No.10 No.1 Matsushita Giken Co., Ltd. F-term (reference) 5B009 KB04 RB01 5D015 AA05 KK02 5E501 AA04 AA11 AA23 AB03 AC34 EB15 EB17 EB19 EB20 FA02 FB22 9A001 HH15 HH17 JZ77

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 入力音声を認識し、予め設定された表示
情報と文法情報を用いて、前記認識結果から部分文を作
成し、必要に応じて修正された部分文を連結して文と
し、前記部分文または前記連結された文を表示すること
を特徴とするディクテーション方法。
An input speech is recognized, a partial sentence is created from the recognition result using preset display information and grammatical information, and a corrected partial sentence is connected as necessary to form a sentence. A dictation method comprising displaying the partial sentence or the connected sentence.
【請求項2】 音声を入力する入力手段と、前記入力手
段からの入力音声を認識する認識手段と、予め設定され
た表示情報と文法情報を用いて、前記認識結果から部分
文を作成する部分文作成手段と、前記作成された部分文
を修正する修正手段と、前記修正手段により修正された
部分文を連結し、文にする部分連結手段と、前記部分文
または前記連結された文を表示する表示手段とを有する
ことを特徴とするディクテーションシステム。
2. An input unit for inputting a voice, a recognition unit for recognizing an input voice from the input unit, and a part for creating a partial sentence from the recognition result using preset display information and grammatical information. Sentence creating means, correcting means for correcting the created partial sentence, partial connecting means for connecting the partial sentences corrected by the correcting means to form a sentence, and displaying the partial sentence or the connected sentence A dictation system comprising:
【請求項3】 表示手段は、部分文を表示する領域と部
分文を連結した文を表示する領域とが分離していること
を特徴とする請求項2記載のディクテーションシステ
ム。
3. The dictation system according to claim 2, wherein the display means separates an area for displaying the partial sentence from an area for displaying a sentence connecting the partial sentences.
【請求項4】 表示情報は、一行に表示可能な文字数で
あることを特徴とする請求項2記載のディクテーション
システム。
4. The dictation system according to claim 2, wherein the display information is the number of characters that can be displayed on one line.
【請求項5】 部分文は、意味を持つ最小単位である形
態素を基本単位とすることを特徴とする請求項2から4
のいずれかに記載のディクテーションシステム。
5. The sub-sentence according to claim 2, wherein a basic unit is a morpheme which is a minimum unit having a meaning.
The dictation system according to any one of the above.
【請求項6】 文法情報は、部分文の始めや終わりを形
態素の例えば品詞といった分類結果によって決定するこ
とを特徴とする請求項2記載のディクテーションシステ
ム。
6. The dictation system according to claim 2, wherein the grammatical information determines the beginning and end of the sub-sentence based on a classification result of a morpheme such as a part of speech.
【請求項7】 複数の例文を記憶した例文記憶手段と、
例文を予め設定された表示情報と文法情報を用いて、部
分文に変換する部分文変換手段と、前記部分文の修正位
置にカーソルを移動する修正入力手段と、音声を入力す
る入力手段と、前記入力手段からの入力音声を認識する
認識手段と、前記認識結果から部分文を作成する部分文
作成手段と、前記作成された部分文により前記修正位置
に存在する部分文を修正する修正手段と、前記修正手段
により修正された部分文を連結し、文にする部分連結手
段と、前記部分文または前記連結された文を表示する表
示手段とを有することを特徴とするディクテーションシ
ステム。
7. An example sentence storage means for storing a plurality of example sentences,
Using a display information and grammar information set in advance of the example sentence, a partial sentence conversion unit that converts the sentence into a partial sentence, a correction input unit that moves a cursor to a correction position of the partial sentence, and an input unit that inputs a voice, Recognizing means for recognizing an input voice from the input means, partial sentence creating means for creating a partial sentence from the recognition result, and correcting means for correcting a partial sentence located at the correction position by the created partial sentence; A dictation system comprising: a partial connecting unit that connects the partial sentences corrected by the correcting unit to form a sentence; and a display unit that displays the partial sentence or the connected sentence.
【請求項8】 請求項2から7のいずれかに記載のディ
クテーションシステムを用いた携帯端末装置において、
連結した文を送受信する通信手段を設けたことを特徴と
する携帯端末装置。
8. A portable terminal device using the dictation system according to claim 2;
A mobile terminal device comprising communication means for transmitting and receiving a connected sentence.
【請求項9】 例文記憶手段は、送受信した文を例文と
して記憶することを特徴とする請求項7記載の携帯端末
装置。
9. The portable terminal device according to claim 7, wherein the example sentence storage unit stores the sent / received sentence as an example sentence.
JP2000062858A 2000-03-08 2000-03-08 Method and system for dictation, and portable terminal device Pending JP2001249687A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000062858A JP2001249687A (en) 2000-03-08 2000-03-08 Method and system for dictation, and portable terminal device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000062858A JP2001249687A (en) 2000-03-08 2000-03-08 Method and system for dictation, and portable terminal device

Publications (1)

Publication Number Publication Date
JP2001249687A true JP2001249687A (en) 2001-09-14

Family

ID=18582814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000062858A Pending JP2001249687A (en) 2000-03-08 2000-03-08 Method and system for dictation, and portable terminal device

Country Status (1)

Country Link
JP (1) JP2001249687A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514020A (en) * 2005-10-28 2009-04-02 マイクロソフト コーポレーション Combination of voice and alternative input methods on mobile devices

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514020A (en) * 2005-10-28 2009-04-02 マイクロソフト コーポレーション Combination of voice and alternative input methods on mobile devices

Similar Documents

Publication Publication Date Title
US8407039B2 (en) Method and apparatus of translating language using voice recognition
CN101067780B (en) Character inputting system and method for intelligent equipment
JP4574390B2 (en) Speech recognition method
TWI293455B (en) System and method for disambiguating phonetic input
US7260529B1 (en) Command insertion system and method for voice recognition applications
US9123341B2 (en) System and method for multi-modal input synchronization and disambiguation
KR101819458B1 (en) Voice recognition apparatus and system
US20130080146A1 (en) Speech recognition device
JP6150268B2 (en) Word registration apparatus and computer program therefor
JP2010055044A (en) Device, method and system for correcting voice recognition result
JP2002125050A (en) Method for oral interpretation service and oral interpretation service
JP3476007B2 (en) Recognition word registration method, speech recognition method, speech recognition device, storage medium storing software product for registration of recognition word, storage medium storing software product for speech recognition
JP2002116793A (en) Data input system and method
JP2016521383A (en) Method, apparatus and computer readable recording medium for improving a set of at least one semantic unit
JP2010197669A (en) Portable terminal, editing guiding program, and editing device
JP3104661B2 (en) Japanese writing system
JP5396530B2 (en) Speech recognition apparatus and speech recognition method
JP5160594B2 (en) Speech recognition apparatus and speech recognition method
JP4189336B2 (en) Audio information processing system, audio information processing method and program
JP5238395B2 (en) Language model creation apparatus and language model creation method
JP2013238880A (en) Portable terminal, editing guiding program, and editing guiding method
JP4230142B2 (en) Hybrid oriental character recognition technology using keypad / speech in adverse environment
JP3726783B2 (en) Voice recognition device
JP2001249687A (en) Method and system for dictation, and portable terminal device
JP3411198B2 (en) Interpreting apparatus and method, and medium storing interpreting apparatus control program