WO2002039425A1 - V-mode conversation method and system using portable telephone, and v-mode center - Google Patents
V-mode conversation method and system using portable telephone, and v-mode center Download PDFInfo
- Publication number
- WO2002039425A1 WO2002039425A1 PCT/JP2000/007921 JP0007921W WO0239425A1 WO 2002039425 A1 WO2002039425 A1 WO 2002039425A1 JP 0007921 W JP0007921 W JP 0007921W WO 0239425 A1 WO0239425 A1 WO 0239425A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- mobile phone
- mode
- user
- server
- service type
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 7
- 230000002452 interceptive effect Effects 0.000 claims description 36
- 238000004891 communication Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000008054 signal transmission Effects 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 2
- 208000010415 Low Vision Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004303 low vision Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4938—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/60—Medium conversion
Definitions
- the present invention relates to a voice-based dialogue with a mobile phone in an environment where a mobile phone can connect to a network and receive various services.
- V-mode interaction methods systems and V-mode services using a mobile phone that can connect to an IP server or www server of the desired service type through i-mode (registered trademark) and WAP services
- i-mode registered trademark
- WAP services The use of mobile phones designed to perform desired input from various types of available services through natural and appropriate dialogue with mobile phones.
- the V-mode interaction method, system and V-mode center The V-mode interaction method, system and V-mode center.
- the i-mode (registered trademark) function provided by NTT DOCOMO provides a wide variety of functions for the Internet age, such as e-mail, information content provision, and homepage browsing on a single mobile phone. It is already establishing a firm position in the industry. NTT Docomo's i-mode (registered trademark) service, which started service in February 1999, has already exceeded 200,000 service subscribers as of the end of October 1999, and is still accelerating. It is a momentum to increase it.
- i-mode registered trademark
- the functions of i-mode can be broadly divided into three services.
- the first is the e-mail function. It is possible to send and receive e-mail to the Internet even though it is as small as 250 characters per mail, and a dedicated mail address is also provided
- the second is information content.
- information content In addition to news, weather forecasts, economic information such as stock prices, travel information, town and gourmet information, entertainment and other information-based services, mobile banking, ticket reservations, online trading, etc. Interactive content is also available. And, type III, you can browse the Internet homepage while displaying text-based simple display (small images can also be displayed).
- the DDI Cellular Group and ID0 Telecommunications Co., Ltd. launched a cdmaOne (registered trademark) service equipped with a browser that uses a new protocol called WAP (Wireless Communication Protocol). It was realized.
- the content of the information service using WAP is the provision of various information contents such as news, information, amusement, ticket reservation, shopping, etc., plus e-mail (200 characters received).
- the cdmaOne (registered trademark) service will perform packet communication at 64 kbps, which is significantly higher than the 96-kbps i-mode (registered trademark) data communication speed. As a result, the capacity of communication contents has begun to increase.
- the work itself to specify the service desired by the mobile phone user is performed using a selection key having scrolling up and down (left and right) and a selection function and / or a standard numeric keypad. It was like. Therefore, when the menu of services becomes enormous, there are drawbacks that the user must scroll the screen endlessly to identify the service desired by the user, or cannot be overlooked. And even if they were found, the time it took to find the service they wanted, except for the ones they used frequently, was extremely long. Furthermore, with the miniaturization of mobile phones, the screen for displaying text information was only about 5 cm square, making it difficult or invisible for people with low vision.
- the present invention meets the above-mentioned demand, and a V-mode interactive method using a mobile phone and a V-mode interactive system using a mobile phone that enable anyone to easily search for a desired service type in a short time.
- the purpose is to provide.
- the present invention further provides a V-mode interactive method using a mobile phone and a V-mode interactive system using a mobile phone that can reduce the number of accesses to the host computer overnight and reduce the billing fee.
- the purpose is to do.
- the present invention further provides a V-mode interactive method using a mobile phone and a V-mode interactive system using a mobile phone that can reliably search for a desired service type by asking the user. Aim.
- the present invention further provides a V-mode interactive method using a mobile phone capable of searching for a desired service type by querying for synonyms, synonyms, and related words when a candidate service type is not found.
- the purpose is to provide a V-mode conversation system using a telephone.
- the present invention further aims to reduce the time by using a conventional screen display selection method when it is expected that a long time will be required for the voice reading method when there are a plurality of options.
- the purpose of the present invention is to provide a V-mode interactive method using a mobile phone and a V-mode interactive system using a mobile phone.
- a first aspect of the present invention to achieve the above object is to connect to an IP server or a www server of a desired service type via a network through a natural and appropriate conversation with a mobile phone.
- a V-mode dialogue method using a mobile phone wherein a service type that can be provided to a mobile phone user, and a type identification word used to specify the service type are stored in a database.
- the user's mobile phone Receiving V-mode intention indication from the user, and recognizing the voice input from the user of the mobile phone, and using the word for type identification obtained by word decomposition and word analysis to receive through the network V-mode using a mobile phone, comprising a step of specifying a service type of the service and a step of accessing an IP server or a www server of the specified service type via a network.
- a mobile phone comprising a step of specifying a service type of the service and a step of accessing an IP server or a www server of the specified service type via a network.
- the host computer obtains the content from the IP server or the www server and provides the content to the user, or causes the IP server or the www server to perform a predetermined operation for the user.
- the V-mode interactive method using the mobile phone according to the first aspect wherein the mobile phone is provided with an external or built-in memory and / or CPU, and And a step of downloading a speech recognition software prepared on the host computer side, a service type, and a type specifying word used for specifying the service type from the host computer to the mobile phone via a wireless line. It is characterized by having.
- the V-mode interactive method using the mobile phone according to the first or second aspect further comprising a service in which an utterance sent from a user is to be received via a network.
- the method is characterized in that it includes a step of asking the user if the type cannot be specified.
- the process of returning to the user when no candidate is found includes synonyms, synonyms, and synonyms. It is performed by a query sentence that inquires related words.
- the step of returning to the user when there are a plurality of candidates is performed on a screen display unit of the mobile phone.
- a feature is that a plurality of candidates are displayed, and a mobile phone user selects an optimum one from among the candidates and makes the selection by voice or key input. Thereby, additional information for specifying the service type is obtained.
- a second aspect of the present invention is to provide a mobile phone using a mobile phone that can connect to an IP server www server of a desired service type through a network through a natural and appropriate dialogue with the mobile phone.
- Means for indicating intention to use the V-mode conversion control means for converting voice from a user into voice signals, voice signal transmission / reception control means for transmitting / receiving voice signals to / from a host computer, and transmission from a host computer.
- a mobile phone comprising voice synthesis control means for generating voice by synthesizing the voice signal sent thereto;
- a host computer that can be connected to an IP server or www server, and a type identification word recording unit that records type identification words used to identify service types, voice recognition software, word decomposition software, word analysis
- a memory having an application recording unit for recording application such as software and voice synthesis software, an audio signal transmission / reception control means for transmitting / receiving an audio signal to / from a mobile phone, and an audio signal transmitted from the mobile phone.
- Voice data conversion control means for converting to voice data, and calling various software from memory, voice recognition of voice data from mobile phone users, word decomposition-word analysis to extract type identification words
- the user of the mobile phone tries to receive through the network by means of the extraction control means of the type identification word and the extracted type identification word.
- Using a mobile phone comprising service type specifying control means for specifying a service type to be used, and access control means for accessing an IP server or a www server of the specified service type via a network. Provides all V-mode interactive systems.
- the host computer obtains the content from the IP server or the www server and provides the content to the user, or causes the IP server or the www server to perform a predetermined operation for the user.
- a V-mode center of a V-mode interactive system using the above-mentioned mobile phone is provided.
- FIG. 1 is a flowchart of one embodiment of a V-mode interactive method using a mobile phone according to the first aspect of the present invention.
- FIG. 2 is a block diagram showing an embodiment of a system for implementing the V-mode dialog system shown in FIG.
- FIGS. 3 (a) and 3 (b) are block diagrams for explaining the details of the mobile phone 10 and the host computer 20 of FIG. 2, respectively.
- FIG. 1 is a flowchart of one embodiment of a V-mode conversation method using a mobile phone according to the first embodiment of the present invention
- FIG. 2 is a flowchart of the V-mode shown in FIG.
- FIG. 1 is a block diagram showing an embodiment of a system for implementing a virtual conversation system.
- the topics dialogue method generally includes a database formation step (step 1), a V mode use intention display step (step 2), and a service type identification step (step 3). ), And an identified service execution process (step 4).
- step 1 in the V-mode interactive method using a mobile phone according to the first aspect of the present invention, first, it is assumed that the host computer that manages a system for implementing the V-mode interactive method has an interactive mode. O Build a data pace for
- the database stores at least service types that can be provided to mobile phone users and type identification words used to identify service types (see Fig. 4).
- the service type includes, for example, news, weather forecast, stock price information, and town information in the life and information genre.
- Entertainment genres include fortune-telling, games, karaoke information, character distribution, and FM song information.
- the business genres include mobile banking, mobile pile trading, airline information, life insurance information, and ticket reservations.
- transaction-based service types in general, rather than acquiring content from an IP server or WWW server and providing it to mobile phone users, transfer funds or purchase tickets at an IP server or www server For example, a service to perform predetermined work for the user will be provided.
- this service type is more than 300000 just registered with NTT DoCoMo, and for each type, the individual service provided by the service institution is Services are provided at the level of several times to several thousands and tens of thousands of times.
- a dialog is used with a mobile phone and, therefore, with a host computer connected to the mobile phone via a wireless line.
- searching for individual and subdivided services within the service can also be performed by interaction with the mobile phone. It is possible.
- the type identification word used to identify a service type refers to a keyword capable of distinguishing a service type from other service types as described above.
- “news” means not only the keyword “news” but also the name of the newspaper, news agency, or television station that provided the news, or the content of news such as three-sided articles, incidents, economics, entertainment, science, sports Can also be selected.
- “stock price information” not only the keyword “stock price information” but also key indicators such as the names of stock exchanges such as the First Section of the Tokyo Stock Exchange, Nasdaq, and Mothers “commonly known as“ JPY average stock price ”and“ TOPIX ”can be selected.
- the key records and analyzes what words the user tried to express for a certain service type, and identified some of the most frequently used ones as “type specific "Word". For example, when a user thinks "I want to know the trend of the Nikkei Stock Average in a specific month.””EconomicIndices”,”EconomicNews”,”I want to know stock price information”, “Statistics of Nikkei Stock Average”, “Trend of Nikkei Stock Average in October”, etc. They ask various words.
- a plurality of keywords are prepared so that a desired service type can be correctly specified. In the case of general terms such as "economy” and "news”, there are multiple candidates. In this case, as described later, it is possible to specify one service type by further performing an inquiry for narrowing down.
- the user indicates the intention to use the V mode on the mobile phone.
- Indication of intention can be made by voice or by using input means provided on the mobile phone.
- a key for the V mode is installed on a mobile phone having an i-mode (registered trademark) function (reference numeral 13 in FIG. 2). And it can be constructed to change the mobile phone to V mode by pressing this. That is, select the V mode in which input is performed by voice dialogue with the input means for inputting mechanically while viewing the character information displayed on the image display unit 12 used in the i-mode (registered trademark) on the mobile phone. Install a switch. Then, when the user of the mobile phone selects the V mode, the mobile phone is set to the V mode. In addition, if the mobile phone is a V-mode dedicated machine, it will automatically display the intention to use V-mode when the power is turned on.
- step 3 the host computer first recognizes the voice input from the user of the mobile phone and extracts words for type identification by word decomposition and word analysis. At this time, the type identification word used to identify the service type and the service type stored in the database of the host computer is used. The service type that is to be received via the network is specified by the extracted type specifying words.
- these functions can be transferred from the host computer to mobile phones.
- an external or internal memory and / or CPU for example, it is possible to download voice recognition software, service types and type identification words prepared by the host computer from the host computer to the mobile phone via a wireless line. Can be. Then, the mobile phone itself recognizes the voice input from the user by voice, Decompose words ⁇ Extract words for type identification by word analysis. Furthermore, after identifying the service type that is to be received via the network by using the extracted type identification word, the host computer is accessed and such a service type is identified.
- It can be configured to connect to an IP server or a www server. This has the effect of reducing the number of accesses from the mobile phone to the host computer, thereby reducing billing charges.
- a speech input from a user of a mobile phone is speech-recognized.
- the desired service type can be specified quickly. If no candidate for the service type using such a keyword is found, candidates for synonyms, synonyms, related words, etc. are displayed on the screen display of the mobile phone, and the list of mobile phone users is displayed from the list. Can be selected by voice or key input. Alternatively, ask the user to replace it with an appropriate keyword using a query such as "The service type requested cannot be identified with XXX. Please re-express it with synonyms, synonyms, related words, etc.” It can also be used.
- a plurality of service type candidates using such a keypad.
- candidates can be displayed on the screen display of the mobile phone, and the mobile phone user can select the most suitable one from the list and perform it by voice or key input.
- the target service type is specified on the host computer side by interacting with the mobile phone, so that the user is extremely easy to use.
- the number of conversations until the target service type is specified may be one to several times, and the time required is one to several seconds.
- the host computer connects the mobile phone to the IP server or WWW server of the service type via the network. Thereafter, the mobile phone acquires the content from the IP server or WWW server of the service type and provides it to the user, or if it is a transaction type, the desired work for the user is i-mode ( It is the same as a mobile phone with a registered trademark function.
- FIG. 2 is a block diagram of one embodiment of a V-mode interactive system using a mobile phone according to the second aspect of the present invention.
- the V-mode interactive system 1 generally includes a mobile phone 10 that can use the V-mode, and a host computer 20 that can be connected to the mobile phone 10 by wireless communication. It is comprised including.
- the host computer 20 is connected to an IP server 40 or a WWW server 42 of a desired service type via a network 30. It is connected to an IP server for mobile banking, online trading, and other trading systems via a dedicated line 32 so that no third party can intervene.
- Other networks can use the INN network 34 as it is.
- the system is constructed so that it can be used in conjunction with the i-mode (registered trademark) system of NTT DoCoMo.
- the wireless communication from the mobile phone 10 is received by the relay antenna 51 managed by NTT DOCOMO, and is connected to the i-mode sensor 55 via the NTT DOCOMO packet network 53. Then, when the user of the mobile phone 10 selects the V mode with the mobile phone 10, It is connected to the V-mode center 60 having the host computer 20 and the V-mode interactive method using the mobile phone according to the first aspect of the present invention described above can be performed.
- the V-modem 60 has its own relay antenna or satellite, it will be able to receive the radio waves of the mobile phone 10 directly. In that case, the V-mode sensor 60 can connect the mobile phone 10 with the IP server 40 and / or the WWW server 42 without going through the i-mode sensor 55. Become. '
- the mobile phone 10 is equipped with a standard equipment for a mobile phone that can use the i-mode (registered trademark) function, for example, a speaker / microphone (not shown).
- a standard equipment for a mobile phone that can use the i-mode (registered trademark) function, for example, a speaker / microphone (not shown).
- input keys 11 such as a numeric keypad, a liquid crystal monitor 12 and the like, a button switch 13 for indicating an intention to use the V mode, a memory 14, and a CPU 16 are provided.
- the CPU 16 includes a conversion control unit 16a for converting a voice from a user into a voice signal, a voice signal transmission / reception control unit 16b for transmitting / receiving a voice signal to / from the host computer 20, and a host computer.
- the voice synthesizing control means 16 c is provided which synthesizes a voice signal transmitted from the speaker 20 and sounds it from a speaker.
- the host computer 20 can be connected to many mobile phones 10 by wireless communication. In addition, it can be connected to the IP server 40 and the WWW server 42 via the network 30.
- the host computer 20 is generally provided with a memory 22 and a CPU 24.
- the memory 22 includes a type identification word recording unit 22 a for recording a service type and a type identification word used to identify the service type, a speech recognition software and a word decomposition software-a word analysis software. It has an application recording unit 22b for recording applications such as voice synthesis software.
- the CPU 24 includes an audio signal transmission / reception control means 24 a for transmitting and receiving an audio signal to and from the mobile phone 10, and an audio signal for converting an audio signal sent from the mobile phone 10 into an audio signal. Evening conversion control means 24 b and various software are called from memory 22 to recognize voice data from mobile phone users and perform word decomposition and word analysis to classify them. Service type identification that identifies the service type that the mobile phone user is trying to receive via the network, based on the type identification word extraction control means 24c that extracts the identification word, and the extracted type identification word. It is configured to include control means 24d and access control means 24e for accessing an IP server or a WWW server of the specified service type via a network.
- the audio signal from the mobile phone 10 is output in the i-mode. It is sent to V-mode Send / Receiver 60 via Send / Receiver 55.
- the user can input in either a keyed or text-based dialogue.
- keywords it is preferable to speak a plurality of keywords. Thereby, a desired service type can be specified accurately and in a short time.
- the voice signal from the mobile phone 10 is received by the voice signal transmission / reception control means 24a, and further converted into voice data readable by a computer by the voice data conversion control means 24.
- the extraction control means 24 c calls the speech recognition software from the application recording unit 22 b of the memory 22 and the type identification word from the type identification word recording unit 22 a. Then, voice data from the mobile phone user converted by the voice data conversion control means 24b is recognized. Next, the words for type identification obtained by word decomposition and word analysis are extracted, and the type of service that the user of the mobile phone 10 is going to receive via the network is identified. Subsequently, the host computer 20 of the V-mode server 60 accesses the IP server 40 or the WWW server 42 of the specified service type via the network 30.
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
A V-mode conversation method for connection of a portable telephone to an IP server or a WWW server of a desired service type over a network through natural, adequate conversation comprising a step of storing service types and specific words sorted by type in a database (step 1), a step of receiving declaration of intention of use of the V-mode from the portable telephone of the user (step 2), a step of recognizing the inputted speech of the user and specifying the service type on the basis of the specific words sorted by type determined by word decomposition/analysis (step 3), and a step of accessing an IP server or WWW server of the specified type through a network (step 4).
Description
明細書 Specification
携帯電話を使っての Vモード対話方法、 システム及び Vモードセンタ 本発明は、 携帯電話からネッ トワークに接続して種々のサービスを受けること ができるような環境下で、 音声による携帯電話との対話を通じて所望のサービス 種別の I pサーバや wwwサーバに接続することができる携帯電話を使っての V モード対話方法、 システム及び Vモードセン夕に係り、 特に、 iモード (登録商 標) や W A Pサービスといった携帯電話の情報端末化に伴い行われる、 利用でき る種々のサービス種別から所望のものを選択する入力作業を、 携帯電話との自然 な且つ適切な対話を通じて行うようにした携帯電話を使っての Vモード対話方法、 システム及び Vモ一ドセンタに関する。 TECHNICAL FIELD The present invention relates to a voice-based dialogue with a mobile phone in an environment where a mobile phone can connect to a network and receive various services. On V-mode interaction methods, systems and V-mode services using a mobile phone that can connect to an IP server or www server of the desired service type through i-mode (registered trademark) and WAP services The use of mobile phones designed to perform desired input from various types of available services through natural and appropriate dialogue with mobile phones. The V-mode interaction method, system and V-mode center.
抟術の皆景 All views of art
携帯電話の加入者は、 平成 1 1年 1 0月末の時点で 4 7 0 0万に達しており、 携帯電話は、 まさに驚くべきスピードで普及してきている。 また、 携帯電話に対 する市場のニーズも、 徐々に変化してきている。 音声によって友人と話したりビ ジネスの手段としてコミュニケ一ションの道具で使うといった使い方から、 パソ コンを接続してネッ トワークとのデ一夕通信を日常的に行うユーザも増えてきて いる。 このような背景から、 携帯電話そのものにネッ トワークへの接続機能を持 たせた iモード (登録商標) や W A Pサービスといった携帯電話が登場し、 市場 を席捲している。 As of the end of October 2001, the number of mobile phone subscribers had reached 4.7 million, and mobile phones have become very popular at an amazing speed. The market needs for mobile phones are also slowly changing. Due to the use of voice to talk with friends and use it as a means of business with communication tools, the number of users who are connected to a personal computer and perform overnight communication with the network is increasing. Against this background, mobile phones such as i-mode (registered trademark) and WAP services, in which mobile phones themselves have the function of connecting to a network, have emerged, and are sweeping the market.
N T T ドコモ社が提供している iモード (登録商標) 機能は、 携帯電話単体で、 Eメール、 情報コンテンツの提供、 ホームページ閲覧といったインターネッ ト時 代に対応したバラエティーに富んだ機能を実現しており、 早くも業界の中で確固 たる地位を築きつつある。 1 9 9 9年 2月からサービスを開始した N T T ドコモ 社の iモード (登録商標) は、 1 9 9 9年 1 0月末現在で既にサービス加入者が 2 0 0万を突破し、 現在も加速度的に増加させる勢いである。 The i-mode (registered trademark) function provided by NTT DOCOMO provides a wide variety of functions for the Internet age, such as e-mail, information content provision, and homepage browsing on a single mobile phone. It is already establishing a firm position in the industry. NTT Docomo's i-mode (registered trademark) service, which started service in February 1999, has already exceeded 200,000 service subscribers as of the end of October 1999, and is still accelerating. It is a momentum to increase it.
iモード (登録商標) の機能は大きく分けて 3つのサービスに分けられる。 第 一は、 Eメール機能である。 1メール 2 5 0文字と少ないながらも、 イン夕一ネ V トへ電子メールを送受信することができ、 専用のメールァドレスも付与される
第二は、 情報コンテンツである。 ニュース、 天気予報、 株価等の経済情報、 旅 行情報、 タウン · グルメ情報、 エンターテイメント等の情報提供型のサービス のほかに、 モバイルバンキング、 チケッ ト予約、 オンライントレ一ド等、 生活を 便利にするインタラクティブなコンテンヅも用意されている。 そして、 第 Ξは、 テキストベースの簡易表示 (小さな画像も表示可能) ながら、 インターネッ トの ホームページも閲覧することができる。 The functions of i-mode (registered trademark) can be broadly divided into three services. The first is the e-mail function. It is possible to send and receive e-mail to the Internet even though it is as small as 250 characters per mail, and a dedicated mail address is also provided The second is information content. In addition to news, weather forecasts, economic information such as stock prices, travel information, town and gourmet information, entertainment and other information-based services, mobile banking, ticket reservations, online trading, etc. Interactive content is also available. And, type III, you can browse the Internet homepage while displaying text-based simple display (small images can also be displayed).
iモード (登録商標) と同時期に、 D D Iセルラーグループと I D 0通信株 式会社が W A P (Wire less Appl ication Protocol )と呼ばれる新しいプロ トコ ルを採用したブラウザを搭載した cdmaOne (登録商標) サービスを実現した。 W A Pを利用した情報サービスの内容は、 ニュース、 情報、 アミューズメント、 チケッ 卜予約、 ショッピング等の様々な情報コンテンツの提供に、 Eメール (受 信 2 0 0 0文字) が加わったものとなっている。 cdmaOne (登録商標) サービス では、 2 0 0 0年 1月から iモード (登録商標) のデータ通信スピ一ドである 9 6 k b p sを大きく上回る 6 4 k b p sのパケヅ ト通信が行われることとなって おり、 通信内容の大容量化が始まっている。 At the same time as i-mode (registered trademark), the DDI Cellular Group and ID0 Telecommunications Co., Ltd. launched a cdmaOne (registered trademark) service equipped with a browser that uses a new protocol called WAP (Wireless Communication Protocol). It was realized. The content of the information service using WAP is the provision of various information contents such as news, information, amusement, ticket reservation, shopping, etc., plus e-mail (200 characters received). . From January 2000, the cdmaOne (registered trademark) service will perform packet communication at 64 kbps, which is significantly higher than the 96-kbps i-mode (registered trademark) data communication speed. As a result, the capacity of communication contents has begun to increase.
しかしながら、 前述のいずれのものも、 携帯電話の利用者が欲するサービスを 特定する作業自体は、 上下 (左右) へのスクロールと選択機能を有する選択キー 及び/又は標準仕様のテンキーとを用いて行うようになっていた。 従って、 サー ビスのメニューが膨大な数となると利用者が欲するサービスを特定するまでに、 画面を延々とスクロールしなければならなかったり、 見落として見つけられなか つたりといった欠点があった。 また、 たとえ見つけられたとしても、 頻繁に使用 しているサービスを除いて、 欲するサービスを探し出すまでの時間は、 極めて長 く掛かっていた。 さらに、 携帯電話の小型化に伴い、 文字情報を表示する画面は、 5 c m四方程度の大きさしかなく、 視力の弱い人には見え難い又は見えないとい つた欠点も指摘されていた。 However, in any of the above, the work itself to specify the service desired by the mobile phone user is performed using a selection key having scrolling up and down (left and right) and a selection function and / or a standard numeric keypad. It was like. Therefore, when the menu of services becomes enormous, there are drawbacks that the user must scroll the screen endlessly to identify the service desired by the user, or cannot be overlooked. And even if they were found, the time it took to find the service they wanted, except for the ones they used frequently, was extremely long. Furthermore, with the miniaturization of mobile phones, the screen for displaying text information was only about 5 cm square, making it difficult or invisible for people with low vision.
また、 テンキーを用いて文字を入力して所望のサービスを特定する方法もあ つたが、 所望のサービスを探し出すためのキーヮードを間違えると又は思い出せ ないと、 結局、 探し出すことはできないといった欠点があった。 さらに、 テンキ 一を用いて文字を記述するこの方法は、 キー数が限られている関係から一つの文
字を作成するのに何回もキーをおさなければならない欠点があった。 かかる作 業は、 一般利用者にとっては煩雑で打ち込み方法を覚えるのも大変であった。 そこで、 誰でもが簡単且つ短時間に所望のサービス種別を探し出すことがで きる携帯電話を使っての Vモード対話方法及び携帯電話を使っての Vモード対話 システムを開発することが要望されていた。 There was also a method of specifying a desired service by inputting characters using the numeric keypad, but there was a drawback that if the wrong key to search for the desired service was found or it could not be remembered, it would not be possible to find it in the end. . In addition, this method of describing characters using a numeric keypad is a single sentence due to the limited number of keys. The drawback was that the key had to be pressed many times to create the character. This work was cumbersome for ordinary users and it was difficult to learn the driving method. Therefore, there has been a demand to develop a V-mode interactive method using a mobile phone and a V-mode interactive system using a mobile phone that enable anyone to easily find a desired service type in a short time. .
本発明は、 前記要望に応えるもので、 誰でもが簡単且つ短時間に所望のサー ビス種別を探し出すことができる携帯電話を使っての Vモード対話方法及び携帯 電話を使っての Vモード対話システムを提供することを目的とする。 The present invention meets the above-mentioned demand, and a V-mode interactive method using a mobile phone and a V-mode interactive system using a mobile phone that enable anyone to easily search for a desired service type in a short time. The purpose is to provide.
本発明は、 さらに、 短時間に且つホストコンビュ一夕へのアクセス数を減ら して課金料金を少なくできる携帯電話を使っての Vモード対話方法及び携帯電話 を使っての Vモード対話システムを提供することを目的とする。 The present invention further provides a V-mode interactive method using a mobile phone and a V-mode interactive system using a mobile phone that can reduce the number of accesses to the host computer overnight and reduce the billing fee. The purpose is to do.
本発明は、 さらに、 利用者に聞き返しにより、 確実に所望のサービス種別を 探し出すことができる携帯電話を使っての Vモード対話方法及び携帯電話を使つ ての Vモード対話システムを提供することを目的とする。 The present invention further provides a V-mode interactive method using a mobile phone and a V-mode interactive system using a mobile phone that can reliably search for a desired service type by asking the user. Aim.
本発明は、 さらに、 候補となるサービス種別が見つからない場合に、 類義語、 同義語、 関連語を問合せることにより所望のサービス種別を探し出すことができ る携帯電話を使っての Vモード対話方法及び携帯電話を使っての Vモ一ド対話シ ステムを提供することを目的とする。 The present invention further provides a V-mode interactive method using a mobile phone capable of searching for a desired service type by querying for synonyms, synonyms, and related words when a candidate service type is not found. The purpose is to provide a V-mode conversation system using a telephone.
本発明は、 さらにまた、 複数の選択肢があるような場合、 音声による読み上 げ方式では時間がかかり過ぎることが予想される際に従来の画面表示による選択 方式を利用することにより時間短縮を図ることができる携帯電話を使っての Vモ 一ド対話方法及び携帯電話を使っての Vモ一ド対話システムを提供することを目 的とする。 The present invention further aims to reduce the time by using a conventional screen display selection method when it is expected that a long time will be required for the voice reading method when there are a plurality of options. The purpose of the present invention is to provide a V-mode interactive method using a mobile phone and a V-mode interactive system using a mobile phone.
発明の開示 Disclosure of the invention
前記目的を達成する本発明の第一の態様は、 ネッ トワークを介して所望のサービ ス種別の I Pサーバや wwwサーバに、 携帯電話との自然な且つ適切な対話を通 じて接続することができる携帯電話を使っての Vモード対話方法であって、 携帯 電話の利用者に提供することができるサービス種別、 サービス種別を特定するの に使用する種別特定用単語をデータペースに蓄積する工程と、 利用者の携帯電話
から Vモード利用の意志表示を受け取る工程と、 携帯電話の利用者からの音声 入力を音声認識し、 単語分解 ·単語分析して得られた種別特定用単語により、 ネッ トワークを介して受けようとしているサービス種別を特定する工程と、 そし て、 特定されたサービス種別の I Pサーバ又は wwwサーバにネッ トワークを介 してアクセスする工程とを含んで構成されてなる携帯電話を使っての Vモ一ド対 話システムを提供する。 A first aspect of the present invention to achieve the above object is to connect to an IP server or a www server of a desired service type via a network through a natural and appropriate conversation with a mobile phone. A V-mode dialogue method using a mobile phone, wherein a service type that can be provided to a mobile phone user, and a type identification word used to specify the service type are stored in a database. The user's mobile phone Receiving V-mode intention indication from the user, and recognizing the voice input from the user of the mobile phone, and using the word for type identification obtained by word decomposition and word analysis to receive through the network V-mode using a mobile phone, comprising a step of specifying a service type of the service and a step of accessing an IP server or a www server of the specified service type via a network. Provide an interactive system.
これにより、 ホストコンピュータは、 当該 I Pサーバや wwwサーバからの コンテンヅを取得して当該利用者に提供する又は当該 I Pサーバや wwwサーバ において当該利用者のために所定の作業をさせる。 As a result, the host computer obtains the content from the IP server or the www server and provides the content to the user, or causes the IP server or the www server to perform a predetermined operation for the user.
請求項 1に記載の本発明は、 請求項 1に記載の携帯電話を使っての Vモード 対話方法において、 携帯電話には、 外付け又は内蔵のメモリ及び/又は C P Uが 設置されており、 そして、 さらに、 ホストコンピュータ側にて用意した音声認識 ソフ ト、 サービス種別、 サービス種別を特定するのに使用する種別特定用単語が 無線回線により当該ホストコンピュータから前記携帯電話にダウンロードされる 工程が含まれていることを特徴とする。 According to a first aspect of the present invention, there is provided the V-mode interactive method using the mobile phone according to the first aspect, wherein the mobile phone is provided with an external or built-in memory and / or CPU, and And a step of downloading a speech recognition software prepared on the host computer side, a service type, and a type specifying word used for specifying the service type from the host computer to the mobile phone via a wireless line. It is characterized by having.
請求項 3に記載の本発明は、 請求項 1又は 2に記載の携帯電話を使っての V モード対話方法において、 さらに、 利用者からの発話文章ではネッ トワークを介 して受けようとしているサービス種別を特定できなかった場合に、 利用者に聞き 返しをする工程を含んでなることを特徴とする。 ' 請求項 4に記載の本発明は、 請求項 3に記載の携帯電話を使っての Vモード 対話方法において、 候補が見つからなかった場合における利用者への聞き返しェ 程は、 類義語、 同義語、 関連語等を問い合わせる問合せ文によって行われること を特徴とする。 According to a third aspect of the present invention, there is provided the V-mode interactive method using the mobile phone according to the first or second aspect, further comprising a service in which an utterance sent from a user is to be received via a network. The method is characterized in that it includes a step of asking the user if the type cannot be specified. '' According to the present invention as set forth in claim 4, in the V-mode interactive method using the mobile phone as set forth in claim 3, the process of returning to the user when no candidate is found includes synonyms, synonyms, and synonyms. It is performed by a query sentence that inquires related words.
請求項 5に記載の本発明は、 請求項 3に記載の携帯電話を使っての Vモード 対話方法において、 複数の候補がある場合における利用者への聞き返し工程は、 携帯電話の画面表示部に複数の候補を表示し、 その中から携帯電話利用者が最適 なものを選択して音声により又はキー入力により行わせることを特徴とする。 それにより、 サービス種別特定のための追加の情報を取得する。
本発明の第二態様は、 ネッ トワークを介して所望のサービス種別の I Pサー バゃ wwwサーバに、 携帯電話との自然な且つ適切な対話を通じて接続するこ とができる携帯電話を使っての Vモード対話システムであって、 According to a fifth aspect of the present invention, in the V-mode interactive method using the mobile phone according to the third aspect, the step of returning to the user when there are a plurality of candidates is performed on a screen display unit of the mobile phone. A feature is that a plurality of candidates are displayed, and a mobile phone user selects an optimum one from among the candidates and makes the selection by voice or key input. Thereby, additional information for specifying the service type is obtained. A second aspect of the present invention is to provide a mobile phone using a mobile phone that can connect to an IP server www server of a desired service type through a network through a natural and appropriate dialogue with the mobile phone. A mode interaction system,
Vモード利用の意思表示を行う手段と、 利用者からの音声を音声信号に変換す る変換制御手段と、 ホス トコンピュー夕との間で音声信号を送受信する音声信号 送受信制御手段と、 ホストコンピュータから送られてくる音声信号を音声合成し て発音する音声合成制御手段とを備えてなる携帯電話と、 Means for indicating intention to use the V-mode, conversion control means for converting voice from a user into voice signals, voice signal transmission / reception control means for transmitting / receiving voice signals to / from a host computer, and transmission from a host computer. A mobile phone comprising voice synthesis control means for generating voice by synthesizing the voice signal sent thereto;
無線通信により多数の携帯電話に接続可能な、 そして、 ネッ トワークを介して It can be connected to many mobile phones by wireless communication, and via a network
I Pサーバや wwwサーバに接続可能なホストコンピュータであって、 サービス 種別を特定するのに使用する種別特定用単語を記録する種別特定用単語記録部、 音声認識ソフ ト ·単語分解ソフ ト ·単語分析ソフ ト ·音声合成ソフ ト等のアプリ ケーシヨンを記録するアプリケーション記録部を有するメモリと、 携帯電話との 間で音声信号を送受信する音声信号送受信制御手段と、 携帯電話から送られてく る音声信号を音声データに変換する音声データ変換制御手段と、 メモリから各種 ソフ トを呼び出して、 携帯電話の利用者からの音声データを音声認識し、 単語分 解 -単語分析して種別特定用単語を抽出する種別特定用単語の抽出制御手段と、 抽出した種別特定用単語により、 携帯電話の利用者がネッ トワークを介して受け ようとしているサービス種別を特定するサービス種別特定制御手段と、 そして、 特定されたサービス種別の I Pサーバ又は wwwサーバにネヅ トワークを介して アクセスするアクセス制御手段とを含んで構成されてなる携帯電話を使っての V モード対話システムを提供する。 A host computer that can be connected to an IP server or www server, and a type identification word recording unit that records type identification words used to identify service types, voice recognition software, word decomposition software, word analysis A memory having an application recording unit for recording application such as software and voice synthesis software, an audio signal transmission / reception control means for transmitting / receiving an audio signal to / from a mobile phone, and an audio signal transmitted from the mobile phone. Voice data conversion control means for converting to voice data, and calling various software from memory, voice recognition of voice data from mobile phone users, word decomposition-word analysis to extract type identification words The user of the mobile phone tries to receive through the network by means of the extraction control means of the type identification word and the extracted type identification word. Using a mobile phone comprising service type specifying control means for specifying a service type to be used, and access control means for accessing an IP server or a www server of the specified service type via a network. Provides all V-mode interactive systems.
それにより、 ホストコンピュータは、 当該 I Pサーバや wwwサーバからの コンテンツを取得して当該利用者に提供する又は当該 I Pサーバや wwwサーバ において当該利用者のために所定の作業をさせる。 Accordingly, the host computer obtains the content from the IP server or the www server and provides the content to the user, or causes the IP server or the www server to perform a predetermined operation for the user.
本発明の第三態様は、 前述した携帯電話を使っての Vモード対話システムの Vモ一ドセンタを提供する。 According to a third aspect of the present invention, there is provided a V-mode center of a V-mode interactive system using the above-mentioned mobile phone.
本発明は、 以下に、 図示された好ましい実施形態に基づいて詳細に説明され るが、 図示されたものは単なる一例で、 本発明の範囲を限定するものではない。
本発明は、 添付された請求の範囲に記載された発明の精神を逸脱することなく 種々の修正 ·改変が可能であることは留意されるべきである。 The invention will be described in more detail hereinafter with reference to preferred embodiments illustrated, which are merely examples and do not limit the scope of the invention. It should be noted that various modifications and alterations of the present invention are possible without departing from the spirit of the invention described in the appended claims.
闵而の簡単な説明 Brief description of the meta
第 1図は、 本発明の第一態様に係る携帯電話を使っての Vモード対話方法の 一実施例のフローチャートである。 FIG. 1 is a flowchart of one embodiment of a V-mode interactive method using a mobile phone according to the first aspect of the present invention.
第 2図は、 第 1図に示された Vモ一ド対話システムを実施するシステムの一 実施例を示したプロック図である。 FIG. 2 is a block diagram showing an embodiment of a system for implementing the V-mode dialog system shown in FIG.
第 3図 (a ) 及び (b ) は、 それそれ、 第 2図の携帯電話 1 0及びホストコ ンビュー夕 2 0の詳細を説明するためのプロック図である。 FIGS. 3 (a) and 3 (b) are block diagrams for explaining the details of the mobile phone 10 and the host computer 20 of FIG. 2, respectively.
発昍》串施する めの暴自の形熊 昍 昍 暴 The shape of a tyrannical bear
以下、 図面を参照して本発明に係る携帯電話を使っての Vモード対話方法及び 携帯電話を使っての Vモ一ド対話システムの一実施例について詳細に説明する。 初めに、 第 1図は、 本発明の第一態様に係る携帯電話を使っての Vモード対 話方法の一実施例のフローチャートであり、 第 2図は、 第 1図に示された Vモー ド対話システムを実施するシステムの一実施例を示したプロヅク図である。 Hereinafter, an embodiment of a V-mode interactive method using a mobile phone and a V-mode interactive system using a mobile phone according to the present invention will be described in detail with reference to the drawings. First, FIG. 1 is a flowchart of one embodiment of a V-mode conversation method using a mobile phone according to the first embodiment of the present invention, and FIG. 2 is a flowchart of the V-mode shown in FIG. FIG. 1 is a block diagram showing an embodiment of a system for implementing a virtual conversation system.
本発明の第一の態様に係る トピックス対話方法は、 概略的に、 データベース 形成工程(ステヅプ 1 )と、 Vモード利用の意志表示工程(ステップ 2 )と、 サ一 ビス種別の特定工程(ステップ 3 )と、 そして、 特定されたサービスの実行工程 (ステップ 4 )とを含んで構成されている。 The topics dialogue method according to the first aspect of the present invention generally includes a database formation step (step 1), a V mode use intention display step (step 2), and a service type identification step (step 3). ), And an identified service execution process (step 4).
ステツプ 1において、 本発明の第一態様に係る携帯電話を使っての Vモード 対話方法においては、 先ず、 前提として、 この Vモード対話方法を実施するため のシステムを管理するホス トコンピュータに対話のためのデータペースを構築す る o In step 1, in the V-mode interactive method using a mobile phone according to the first aspect of the present invention, first, it is assumed that the host computer that manages a system for implementing the V-mode interactive method has an interactive mode. O Build a data pace for
データベースには、 少なくとも携帯電話の利用者に提供することができるサ 一ビス種別及びサービス種別を特定するのに使用する種別特定用単語を蓄積する (第 4図参照) 。 サービス種別とは、 例えば、 生活 ·情報ジャンルでは、 ニュ —ス、 天気予報、 株価情報、 タウン情報等である。 また、 エンターテイメントの ジャンルでは、 占い、 ゲーム、 カラオケ情報、 キャラクタ配信、 F M曲情報等で ある。 また、 ガイ ドのジャンルでは、 レス トラン、 鉄道網の乗り換え、 タウン情
報、 レシピ等である。 そして、 取引のジャンルでは、 モバイルバンキング、 モ パイルトレ一ド、 エアライン情報、 生命保険情報、 チケッ ト予約等である。 取 引系のサービス種別では、 一般に、 I Pサーバや WWWサーバからのコンテンヅ を取得して携帯電話の利用者に提供するというよりは、 I Pサーバや wwwサ一 バにおいて資金の移動やチケッ トを購入する等、 当該利用者のために所定の作業 をさせるサービスを行うこととなる。 The database stores at least service types that can be provided to mobile phone users and type identification words used to identify service types (see Fig. 4). The service type includes, for example, news, weather forecast, stock price information, and town information in the life and information genre. Entertainment genres include fortune-telling, games, karaoke information, character distribution, and FM song information. In the guide genre, restaurants, changing train networks, and town information Information, recipes, etc. The business genres include mobile banking, mobile pile trading, airline information, life insurance information, and ticket reservations. In transaction-based service types, in general, rather than acquiring content from an IP server or WWW server and providing it to mobile phone users, transfer funds or purchase tickets at an IP server or www server For example, a service to perform predetermined work for the user will be provided.
現在、 このサービス種別は、 N T T ドコモ社に正式に登録されているだけで 3 0 0 0以上となっており、 個々の種別において、 当該サービス機関が提供して いる個々のサービスは、 また、 その数倍から数千 ·数万倍といったレベルで細分 化されてサービスが提供される。 本発明方法では、 多数のサービス種別の中から 所望のものを選び出す手法として、 携帯電話と、 従って、 それと無線回線を通じ て接続されたホス トコンピュータと対話を用いている。 もちろん、 所望のサ一ビ ス種別が見つかり、 I Pサーバや WWWサーバと接続された後も、 その中味であ る個々の細分化されたサービスを探す場合も同様に携帯電話との対話による検索 が可能である。 At present, this service type is more than 300000 just registered with NTT DoCoMo, and for each type, the individual service provided by the service institution is Services are provided at the level of several times to several thousands and tens of thousands of times. In the method of the present invention, as a method for selecting a desired service from among a large number of service types, a dialog is used with a mobile phone and, therefore, with a host computer connected to the mobile phone via a wireless line. Of course, even after the desired service type has been found and connected to the IP server or WWW server, searching for individual and subdivided services within the service can also be performed by interaction with the mobile phone. It is possible.
サービス種別を特定するのに使用する種別特定用単語とは、 前述したような サービス種別を他のサービス種別と識別することができるキーヮードを言う (第 The type identification word used to identify a service type refers to a keyword capable of distinguishing a service type from other service types as described above.
4図参照) 。 例えば、 「ニュース」 であれば、 ニュースというキーワードだけで なく、 ニュースの提供元となった新聞社、 通信社、 テレビ局の名称や、 三面記事、 事件、 経済、 芸能、 科学、 スポーツといったニュースの内容も選択することがで きる。 また、 「株価情報」 であれば、 株価情報というキーワードだけでなく、 東 証一部、 ナスダック、 マザーズといった証券所の名称 '通称ゃ日絰平均株価、 T O P I Xといった主要指標も選択することができる。 See Figure 4). For example, "news" means not only the keyword "news" but also the name of the newspaper, news agency, or television station that provided the news, or the content of news such as three-sided articles, incidents, economics, entertainment, science, sports Can also be selected. In the case of “stock price information”, not only the keyword “stock price information” but also key indicators such as the names of stock exchanges such as the First Section of the Tokyo Stock Exchange, Nasdaq, and Mothers “commonly known as“ JPY average stock price ”and“ TOPIX ”can be selected.
キ一ヮ一ドは、 あるサービス種別に対し利用者がどのような単語を用いて言 い表わそうとしたかを記録分析し、 その使用頻度の高い方から幾つかを 「種別特 定用単語」 として記録しておくことができる。 例えば、 利用者が 「日経平均株価 のある特定の月における動向を知りたい。 」 と思った時に、 利用者がどのように 質問するかは種々考えられる。 「経済指数」 、 「経済ニュース」 、 「株価情報を 知りたい。 」 、 「日経平均株価の統計」 、 「日経平均株価の 1 0月の動向」 等、
種々の言いまわして質問してくる。 本発明方法では、 複数のキーワードを用意 しておき、 要望のサービス種別を正しく特定できるようにしている。 なお、 「経済」 や 「ニュース」 のように一般的用語の場合は複数の候補が存在すること となる。 この場合、 後述するように、 絞り込みの為の問合せをさらに行うことに より、 一のサービス種別を特定することができるようにする。 The key records and analyzes what words the user tried to express for a certain service type, and identified some of the most frequently used ones as “type specific "Word". For example, when a user thinks "I want to know the trend of the Nikkei Stock Average in a specific month.""EconomicIndices","EconomicNews","I want to know stock price information", "Statistics of Nikkei Stock Average", "Trend of Nikkei Stock Average in October", etc. They ask various words. In the method of the present invention, a plurality of keywords are prepared so that a desired service type can be correctly specified. In the case of general terms such as "economy" and "news", there are multiple candidates. In this case, as described later, it is possible to specify one service type by further performing an inquiry for narrowing down.
このようにして、 本発明方法を実施する準備が整う。 利用者が、 本発明方法 を利用する場合には、 次のような働き掛けが必要となる。 Thus, the preparation for carrying out the method of the present invention is completed. When a user uses the method of the present invention, the following approach is required.
' すなわち、 ステップ 2において、 利用者は、 携帯電話に対し Vモード利用 の意志表示を行う。 意志表示は、 音声によっても携帯電話に備え付けられた入力 手段を用いて行うこともできる。 例えば、 iモード (登録商標) 機能を有する携 帯電話に、 Vモードのためのキーを設置しておく (第 2図参照の参照番号 1 3 ) 。 そして、 これを押すことによって携帯電話を Vモ一ドに変更するように構築する. ことができる。 すなわち、 携帯電話に、 iモード (登録商標) において使用する 画像表示部 1 2に表示された文字情報を見ながら機械的に入力する入力手段と共 に音声による対話で入力する Vモードを選択するスィツチを設置する。 そして、 携帯電話の利用者による Vモードの選択により、 当該携帯電話が Vモードとなる ようにする。 また、 携帯電話が Vモード専用機であれば、 電源をオンとすること により、 自動的に、 Vモード利用の意志表示を行うこととなる。 'That is, in step 2, the user indicates the intention to use the V mode on the mobile phone. Indication of intention can be made by voice or by using input means provided on the mobile phone. For example, a key for the V mode is installed on a mobile phone having an i-mode (registered trademark) function (reference numeral 13 in FIG. 2). And it can be constructed to change the mobile phone to V mode by pressing this. That is, select the V mode in which input is performed by voice dialogue with the input means for inputting mechanically while viewing the character information displayed on the image display unit 12 used in the i-mode (registered trademark) on the mobile phone. Install a switch. Then, when the user of the mobile phone selects the V mode, the mobile phone is set to the V mode. In addition, if the mobile phone is a V-mode dedicated machine, it will automatically display the intention to use V-mode when the power is turned on.
ステップ 3において、 ホス トコンピュータは、 先ず、 携帯電話の利用者から の音声入力を音声認識し、 単語分解 ·単語分析して種別特定用単語を抽出する。 この際、 ホストコンピュータのデータベースに蓄積されたサービス種別及びサ一 ビス種別を特定するのに使用する種別特定用単語を利用する。 抽出された種別特 定用単語により、 ネッ トワークを介して受けようとしているサービス種別を特定 する。 In step 3, the host computer first recognizes the voice input from the user of the mobile phone and extracts words for type identification by word decomposition and word analysis. At this time, the type identification word used to identify the service type and the service type stored in the database of the host computer is used. The service type that is to be received via the network is specified by the extracted type specifying words.
あるいは、 これらの機能をホス トコンピュ一夕から携帯電話に移管すること もできる。 外付け又は内蔵のメモリ及び/又は C P Uを設置し、 例えば、 ホスト コンピュータ側にて用意した音声認識ソフ ト、 サービス種別及び種別特定用単語 を無線回線により当該ホス トコンピュータから携帯電話にダウンロードさせるこ とができる。 そして、 携帯電話自身で、 その利用者からの音声入力を音声認識し、
単語分解 ·単語分析して種別特定用単語を抽出する。 さらに、 抽出された種別 特定用単語により、 ネッ トワークを介して受けようとしているサービス種別を 特定した後に、 ホストコンピュータにアクセスして、 そのようなサービス種別のAlternatively, these functions can be transferred from the host computer to mobile phones. By installing an external or internal memory and / or CPU, for example, it is possible to download voice recognition software, service types and type identification words prepared by the host computer from the host computer to the mobile phone via a wireless line. Can be. Then, the mobile phone itself recognizes the voice input from the user by voice, Decompose words · Extract words for type identification by word analysis. Furthermore, after identifying the service type that is to be received via the network by using the extracted type identification word, the host computer is accessed and such a service type is identified.
I Pサーバ又は wwwサーバに接続するように構築することもできる。 携帯電話 からホス トコンピュータへのアクセス数を減らして課金料金を少なくできる効果 がある。 It can be configured to connect to an IP server or a www server. This has the effect of reducing the number of accesses from the mobile phone to the host computer, thereby reducing billing charges.
本発明方法では、 携帯電話の利用者からの音声入力を音声認識し、 単語分 解 ·単語分析して種別特定用単語を抽出し、 これらのキーヮードを検索キーとし デ—夕ベースを検索するため所望のサービス種別をいち早く特定することができ る。 なお、 そのようなキーワードを使用するサービス種別の候補が見つからなか つた場合には、 類義語、 同義語、 関連語等の候補を携帯電話の画面表示部に表示 し、 そのリス 卜から携帯電話利用者が最適なものを選択して音声により又はキー 入力により行うこともできる。 あるいは、 利用者に対し、 「X X Xではご要望の サービス種別を特定できません。 類義語、 同義語、 関連語等で表現し直して下さ い。 」 のような問合せ文によって適切なキーワードに置き換えてもらうようにす ることもできる。 According to the method of the present invention, a speech input from a user of a mobile phone is speech-recognized. The desired service type can be specified quickly. If no candidate for the service type using such a keyword is found, candidates for synonyms, synonyms, related words, etc. are displayed on the screen display of the mobile phone, and the list of mobile phone users is displayed from the list. Can be selected by voice or key input. Alternatively, ask the user to replace it with an appropriate keyword using a query such as "The service type requested cannot be identified with XXX. Please re-express it with synonyms, synonyms, related words, etc." It can also be used.
また、 そのようなキーヮ一ドを使用するサービス種別の候補が複数ある場合 もある。 その場合には、 携帯電話の画面表示部に候補を表示し、 そのリス トから 携帯電話利用者が最適なものを選択して音声により又はキー入力により行うこと もできる。 あるいは、 利用者に対しより多くの発話を促して他のキ一ワードから 利用者が欲しているサービスを正しく特定することもできる。 例えば、 「経済」 というキーヮ一ドが抽出された場合に、 「皿のどの分野について知りたいです か。 」 のような絞込みのための問合せを行う。 アンダーラインの部分が絞込みみ たい一般用語が入る部分で、 スポーヅ、 金融、 芸能等と置き換えれば、 それぞれ の分野におけるサ一ビス種別を絞り込むことができる。 Also, there may be a plurality of service type candidates using such a keypad. In such a case, candidates can be displayed on the screen display of the mobile phone, and the mobile phone user can select the most suitable one from the list and perform it by voice or key input. Alternatively, it is possible to prompt the user for more utterances and correctly identify the service desired by the user from other keywords. For example, if the key word “economy” is extracted, a query for narrowing down, such as “Which area of the dish do you want to know?” Is made. By replacing the underlined part with the general term that you want to narrow down and replacing it with sports, finance, entertainment, etc., you can narrow down the service types in each field.
前述のように、 iモード(登録商標)等の従来方式では、 画面をスクロールす ることにより、 目的のサービスを探し出している。 しかしながら、 この方式は、 サービス種別が数百 ·数千のレベルとなると時間がかかり過ぎて利用者はィライ ラする。 また、 サービス種別をツリー構造とする方法も考えられる。 しかし、 ど
の分類に入るかを決定することが難しく、 利用者が同じように考えないと目的 のサービス種別を探し出せない欠陥を有しており、 現実には使用できなかった。 本発明方法では、 携帯電話と対話することにより、 ホス トコンピュータの側 で目的のサービス種別を特定してくれることとなるので、 利用者にとって極めて 使い易いということとなる。 また、 目的のサービス種別を特定するまでの対話回 数も 1回〜数回で良く、 要する時間も 1〜数秒である利点を有する。 As described above, in the conventional method such as i-mode (registered trademark), a desired service is searched for by scrolling the screen. However, this method takes too much time when the service type reaches the level of hundreds or thousands, and the user may fail. It is also conceivable to use a tree structure for service types. However, It was difficult to determine whether to enter the service category, and it had a flaw that the user could not find the target service type without considering the same way, so it could not be used in practice. According to the method of the present invention, the target service type is specified on the host computer side by interacting with the mobile phone, so that the user is extremely easy to use. In addition, there is an advantage that the number of conversations until the target service type is specified may be one to several times, and the time required is one to several seconds.
ステップ 4において、 サービス種別が特定されると、 ホス トコンピュータは、 ネッ トワークを介して当該携帯電話を当該サービス種別の I Pサーバや WWWサ ーバに接続する。 しかる後、 携帯電話に当該サービス種別の I Pサーバや WWW サーバからコンテンツを取得して当該利用者に提供する又は取引系のものであれ ば当該利用者のために所望の作業する点は iモード (登録商標) 機能を有する携 帯電話と同様である。 When the service type is specified in step 4, the host computer connects the mobile phone to the IP server or WWW server of the service type via the network. Thereafter, the mobile phone acquires the content from the IP server or WWW server of the service type and provides it to the user, or if it is a transaction type, the desired work for the user is i-mode ( It is the same as a mobile phone with a registered trademark function.
次に、 図 2を参照して、 携帯電話を使っての Vモード対話システムについて 詳細に説明する。 Next, a V-mode interactive system using a mobile phone will be described in detail with reference to FIG.
図 2は、 本発明の第二態様に係る携帯電話を使っての Vモード対話システム の一実施例のプロック図である。 FIG. 2 is a block diagram of one embodiment of a V-mode interactive system using a mobile phone according to the second aspect of the present invention.
本発明の第二態様に係る Vモード対話システム 1は、 概略的に、 Vモードを 利用可能な携帯電話 1 0と、 そして、 この携帯電話 1 0と無線通信によって接続 可能なホストコンピュータ 2 0とを含んで構成されている。 ホストコンピュータ 2 0は、 ネヅ トワーク 3 0を介して所望のサービス種別の I Pサーバ 4 0や WW Wサーバ 4 2に接続されている。 モバイルバンキング、 オンライン トレード等の 取引系の I Pサーバとは、 第三者が介在しないように専用回線 3 2で接続されて いる。 その他の回路網は、 ィン夕一ネッ ト 3 4をそのまま利用することができる。 図示された好ましい実施例では、 N T T ドコモ社の iモード (登録商標) システ ムに相乗りした使用方法も可能なようにシステムが構築されている。 すなわち、 携帯電話 1 0からの無線通信は、 N T T ドコモ社が管理する中継アンテナ 5 1に 受信され、 N T T ドコモパケヅ ト網 5 3を介して iモードセン夕 5 5に接続され る。 そして、 携帯電話 1 0の利用者が、 携帯電話 1 0で Vモードを選択すると、
ホストコンピュ一夕 2 0を保有する Vモードセン夕 6 0に接続され、 前述した 本発明の第一態様に係る携帯電話を使っての Vモード対話方法が実施可能とな る o The V-mode interactive system 1 according to the second embodiment of the present invention generally includes a mobile phone 10 that can use the V-mode, and a host computer 20 that can be connected to the mobile phone 10 by wireless communication. It is comprised including. The host computer 20 is connected to an IP server 40 or a WWW server 42 of a desired service type via a network 30. It is connected to an IP server for mobile banking, online trading, and other trading systems via a dedicated line 32 so that no third party can intervene. Other networks can use the INN network 34 as it is. In the illustrated preferred embodiment, the system is constructed so that it can be used in conjunction with the i-mode (registered trademark) system of NTT DoCoMo. That is, the wireless communication from the mobile phone 10 is received by the relay antenna 51 managed by NTT DOCOMO, and is connected to the i-mode sensor 55 via the NTT DOCOMO packet network 53. Then, when the user of the mobile phone 10 selects the V mode with the mobile phone 10, It is connected to the V-mode center 60 having the host computer 20 and the V-mode interactive method using the mobile phone according to the first aspect of the present invention described above can be performed.o
もちろん、 Vモ一ドセン夕 6 0が自己所有の中継アンテナ又は衛星を保有す る場合には、 携帯電話 1 0の電波を直接受けることができるようになる。 その場 合には、 Vモードセン夕 6 0は、 iモードセン夕 5 5を経由することなく、 携帯 電話 1 0と I Pサーバ 4 0及び/又は WWWサーバ 4 2とを接続することも可能 となる。 ' Of course, if the V-modem 60 has its own relay antenna or satellite, it will be able to receive the radio waves of the mobile phone 10 directly. In that case, the V-mode sensor 60 can connect the mobile phone 10 with the IP server 40 and / or the WWW server 42 without going through the i-mode sensor 55. Become. '
携帯電話 1 0は、 第 2図及び第 3図に示されているように、 iモード (登録商 標) 機能を使える携帯電話に標準の装備、 例えば、 スピーカ/マイク (図示され ていない。 ) 、 テンキー等の入力キー 1 1、 液晶モニタ 1 2等に加えて、 Vモー ド利用の意思表示を行うボタンスィッチ 1 3と、 メモリ 1 4と、 そして、 C P U 1 6とを有している。 C P U 1 6には、 利用者からの音声を音声信号に変換する 変換制御手段 1 6 aと、 ホストコンピュータ 2 0との間で音声信号を送受信する 音声信号送受信制御手段 1 6 bと、 ホストコンピュータ 2 0から送られてくる音 声信号を音声合成してスピーカから発音する音声合成制御手段 1 6 cとを備えて いる。 As shown in FIGS. 2 and 3, the mobile phone 10 is equipped with a standard equipment for a mobile phone that can use the i-mode (registered trademark) function, for example, a speaker / microphone (not shown). In addition to input keys 11 such as a numeric keypad, a liquid crystal monitor 12 and the like, a button switch 13 for indicating an intention to use the V mode, a memory 14, and a CPU 16 are provided. The CPU 16 includes a conversion control unit 16a for converting a voice from a user into a voice signal, a voice signal transmission / reception control unit 16b for transmitting / receiving a voice signal to / from the host computer 20, and a host computer. The voice synthesizing control means 16 c is provided which synthesizes a voice signal transmitted from the speaker 20 and sounds it from a speaker.
ホス 卜コンピュータ 2 0は、 前述のように、 無線通信により多数の携帯電話 1 0に接続可能である。 また、 ネッ トワーク 3 0を介して I Pサーバ 4 0や WWW サーバ 4 2に接続可能となっている。 ホストコンピュータ 2 0には、 概略的に、 メモリ 2 2と、 そして、 C P U 2 4とが設けられている。 As described above, the host computer 20 can be connected to many mobile phones 10 by wireless communication. In addition, it can be connected to the IP server 40 and the WWW server 42 via the network 30. The host computer 20 is generally provided with a memory 22 and a CPU 24.
メモリ 2 2には、 サービス種別及びそれを特定するのに使用する種別特定用単 語を記録する種別特定用単語記録部 2 2 a、 音声認識ソフ ト ·単語分解ソフ ト - 単語分析ソフ ト '音声合成ソフ ト等のアプリケーションを記録するアプリケ一シ ョン記録部 2 2 bを有する。 The memory 22 includes a type identification word recording unit 22 a for recording a service type and a type identification word used to identify the service type, a speech recognition software and a word decomposition software-a word analysis software. It has an application recording unit 22b for recording applications such as voice synthesis software.
C P U 2 4は、 携帯電話 1 0との間で音声信号を送受信する音声信号送受信 制御手段 2 4 aと、 携帯電話 1 0から送られてくる音声信号を音声デ一夕に変換 する音声デ一夕変換制御手段 2 4 bと、 メモリ 2 2から各種ソフ トを呼び出して、 携帯電話の利用者からの音声データを音声認識し、 単語分解 ·単語分析して種別
特定用単語を抽出する種別特定用単語の抽出制御手段 2 4 cと、 抽出した種別 特定用単語により、 携帯電話の利用者がネッ トワークを介して受けようとして いるサービス種別を特定するサービス種別特定制御手段 2 4 dと、 そして、 特定 されたサービス種別の I Pサーバ又は WWWサーバにネッ トワークを介してァク セスするアクセス制御手段 2 4 eとを含んで構成されている。 The CPU 24 includes an audio signal transmission / reception control means 24 a for transmitting and receiving an audio signal to and from the mobile phone 10, and an audio signal for converting an audio signal sent from the mobile phone 10 into an audio signal. Evening conversion control means 24 b and various software are called from memory 22 to recognize voice data from mobile phone users and perform word decomposition and word analysis to classify them. Service type identification that identifies the service type that the mobile phone user is trying to receive via the network, based on the type identification word extraction control means 24c that extracts the identification word, and the extracted type identification word. It is configured to include control means 24d and access control means 24e for accessing an IP server or a WWW server of the specified service type via a network.
iモード (登録商標) 機能を有する携帯電話 1 0を有する利用者が、 ボタン スィッチ 1 3を押して Vモ一ド利用の意志表示を行うと、 携帯電話 1 0からの音 声信号は、 iモードセン夕 5 5を経由して Vモードセン夕 6 0へ送られる。 本発 明の Vモードにより所望のサービス種別を探そうとする場合、 利用者は、 キ一ヮ 一ド又は文章形式の対話のいずれの形式でも入力することができる。 キーワード の場合には、 複数のキーワードを発話することが好ましい。 それにより、 正確且 つ短時間に所望のサービス種別を特定することができる。 When the user having the mobile phone 10 having the i-mode (registered trademark) function presses the button switch 13 to display the intention to use the V-mode, the audio signal from the mobile phone 10 is output in the i-mode. It is sent to V-mode Send / Receiver 60 via Send / Receiver 55. When trying to find a desired service type using the V mode of the present invention, the user can input in either a keyed or text-based dialogue. In the case of keywords, it is preferable to speak a plurality of keywords. Thereby, a desired service type can be specified accurately and in a short time.
Vモードセンタ 6 0では、 かかる携帯電話 1 0からの音声信号を音声信号送 受信制御手段 2 4 aが受け取り、 さらに、 音声データ変換制御手段 2 4わにより コンピュータが読み取ることができる音声データに変換する。 抽出制御手段 2 4 cは、 メモリ 2 2のアプリケーション記録部 2 2 bから音声認識ソフ トを、 そし て、 種別特定用単語記録部 2 2 aから種別特定用単語を呼び出す。 そして、 音声 データ変換制御手段 2 4 bによって変換された携帯電話の利用者からの音声デー 夕を音声認識する。 続いて、 単語分解 ·単語分析して得られた種別特定用単語を 抽出して、 携帯電話 1 0の利用者がネッ トワークを介して受けようとしているサ —ビス種別を特定する。 続いて Vモードセン夕 6 0のホストコンピュータ 2 0は、 特定されたサービス種別の I Pサーバ 4 0又は WWWサーバ 4 2にネッ トワーク 3 0を介してアクセスする。
In the V-mode center 60, the voice signal from the mobile phone 10 is received by the voice signal transmission / reception control means 24a, and further converted into voice data readable by a computer by the voice data conversion control means 24. I do. The extraction control means 24 c calls the speech recognition software from the application recording unit 22 b of the memory 22 and the type identification word from the type identification word recording unit 22 a. Then, voice data from the mobile phone user converted by the voice data conversion control means 24b is recognized. Next, the words for type identification obtained by word decomposition and word analysis are extracted, and the type of service that the user of the mobile phone 10 is going to receive via the network is identified. Subsequently, the host computer 20 of the V-mode server 60 accesses the IP server 40 or the WWW server 42 of the specified service type via the network 30.
Claims
1 . ネッ トワークを介して所望のサービス種別の I Pサーバや wwwサ バ に、 携帯電話との自然な且つ適切な対話を通じて接続することができる携帯電話 を使っての Vモ一ド対話方法であって、 1. A V-mode dialogue method using a mobile phone that can connect to an IP server or a www server of a desired service type via a network through a natural and appropriate dialogue with the mobile phone. hand,
携帯電話の利用者に提供することができるサービス種別、 サービス種別を特定 するのに使用する種別特定用単語をデータベースに蓄積する工程と、 Storing in a database a service type that can be provided to a mobile phone user, and a type specifying word used to specify the service type;
利用者の携帯電話から Vモード利用の意志表示を受け取る工程と、 Receiving a V-mode indication from the user's mobile phone;
携帯電話の利用者からの音声入力を音声認識し、 単語分解 ·単語分析して得ら れた種別特定用単語により、 ネッ トワークを介して受けようとしているサービス 種別を特定する工程と、 そして、 A process of recognizing a voice input from a user of a mobile phone, and specifying a service type to be received via a network by using a type specifying word obtained by word decomposition and word analysis; and
特定されたサービス種別の I Pサーバ又は wwwサーバにネッ トワークを介 してアクセスする工程と、 Accessing the IP server or www server of the specified service type via a network;
を含んで構成されてなり、 それにより、 当該 I Pサーバや wwwサーバからの コンテンヅを取得して当該利用者に提供する又は当該 I Pサーバや wwwサーバ において当該利用者のために所定の作業をさせる携帯電話を使っての Vモード対 話方法。 Mobile phone that obtains the content from the IP server or www server and provides it to the user, or allows the IP server or www server to perform predetermined work for the user. How to talk in V mode using a telephone.
2 . 請求項 1に記載の携帯電話を使っての Vモード対話方法において、 前記携 帯電話には、 外付け又は内蔵のメモリ及び/又は C P Uが設置されており、 そし て、 さらに、 ホス トコンピュータ側にて用意した音声認識ソフ ト、 サービス種別、 サービス種別を特定するのに使用する種別特定用単語が無線回線により当該ホス トコンビユー夕から前記携帯電話にダウンロードされる工程が含まれていること を特徴とする携帯電話を使っての Vモ一ド対話方法。 2. The V-mode interactive method using a mobile phone according to claim 1, wherein the mobile phone has an external or internal memory and / or CPU, and further comprises a host. A process is included in which voice recognition software prepared on the computer side, service type, and a type identification word used to identify the service type are downloaded from the host convenience to the mobile phone via a wireless line. V-mode conversation method using a mobile phone.
3 . 請求項 1又は 2に記載の携帯電話を使っての Vモード対話方法において、 さ らに、 利用者からの発話文章ではネッ トワークを介して受けようとしているサー ビス種別を特定できなかった場合に、 利用者に聞き返しをする工程を含んでなる ことを特徴とする携帯電話を使っての Vモ一ド対話方法。 3. In the V-mode interactive method using a mobile phone according to claim 1 or 2, further, the type of service to be received via the network could not be specified in the utterance sentence from the user. A V-mode dialogue method using a mobile phone, comprising a step of asking the user to listen back.
4 . 請求項 3に記載の携帯電話を使っての Vモード対話方法において、 候補が見 つからなかった場合における利用者への聞き返し工程は、 類義語、 同義語、 関連
語等を問い合わせる問合せ文によって行われることを特徴とする携帯電話を使 つての Vモード対話方法。 4. In the V-mode interactive method using a mobile phone according to claim 3, the process of asking the user if no candidate is found includes synonyms, synonyms, and related terms. A V-mode interactive method using a mobile phone, which is performed by a query sentence that inquires about words and the like.
5 . 請求項 3に記載の携帯電話を使っての Vモード対話方法において、 複数の候 補がある場合における利用者への聞き返し工程は、 携帯電話の画面表示部に複数 の候補を表示し、 その中から携帯電話利用者が最適なものを選択して音声により 又はキー入力により行わせ、 それにより、 サービス種別特定のための追加の情報 を取得することを特徴とする携帯電話を使っての Vモ一ド対話方法。 5. In the V-mode interactive method using a mobile phone according to claim 3, the step of asking the user when there are a plurality of candidates includes displaying a plurality of candidates on a screen display unit of the mobile phone, The mobile phone user selects the best one from among them and makes it done by voice or key input, thereby obtaining additional information for specifying the service type. V-mode conversation method.
6 . ネッ トワークを介して所望のサービス種別の I Pサーバや WWWサーバに、 携帯電話との自然な且つ適切な対話を通じて接続することができる携帯電話を使 つての Vモ一ド対話システムであって、 6. A V-mode interactive system using a mobile phone that can connect to an IP server or WWW server of a desired service type through a network through natural and appropriate dialogue with the mobile phone. ,
Vモ一ド利用の意思表示を行う手段と、 利用者からの音声を音声信号に変換す る変換制御手段と、 ホストコンピュータとの間で音声信号を送受信する音声信号 送受信制御手段と、 ホストコンピュー夕から送られてくる音声信号を音声合成し て発音する音声合成制御手段とを備えてなる携帯電話と、 Means for indicating intention to use the V-mode, conversion control means for converting voice from a user into voice signals, voice signal transmission / reception control means for transmitting / receiving voice signals to / from a host computer, and host computer A mobile phone comprising voice synthesis control means for voice-synthesizing a voice signal sent from the evening and generating sound;
無線通信により多数の携帯電話に接続可能な、 そして、 ネッ トワークを介して I Pサーバや wwwサーバに接続可能なホストコンピュー夕であって、 サービス 種別を特定するのに使用する種別特定用単語を記録する種別特定用単語記録部、 音声認識ソフ ト ■単語分解ソフ ト ·単語分析ソフ ト ·音声合成ソフ ト等のアプリ ケーシヨンを記録するアプリケーション記録部を有するメモリと、 携帯電話との 間で音声信号を送受信する音声信号送受信制御手段と、 携帯電話から送られてく る音声信号を音声データに変換する音声デ一夕変換制御手段と、 メモリから各種 ソフトを呼び出して、 携帯電話の利用者からの音声データを音声認識し、 単語分 解 ·単語分析して種別特定用単語を抽出する種別特定用単語の抽出制御手段と、 抽出した種別特定用単語により、 携帯電話の利用者がネッ トワークを介して受け ようとしているサービス種別を特定するザ ビス種別特定制御手段と、 そして、 特定されたサービス種別の I Pサーバ又は wwwサーバにネッ トヮ一クを介して アクセスするアクセス制御手段と、 A host computer that can be connected to many mobile phones by wireless communication and can be connected to an IP server or www server via a network, and records the type identification words used to identify the service type Type identification word recording unit, voice recognition software ■ Word decomposition software, word analysis software, speech synthesis software, etc., a memory having an application recording unit that records application cases, and a voice signal between the mobile phone Control means for converting voice signals sent from a mobile phone into voice data, and calling various software from a memory to transmit voice from a mobile phone user. Type identification word extraction control means for recognizing data, word resolution and word analysis to extract type identification words, and extracted seeds The service type specifying control means for specifying the service type that the mobile phone user intends to receive via the network using the specification word, and the IP server or www server of the specified service type is connected to the network. Access control means for access via
を含んで構成されてなり、 それにより、 当該 I Pサーバや wwwサーバからの コンテンヅを取得して当該利用者に提供する又は当該 I Pサーバや wwwサーバ
において当該利用者のために所定の作業をさせる携帯電話を使っての Vモード 対話方法。 To obtain the content from the IP server or www server and provide it to the user, or the IP server or www server A V-mode dialogue method using a mobile phone to perform predetermined tasks for the user.
7 . 請求項 6に記載の Vモード対話システムの Vモードセンタであって、 サービス種別を特定するのに使用する種別特定用単語を記録する種別特定用単 語記録部、 音声認識ソフ ト ·単語分解ソフ ト ·単語分析ソフ ト ·音声合成ソフ ト 等のアプリケーションを記録するアプリケーション記録部を有するメモリと、 携 帯電話との間で音声信号を送受信する音声信号送受信制御手段と、 携帯電話から 送られてくる音声信号を音声データに変換する音声データ変換制御手段と、 メモ リから各種ソフトを呼び出して、 携帯電話の利用者からの音声データを音声認識 し、 単語分解 ·単語分析して種別特定用単語を抽出する種別特定用単語の抽出制 御手段と、 抽出した種別特定用単語により、 携帯電話の利用者がネッ トワークを 介して受けようとしているサービス種別を特定するサービス種別特定制御手段と、 そして、 特定されたサービス種別の I Pサーバ又は WWWサーバにネッ トワーク を介してアクセスするアクセス制御手段と、 7. The V-mode center of the V-mode interactive system according to claim 6, wherein a type-specific word recording unit for recording a type-specific word used for specifying a service type, a voice recognition software / word. A memory having an application recording unit for recording applications such as decomposition software, word analysis software, and speech synthesis software; voice signal transmission / reception control means for transmitting / receiving voice signals to / from a mobile phone; Voice data conversion control means for converting incoming voice signals into voice data, and calling various software from memory, voice recognition of voice data from mobile phone users, word decomposition and word analysis to identify types Mobile phone users will receive via the network by means of extraction control means for type-specific words for extracting word for use and the extracted type-specific words. And service type specifying control means for specifying a service type that is, and an access control means for accessing via the network to the I P server or WWW server of the identified service type,
を含んで構成されてなり、 それにより、 当該 I Pサーバや wwwサーバからの コンテンヅを取得して当該利用者に提供する又は当該 I Pサーバや wwwサーバ において当該利用者のために所定の作業をさせる Vモ一ドセン夕。
And obtains the content from the IP server or www server and provides it to the user, or causes the IP server or www server to perform a predetermined operation for the user. Modsen evening.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2000/007921 WO2002039425A1 (en) | 2000-11-10 | 2000-11-10 | V-mode conversation method and system using portable telephone, and v-mode center |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2000/007921 WO2002039425A1 (en) | 2000-11-10 | 2000-11-10 | V-mode conversation method and system using portable telephone, and v-mode center |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2002039425A1 true WO2002039425A1 (en) | 2002-05-16 |
Family
ID=11736676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2000/007921 WO2002039425A1 (en) | 2000-11-10 | 2000-11-10 | V-mode conversation method and system using portable telephone, and v-mode center |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2002039425A1 (en) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06308996A (en) * | 1993-04-23 | 1994-11-04 | Nippon Telegr & Teleph Corp <Ntt> | Generating method for prompt for confirming request of command and recognition result of command in question-answer type interactive device |
JPH07307976A (en) * | 1994-05-16 | 1995-11-21 | Kokusai Electric Co Ltd | Program rewriting method for portable telephone set |
JPH08287018A (en) * | 1995-04-11 | 1996-11-01 | Kokusai Electric Co Ltd | Electronic system pocket notebook |
US5774628A (en) * | 1995-04-10 | 1998-06-30 | Texas Instruments Incorporated | Speaker-independent dynamic vocabulary and grammar in speech recognition |
EP0854417A2 (en) * | 1997-01-06 | 1998-07-22 | Texas Instruments Inc. | Voice activated control unit |
JPH11352986A (en) * | 1998-06-09 | 1999-12-24 | Nippon Telegr & Teleph Corp <Ntt> | Recognition error moderating method of device utilizing voice recognition |
JP2000137617A (en) * | 1998-10-30 | 2000-05-16 | Kyocera Corp | Portable software controller and manufacture of the same |
JP2000187493A (en) * | 1998-12-22 | 2000-07-04 | Sumitomo Electric Ind Ltd | Speech output device and onboard computer |
-
2000
- 2000-11-10 WO PCT/JP2000/007921 patent/WO2002039425A1/en active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06308996A (en) * | 1993-04-23 | 1994-11-04 | Nippon Telegr & Teleph Corp <Ntt> | Generating method for prompt for confirming request of command and recognition result of command in question-answer type interactive device |
JPH07307976A (en) * | 1994-05-16 | 1995-11-21 | Kokusai Electric Co Ltd | Program rewriting method for portable telephone set |
US5774628A (en) * | 1995-04-10 | 1998-06-30 | Texas Instruments Incorporated | Speaker-independent dynamic vocabulary and grammar in speech recognition |
JPH08287018A (en) * | 1995-04-11 | 1996-11-01 | Kokusai Electric Co Ltd | Electronic system pocket notebook |
EP0854417A2 (en) * | 1997-01-06 | 1998-07-22 | Texas Instruments Inc. | Voice activated control unit |
JPH11352986A (en) * | 1998-06-09 | 1999-12-24 | Nippon Telegr & Teleph Corp <Ntt> | Recognition error moderating method of device utilizing voice recognition |
JP2000137617A (en) * | 1998-10-30 | 2000-05-16 | Kyocera Corp | Portable software controller and manufacture of the same |
JP2000187493A (en) * | 1998-12-22 | 2000-07-04 | Sumitomo Electric Ind Ltd | Speech output device and onboard computer |
Non-Patent Citations (3)
Title |
---|
"Kougi nos. 83-118", HATSUMEI KYOUKAI KOUKAI GIHOU, 20 January 1983 (1983-01-20), XP002936358 * |
V. DIGALAKIS ET AL.: "Quantization of cepstral parameters for speech recognition over the world wide web", IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, vol. 17, no. 1, January 1999 (1999-01-01), pages 82 - 90, XP002936357 * |
V. DIGALAKIS ET AL.: "Quantization of cepstral parameters for speech recognition over the world wide web", PROCEEDINGS OF THE 1998 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, vol. 2, 12 May 1998 (1998-05-12) - 15 May 1998 (1998-05-15), SEATTLE, WASHINGTON, USA, pages 989 - 992, XP002936356 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10056077B2 (en) | Using speech recognition results based on an unstructured language model with a music system | |
US6944593B2 (en) | Speech input system, speech portal server, and speech input terminal | |
US8949130B2 (en) | Internal and external speech recognition use with a mobile communication facility | |
US20010056479A1 (en) | Voice searching system of internet information to be used for cellular phone | |
US20090030687A1 (en) | Adapting an unstructured language model speech recognition system based on usage | |
CN101473636A (en) | Method and system for retrieving information | |
US20090030697A1 (en) | Using contextual information for delivering results generated from a speech recognition facility using an unstructured language model | |
US20080221880A1 (en) | Mobile music environment speech processing facility | |
US20090030691A1 (en) | Using an unstructured language model associated with an application of a mobile communication facility | |
US20080288252A1 (en) | Speech recognition of speech recorded by a mobile communication facility | |
US20080221898A1 (en) | Mobile navigation environment speech processing facility | |
US20090030696A1 (en) | Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility | |
US20080312934A1 (en) | Using results of unstructured language model based speech recognition to perform an action on a mobile communications facility | |
US20090030685A1 (en) | Using speech recognition results based on an unstructured language model with a navigation system | |
WO2007062989A1 (en) | Method and system for invoking push-to-service offerings | |
CN101739437A (en) | Implementation method for network sound-searching unit and specific device thereof | |
CN101968805A (en) | Information providing system and method | |
US6581035B1 (en) | System and method for voice-enabled transactions | |
US20150156322A1 (en) | System for providing contact number information having added search function, and method for same | |
JP3714159B2 (en) | Browser-equipped device | |
CN108881508A (en) | A kind of voice DNS unit based on block chain | |
KR20030000808A (en) | Apparatus and method of search information service to mobile phone | |
WO2002039425A1 (en) | V-mode conversation method and system using portable telephone, and v-mode center | |
US8639514B2 (en) | Method and apparatus for accessing information identified from a broadcast audio signal | |
KR20060094177A (en) | Apparatus and method for offering telephone-relay service according to priority using voice-recognized keyword |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AK | Designated states |
Kind code of ref document: A1 Designated state(s): CN JP KR US |
|
AL | Designated countries for regional patents |
Kind code of ref document: A1 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR |
|
121 | Ep: the epo has been informed by wipo that ep was designated in this application | ||
NENP | Non-entry into the national phase |
Ref country code: JP |
|
122 | Ep: pct application non-entry in european phase |