[go: nahoru, domu]

JP2010266880A - Mobile terminal device, information processing method, and program - Google Patents

Mobile terminal device, information processing method, and program Download PDF

Info

Publication number
JP2010266880A
JP2010266880A JP2010142781A JP2010142781A JP2010266880A JP 2010266880 A JP2010266880 A JP 2010266880A JP 2010142781 A JP2010142781 A JP 2010142781A JP 2010142781 A JP2010142781 A JP 2010142781A JP 2010266880 A JP2010266880 A JP 2010266880A
Authority
JP
Japan
Prior art keywords
important part
information
important
information processing
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010142781A
Other languages
Japanese (ja)
Inventor
Junji Horikawa
順治 堀川
Mototsugu Abe
素嗣 安部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Sony Ericsson Mobile Communications Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Sony Ericsson Mobile Communications Japan Inc filed Critical Sony Corp
Priority to JP2010142781A priority Critical patent/JP2010266880A/en
Publication of JP2010266880A publication Critical patent/JP2010266880A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To automatically extract upsurge parts which are demanded by a viewer from sound signals and integrate them, or reproduce such the upsurge parts. <P>SOLUTION: In an information providing device 10, an importance determination section 11 investigates frequency strength distribution of the sound signals for each predetermined time section, when TV broadcasting is received, and determines, for example, a part where similarity is a threshold or more as an important part by matching the frequency strength distribution with the frequency strength distribution registered as an important pattern beforehand; an extracting section 12 extracts the video/sound of the part or before and after the part which is determined to be important in the importance determination section 11, and records the part in a recording section 13 separately from an original video/sound signal, by copying the part; an integrating section 14 for integrating the important part recorded in the recording section 13 time-sequentially or in an arbitrary order; and a transmission section 15 transmits the important part integrated by the integrating section 14 to the viewer, for example, the user of a mobile telephone or the like. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、テレビジョン放送等における音声信号の盛り上がり部分を重要部分として抽出し、又は重要部分を再生する情報処理装置及び携帯端末装置に関する。   The present invention relates to an information processing apparatus and a portable terminal device that extract a rising part of an audio signal in television broadcasting or the like as an important part or reproduce the important part.

一般公共放送を利用した放送では、その情報形態として流し続けるのが一般的であり、視聴者はこの中から希望する番組を選択して視聴する。しかしながら、視聴者はその中でも特に見たい部分や興味ある領域を持っているのが普通である。例えばスポーツ番組では、ある競技が始まってから最終的に勝敗が決まるまでを視聴することも大事であるが、得点が入った瞬間やゴールを決めた瞬間は特に視聴者の関心が高く、その部分だけは見逃したくないと考えるのが一般的である。そのため放送局では、視聴者が希望する部分だけを切り出して編集した特別番組や総集編といったダイジェスト映像を作成して、競技終了後に別の番組としてさらに放送することも少なくない。   In broadcasting using general public broadcasting, it is generally kept flowing as its information form, and the viewer selects and watches a desired program from these. However, the viewer usually has a particularly interesting part or an area of interest. For example, in a sports program, it is important to watch from the start of a certain competition until the final victory or defeat is decided, but the moment when the score is scored or the goal is scored is particularly interesting for the viewer. It's common to think that you just don't want to miss. For this reason, a broadcasting station often creates a digest video such as a special program or a summary edited by cutting out and editing only the part desired by the viewer, and broadcasting it as another program after the competition is over.

従来、このようなダイジェスト映像の作成方法としては、人間が映像を見ながら手作業で映像編集してダイジェスト映像を作成する方法や、内容に基づくインデックスを手作業で振り、そのインデックスを利用して検索し、ダイジェスト映像を作成する方法が一般的であった。しかしながら、このような方法では、人間が映像全体を視聴する必要があるため、多大な時間と労力とが必要とされていた。   Conventionally, such a digest video can be created by manually editing a video while watching a video, creating a digest video, or manually indexing the content and using the index. A common method is to search and create a digest video. However, in such a method, since it is necessary for a human to view the entire video, much time and labor are required.

さらに、近年ネットワーク技術の発展により、ADSLや光接続など、いわゆるブロードバンドが普及し始め、単にテレビジョン受像器を用いて放送を視聴するのみならず、ネットワーク経由でいわゆるストリーミング番組を視聴することも増えてきた。しかしながら、このようなネットワーク経由で流されるダイジェスト映像においても、従来は人間が手作業で作成しており、一般公共放送のための媒体をネットワーク経由向けに変換されただけのものも多く、多大な時間と労力とが必要とされていた。   Furthermore, with the development of network technology in recent years, so-called broadband, such as ADSL and optical connection, has begun to spread, and not only watching broadcasts using television receivers but also watching so-called streaming programs via networks has increased. I came. However, even in such digest video streamed over the network, humans have traditionally created it manually, and many of the media for public broadcasting are simply converted for use via the network. Time and effort were needed.

このような理由から、下記の特許文献1には、全周波数帯域のパワーレベルと、特定の周波数成分のパワーレベルの大小との組み合わせにより、スポーツ等のイベントの盛り上がり部分を自動的に検出し、インデックスとして付与する技術が提案されている。この技術では、観客が盛り上がった音を検出するため、多くのイベントに汎用的に適用でき、イベントの進行上重要な箇所を自動的に検出することができる。   For this reason, the following Patent Document 1 automatically detects a rising part of an event such as a sport by combining the power level of the entire frequency band and the power level of a specific frequency component, A technique for providing an index has been proposed. In this technique, since the sound that the audience has excited is detected, it can be applied universally to many events, and it is possible to automatically detect important points in the progress of the event.

特開2001−143451号公報JP 2001-143451 A

しかしながら、この特許文献1に記載の技術では、盛り上がり部分にインデックスを付すのみであるため、このようなインデックスの付された映像/音声信号を例えば携帯端末装置のユーザに配信した場合、ユーザがダイジェスト映像を視聴するためには、インデックス位置への頭出しを行わなければならず、利便性に欠けていた。   However, since the technique described in Patent Document 1 only adds an index to the swelled portion, when the video / audio signal with such an index is distributed to, for example, a user of the mobile terminal device, the user performs a digest. In order to view the video, it was necessary to cue to the index position, which was not convenient.

本発明は、このような従来の実情に鑑みて提案されたものであり、音声信号から視聴者が求める盛り上がり部分を自動的に抽出して統合し、又はそのような盛り上がり部分を再生する情報処理装置及び携帯端末装置を提供することを目的とする。   The present invention has been proposed in view of such a conventional situation, and information processing that automatically extracts and integrates a swell portion desired by a viewer from an audio signal or reproduces such a swell portion. An object is to provide a device and a portable terminal device.

上述した目的を達成するために、本発明に係る情報処理装置は、音声信号における重要部分を抽出する情報処理装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段とを備えるものである。   In order to achieve the above-described object, an information processing apparatus according to the present invention obtains a feature amount of an audio signal for each predetermined time interval in an information processing device that extracts an important part in an audio signal, and uses the feature amount. An importance determining means for determining the importance in the time interval based on the above, an extracting means for extracting the important part based on the importance, and an integrating means for integrating at least some of the extracted important parts; Is provided.

ここで、本発明に係る情報処理装置は、上記統合手段によって統合された情報を外部に発信する情報発信手段をさらに備えるようにしてもよい。   Here, the information processing apparatus according to the present invention may further include an information transmission unit that transmits the information integrated by the integration unit to the outside.

このような情報処理装置は、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合する。   Such an information processing apparatus extracts an important part from, for example, an audio signal of a television broadcast, and integrates at least some of the extracted important parts.

また、上述した目的を達成するために、本発明に係る携帯端末装置は、所定の時間区間毎に音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断し、上記重要度に基づいて上記音声信号における重要部分を抽出して統合する情報処理装置と通信する通信手段と、上記重要部分を再生する再生手段とを備えるものである。   In order to achieve the above-described object, the mobile terminal device according to the present invention obtains a feature amount of an audio signal for each predetermined time interval, determines the importance in the time interval based on the feature amount, Communication means for communicating with an information processing apparatus that extracts and integrates important parts of the audio signal based on the importance, and reproducing means for reproducing the important parts.

このような携帯端末装置は、例えばテレビジョン放送の音声信号から抽出され統合された重要部分を情報処理装置から受信し、この重要部分を再生する。   Such a portable terminal device receives an important part extracted from, for example, an audio signal of a television broadcast and integrated from the information processing apparatus, and reproduces the important part.

また、上述した課題を達成するために、本発明に係る携帯端末装置は、音声信号における重要部分を抽出して再生する携帯端末装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段と、上記統合された情報を再生する再生手段とを備えるものである。   In order to achieve the above-described problem, the mobile terminal device according to the present invention obtains a feature amount of the audio signal for each predetermined time interval in the mobile terminal device that extracts and reproduces an important part in the audio signal. , Importance level judging means for judging the importance level in the time interval based on the feature amount, extraction means for extracting the important part based on the importance level, and at least some of the extracted important parts. An integrating means for integrating and a reproducing means for reproducing the integrated information are provided.

このような携帯端末装置は、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合して再生する。   Such a portable terminal device extracts an important part from an audio signal of, for example, a television broadcast, and integrates and reproduces at least some of the extracted important parts.

本発明に係る情報処理装置は、音声信号における重要部分を抽出する情報処理装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段とを備えるものである。   An information processing apparatus according to the present invention, in an information processing apparatus that extracts an important part in an audio signal, obtains a feature amount of the audio signal for each predetermined time interval, and determines the importance in the time interval based on the feature amount. Importance determining means for determining, extraction means for extracting the important part based on the importance, and integration means for integrating at least a part of the extracted plurality of important parts.

ここで、本発明に係る情報処理装置は、上記統合手段によって統合された情報を外部に発信する情報発信手段をさらに備えるようにしてもよい。   Here, the information processing apparatus according to the present invention may further include an information transmission unit that transmits the information integrated by the integration unit to the outside.

このような情報処理装置によれば、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合するため、例えば統合された情報を視聴者に対して発信した場合、視聴者は容易に重要部分を視聴することができる。   According to such an information processing apparatus, for example, an important part is extracted from an audio signal of a television broadcast, and at least some of the extracted important parts are integrated. The viewer can easily view the important part.

また、本発明に係る携帯端末装置は、所定の時間区間毎に音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断し、上記重要度に基づいて上記音声信号における重要部分を抽出して統合する情報処理装置と通信する通信手段と、上記重要部分を再生する再生手段とを備えるものである。   Further, the mobile terminal device according to the present invention obtains a feature amount of an audio signal for each predetermined time interval, determines an importance level in the time interval based on the feature amount, and determines the audio signal based on the importance level. Communication means for communicating with an information processing apparatus that extracts and integrates the important part of the above and a reproducing means for reproducing the important part.

このような携帯端末装置によれば、例えばテレビジョン放送の音声信号から抽出され統合された重要部分を情報処理装置から受信し、この重要部分を再生することにより、ユーザは容易に重要部分を視聴することができる。   According to such a mobile terminal device, for example, an important part extracted and integrated from an audio signal of a television broadcast is received from the information processing apparatus, and the user can easily view the important part by reproducing the important part. can do.

また、本発明に係る携帯端末装置は、音声信号における重要部分を抽出して再生する携帯端末装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段と、上記統合された情報を再生する再生手段とを備えるものである。   Further, the mobile terminal device according to the present invention obtains a feature amount of the audio signal for each predetermined time interval in a mobile terminal device that extracts and reproduces an important part in the audio signal, and the time based on the feature amount. Importance determination means for determining the importance in the section, extraction means for extracting the important part based on the importance, integration means for integrating at least some of the extracted important parts, and the integrated And reproducing means for reproducing the received information.

このような携帯端末装置によれば、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合して再生するため、ユーザは容易に重要部分を視聴することができる。   According to such a portable terminal device, for example, an important part is extracted from an audio signal of a television broadcast, and at least some of the extracted important parts are integrated and reproduced. Can watch.

TV放送の視聴形態の一例を示す図である。It is a figure which shows an example of the viewing-and-listening form of TV broadcast. 放送局と電話局との間の接続形態の他の例を示す図である。It is a figure which shows the other example of the connection form between a broadcasting station and a telephone station. 放送局と電話局との間の接続形態の他の例を示す図である。It is a figure which shows the other example of the connection form between a broadcasting station and a telephone station. 放送局と電話局との間の接続形態の他の例を示す図である。It is a figure which shows the other example of the connection form between a broadcasting station and a telephone station. 第1の実施の形態における情報提供装置の概念構成を示す図である。It is a figure which shows the conceptual structure of the information provision apparatus in 1st Embodiment. 同情報提供装置の重要度判断部の処理手順を説明するフローチャートである。It is a flowchart explaining the process sequence of the importance determination part of the information provision apparatus. 映像信号のフレーム毎に音声信号の周波数強度分布を求める場合の例を示す図である。It is a figure which shows the example in the case of calculating | requiring the frequency intensity distribution of an audio | voice signal for every flame | frame of a video signal. 現在時刻の前後のフレームに対応する音声信号の周波数解析結果をも利用する場合の例を示す図である。It is a figure which shows the example in the case of utilizing also the frequency analysis result of the audio | voice signal corresponding to the flame | frame before and behind the present time. 前後のフレームの周波数解析結果の利用例を示す図である。It is a figure which shows the usage example of the frequency analysis result of the frame before and behind. 同情報提供装置の抽出部における抽出区間を示す図である。It is a figure which shows the extraction area in the extraction part of the information provision apparatus. 同情報提供装置の発信部からの発信形態の一例を示す図である。It is a figure which shows an example of the transmission form from the transmission part of the information provision apparatus. 同情報提供装置の発信部からの発信形態の一例を示す図である。It is a figure which shows an example of the transmission form from the transmission part of the information provision apparatus. 同情報提供装置の発信部からの発信形態の一例を示す図である。It is a figure which shows an example of the transmission form from the transmission part of the information provision apparatus. 第1の実施の形態における情報提供装置の詳細な構成例を示す図である。It is a figure which shows the detailed structural example of the information provision apparatus in 1st Embodiment. 同情報提供装置における盛り上がり区間処理部の内部構成を示す図である。It is a figure which shows the internal structure of the excitement area process part in the information provision apparatus. 第2の実施の形態における携帯端末装置と情報提供装置との間のデータの送受信を説明するフローチャートである。It is a flowchart explaining transmission / reception of the data between the portable terminal device and information provision apparatus in 2nd Embodiment. 同情報提供装置で作成される重要情報一覧の一例を示す図である。It is a figure which shows an example of the important information list produced with the information provision apparatus. 同重要情報一覧を受信した携帯端末装置における表示例を示す図である。It is a figure which shows the example of a display in the portable terminal device which received the important information list. 第2の実施の形態における携帯端末装置の詳細な構成例を示す図である。It is a figure which shows the detailed structural example of the portable terminal device in 2nd Embodiment. 第3の実施の形態における携帯端末装置の詳細な構成例を示す図である。It is a figure which shows the detailed structural example of the portable terminal device in 3rd Embodiment. 同情報処理装置における盛り上がり区間処理部の内部構成を示す図である。It is a figure which shows the internal structure of the excitement area process part in the same information processing apparatus.

以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明に係る情報処理装置及び携帯端末装置を、映像/音声信号から重要部分を抽出して統合し、視聴者に提供する情報提供装置、及びそのような情報を再生し、又は映像/音声信号から重要部分を抽出・統合する携帯端末装置に適用したものである。なお、以下の実施の形態では、映像/音声信号として、テレビジョン(以下、TVという。)放送を例示して説明する。   Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings. In this embodiment, an information processing apparatus and a mobile terminal apparatus according to the present invention extract an important part from a video / audio signal and integrate them to provide a viewer with information, and reproduce such information. Or applied to a portable terminal device that extracts and integrates important parts from video / audio signals. In the following embodiment, a television (hereinafter referred to as TV) broadcast will be described as an example of the video / audio signal.

先ず、第1の実施の形態における情報提供装置の説明をする前に、TV放送の視聴形態例を図1に示す。TV放送は放送局1から電波で発信されており、電話会社2はそれをアンテナを介して受信する。そして電話会社2は、受信した情報であるTV番組を加工し、視聴者、例えば携帯電話機等の受信端末3のユーザに向けて発信する。ここで、図1では放送局1と電話会社2の間は通常のTV放送の形態をとっているが、これに限定されるものではなく、図2のように専用線で放送局1と電話会社2とを結ぶ形態であっても、図3のようにインターネット等のネットワークで結ぶ形態であっても、図4のように衛星通信を使って結ぶ形態であってもよい。また、最終的にユーザに対して情報を提供するのは、電話会社に限らず、電話会社以外の他の会社や個人であってもよく、放送局自身であっても構わない。以下、このように視聴者に対して情報を加工して提供する会社又は個人を情報提供者と定義し、そのような処理を行う装置を情報提供装置と定義する。   First, before explaining the information providing apparatus according to the first embodiment, FIG. The TV broadcast is transmitted by radio waves from the broadcast station 1, and the telephone company 2 receives it via an antenna. Then, the telephone company 2 processes the TV program that is the received information and sends it to a viewer, for example, a user of the receiving terminal 3 such as a mobile phone. Here, in FIG. 1, the broadcasting station 1 and the telephone company 2 are in the form of normal TV broadcasting. However, the present invention is not limited to this, and the broadcasting station 1 and the telephone are connected by a dedicated line as shown in FIG. The form of connecting with the company 2 may be the form of connecting with a network such as the Internet as shown in FIG. 3, or the form of connecting using satellite communication as shown in FIG. Further, it is not limited to the telephone company that finally provides information to the user, but may be a company or an individual other than the telephone company, or the broadcasting station itself. Hereinafter, a company or an individual that processes and provides information to a viewer in this manner is defined as an information provider, and a device that performs such processing is defined as an information providing device.

情報提供者は、受信したTV番組を視聴者が望む形に加工する。例えばスポー番組の場合、視聴者は試合の全てを見たいとも思っているが、全てを見る時間的余裕がない場合や複数の試合を簡便に見たい場合も多く、得点が入った瞬間、或いは自分の応援しているチームや選手にとって有利又は不利な展開になった部分だけは必ず見たいと思うことも多い。このような得点が入ったシーンなどでは、そのスポーツが開催されている会場の聴衆も同様に関心が高く、それが会場内の音響にも具体的に現れる。すなわち、聴衆の反応として、音響的には「わぁー」という音声分布が現れる。しかも、試合継続中に開催場所が変化、移動することは極めて稀であるため、会場における音響特性は、ほぼ同じと考えられ、結果として聴衆の反応も同じような傾向を示す。つまり、得点の入ったシーンなどの盛り上がり部分では、周波数分布がほぼ同じような特性を示すことになる。   The information provider processes the received TV program into a form desired by the viewer. For example, in the case of a sport program, the viewer wants to see all of the matches, but there are many cases where there is not enough time to see all of them or simply wants to watch multiple matches. Often you want to see only the parts that are advantageous or unfavorable to the teams and players you support. In such a scene with a score, the audience at the venue where the sport is held is also highly interested, and this will also appear specifically in the sound within the venue. In other words, the sound distribution “Wow” appears acoustically as an audience response. Moreover, since it is very rare that the venue changes or moves during the match, the acoustic characteristics at the venue are considered to be almost the same, and as a result, the audience's reaction shows the same tendency. In other words, the frequency distribution shows almost the same characteristics in the swelled part such as a scored scene.

そこで、本実施の形態ではこの特性を利用し、周波数分布が前述の特性を示す部分を盛り上がり部分と判断し、その盛り上がり部分を重要部分として抽出する。なお、TV放送では音声と映像とが同期しているため、対応する映像も重要度が高いとして同様に抽出する。この際、単にその部分だけを抽出するのではなく、その前後も調整可能な範囲内で抽出すれば、例えば試合中の得点に絡む前後のシーンを極めて正確に抽出できることになる。   Therefore, in the present embodiment, this characteristic is used, a part where the frequency distribution shows the above characteristic is determined as a rising part, and the rising part is extracted as an important part. Note that since audio and video are synchronized in TV broadcasting, the corresponding video is also extracted in the same manner because the importance is high. At this time, if only the portion is not extracted but is extracted within the adjustable range, for example, the scenes before and after the score in the game can be extracted very accurately.

このように重要部分を抽出して視聴者に提供する情報提供装置の概念構成を図5に示す。図5に示すように、情報提供装置10は、音声信号の周波数分布から重要度が高い部分を判断する重要度判断部11と、その重要部分を抽出する抽出部12と、抽出した情報が記録される記録部13と、それらの重要部分を統合する統合部14と、統合した情報を視聴者に向けて発信する発信部15とにより構成される。   FIG. 5 shows a conceptual configuration of an information providing apparatus that extracts important parts and provides them to viewers. As shown in FIG. 5, the information providing apparatus 10 includes an importance determination unit 11 that determines a part having high importance from the frequency distribution of the audio signal, an extraction unit 12 that extracts the important part, and the extracted information is recorded. The recording unit 13, the integration unit 14 that integrates these important parts, and the transmission unit 15 that transmits the integrated information to the viewer.

ここで重要度判断部11は、TV放送を受信すると、先ず所定の時間区間毎に音声信号の周波数強度分布を調べる。そして、その周波数強度分布について、重要パターンとして予め登録してある周波数強度分布とのマッチングを行い、例えば類似度が閾値以上である部分を重要部分と判断する。   Here, when receiving the TV broadcast, the importance determination unit 11 first checks the frequency intensity distribution of the audio signal for each predetermined time interval. Then, the frequency intensity distribution is matched with a frequency intensity distribution registered in advance as an important pattern, and for example, a part having a similarity equal to or greater than a threshold is determined as an important part.

すなわち、図6のフローチャートに示すように、先ずステップS1において、所定の時間区間毎に周波数強度分布を求め、ステップS2において、その周波数強度分布が予め登録されている重要パターンと一致するか否かを判別する。ステップS2において一致する場合(Yes)にはステップS3において重要部分と判断し、そうでない場合(No)にはステップS4に進む。ステップS4では、信号(番組)の最後か否かを判別し、最後である場合(Yes)には重要度の判断処理を終了し、そうでない場合(No)にはステップS1に戻って判断処理を続ける。   That is, as shown in the flowchart of FIG. 6, first, in step S1, a frequency intensity distribution is obtained for each predetermined time interval, and in step S2, whether or not the frequency intensity distribution matches a pre-registered important pattern. Is determined. If they match in step S2 (Yes), it is determined as an important part in step S3, and if not (No), the process proceeds to step S4. In step S4, it is determined whether or not the signal (program) is at the end. If it is the last (Yes), the importance determination process is terminated. If not (No), the process returns to step S1 to determine the determination. Continue.

ここで、周波数強度分布を求める時間区間は、例えば1秒乃至数秒毎としてもよく、或いは映像のフレーム毎としてもよい。フレーム毎に周波数強度分布を求める場合、図7に示すように、現在時刻「01:20:14」のフレームに対応する音声信号を選択領域として周波数解析を行い、周波数強度分布を求める。この際、そのフレームに対応する音声信号のみならず、図8のように前後のフレームに対応する音声信号の解析結果をも利用することで、マッチングの精度を向上させることができる。この場合、図9に示すように、現在時刻を中心として肩部を有する重み付け係数を各周波数成分毎に乗算し、これらを加算することで現在時刻「01:20:14」のフレームに対応する音声信号の周波数解析結果とすることができる。   Here, the time interval for obtaining the frequency intensity distribution may be, for example, every 1 to several seconds, or may be every video frame. When obtaining the frequency intensity distribution for each frame, as shown in FIG. 7, frequency analysis is performed by using the audio signal corresponding to the frame of the current time “01:20:14” as a selected region to obtain the frequency intensity distribution. At this time, not only the audio signal corresponding to the frame but also the analysis result of the audio signal corresponding to the preceding and succeeding frames as shown in FIG. 8 can be used to improve the matching accuracy. In this case, as shown in FIG. 9, a weighting coefficient having a shoulder centered on the current time is multiplied for each frequency component, and these are added to correspond to the frame of the current time “01:20:14”. The frequency analysis result of the audio signal can be used.

なお、マッチング時には閾値を調整可能とすることにより、厳密に一致していなければならない場合や、ある程度類似していればよい場合など、多様な判断が可能となる。曖昧な一致検索では、ファジーや他の技術を用いた曖昧検索が利用可能である。また、必ずしも登録されたパターンのみならず、学習機能を持たせ、登録されたパターンから学習したパターンをマッチングのテンプレートとしてもよい。   It should be noted that by making the thresholds adjustable during matching, various judgments can be made, such as when the values need to match closely or when they need to be somewhat similar. In an ambiguous match search, an ambiguous search using fuzzy or other techniques can be used. In addition to the registered pattern, a learning function may be provided, and a pattern learned from the registered pattern may be used as a matching template.

抽出部12は、重要度判断部11において重要と判断された部分の映像/音声を抽出し、その部分をコピーして元の映像/音声信号とは別に記録部13に記録する。この際、単にその部分だけを抽出するのではなく、その前後も調整可能な範囲内で抽出することが好ましい。すなわち、例えば図10に示すように、時刻「01:20:14」のフレームに対応する区間が重要であると判断された場合、その前後のフレームに対応する区間についても抽出するようにする。この範囲は、例えば重要部分の前後3分間というように設定可能である。さらに、この範囲を変更可能としておくことで視聴対象となる番組に応じて変化させることもでき、利便性が高まる。   The extraction unit 12 extracts the video / audio of the part determined to be important by the importance determination unit 11, copies the part, and records it in the recording unit 13 separately from the original video / audio signal. At this time, it is preferable to extract not only that part but also within the adjustable range. That is, for example, as shown in FIG. 10, when it is determined that the section corresponding to the frame at time “01:20:14” is important, the sections corresponding to the frames before and after that are also extracted. This range can be set, for example, 3 minutes before and after the important part. Furthermore, by making this range changeable, it can be changed according to the program to be viewed, and convenience is enhanced.

また、抽出部12は、映像が流れているその時点では重要部分の抽出を行わず、その部分が重要であるという開始点及び終了点のマーカーのみを記録部13に記録するようにしてもよい。この場合にも、重要部分の前後を含めることが好ましい。マーカーは、元の映像/音声信号中に埋め込む或いは加えるようにしてもよいが、信号そのものを変化させたくない場合には、信号とは別にデータベースとして記録部13に記録することもできる。但し、例えば映像信号であれば信号が持つTBC(Time Base Corrector)等の位置情報を利用するなど、元の信号のどの部分に対応するかが容易に分かるようにしておく必要があるのは勿論である。   Further, the extraction unit 12 may not extract the important part at the time when the video is flowing, and may record only the start point and end point markers that the part is important in the recording unit 13. . Also in this case, it is preferable to include before and after the important part. The marker may be embedded or added to the original video / audio signal. However, if the signal itself is not desired to be changed, it can be recorded in the recording unit 13 as a database separately from the signal. However, for example, in the case of a video signal, it is necessary to make it easy to know which part of the original signal corresponds to, for example, using position information such as TBC (Time Base Corrector) possessed by the signal. It is.

統合部14は、記録部13に記録された重要部分を例えば時系列順に統合する。この際、各重要部分の間にその概要を説明するヘッダ情報を追加するようにしても構わない。また、時系列に従わず、任意の順番に入れ替えて統合するようにしてもよい。   The integration unit 14 integrates the important parts recorded in the recording unit 13 in, for example, chronological order. At this time, you may make it add the header information which demonstrates the outline | summary between each important part. Moreover, you may make it replace and integrate in arbitrary orders, without following a time series.

発信部15は、統合部14によって統合された重要部分を視聴者、例えば携帯電話機やPDA(Personal Digital Assistance)等の携帯端末装置、或いはTV受像器、PC(Personal Computer)等を含む受信端末3のユーザに対して発信する。発信の方法としては、発信側が任意の時間に発信するものであってもよく、視聴者側が任意の時間に送信要求を出し、これに応じて発信側から発信するものであってもよい。後者の場合には、視聴者が望む時間、場所で視聴することが可能である。また、送信形態は、図11に示すように、インターネット等の一般のネットワーク、或いは専用線を利用して発信するものであってもよく、図12に示すように、衛星通信を利用して発信するものであってもよい。また、放送局自身が重要部分の抽出を行う場合には、図13に示すように、従来のTV放送と同様に放送局から発信してもよい。   The transmission unit 15 receives the important part integrated by the integration unit 14 as a viewer, for example, a mobile terminal device such as a mobile phone or a PDA (Personal Digital Assistance), or a receiving terminal 3 including a TV receiver, a PC (Personal Computer), or the like. Call to other users. As a transmission method, the transmission side may make a transmission at an arbitrary time, or the viewer side may make a transmission request at an arbitrary time and make a transmission from the transmission side accordingly. In the latter case, the viewer can watch at the time and place desired by the viewer. Further, the transmission form may be a transmission using a general network such as the Internet or a dedicated line as shown in FIG. 11, and a transmission using satellite communication as shown in FIG. You may do. Further, when the broadcast station itself extracts the important part, as shown in FIG. 13, it may be transmitted from the broadcast station in the same manner as the conventional TV broadcast.

上述した情報提供装置10の詳細な構成例を図14に示す。図14に示すように、情報提供装置10は、該情報提供装置10の各部を統括して制御するCPU(Central Processing Unit)100と、不揮発性のメモリであるROM(Read Only Memory)101と、揮発性のメモリであるRAM(Random Access Memory)102と、いわゆるTVチューナーであり、例えば放送局からのTV放送を受信する映像/音声データ通信部103と、上述したような盛り上がり区間を検出する盛り上がり区間処理部104と、インターネット等のネットワーク、専用線、或いは衛星通信等を介して通信する通信回路105とが制御ライン110及びデータライン120とを介して接続されている。   FIG. 14 shows a detailed configuration example of the information providing apparatus 10 described above. As shown in FIG. 14, the information providing apparatus 10 includes a central processing unit (CPU) 100 that controls each unit of the information providing apparatus 10, a read only memory (ROM) 101 that is a nonvolatile memory, A RAM (Random Access Memory) 102 that is a volatile memory, a so-called TV tuner, for example, a video / audio data communication unit 103 that receives a TV broadcast from a broadcasting station, and a climax that detects a climax section as described above. The section processing unit 104 and a communication circuit 105 that communicates via a network such as the Internet, a dedicated line, or satellite communication are connected via a control line 110 and a data line 120.

このような情報提供装置10において、CPU100は、例えばROM101に記録されているプログラムに従って、プログラムを実行するための制御を行う。RAM102には、CPU100が各種処理を実行する上で必要なプログラムやデータが必要に応じて一時的に格納される。   In such an information providing apparatus 10, the CPU 100 performs control for executing the program in accordance with, for example, a program recorded in the ROM 101. The RAM 102 temporarily stores programs and data necessary for the CPU 100 to execute various processes as necessary.

映像/音声データ通信部103は、アンテナ106を介して受信した映像/音声信号をRAM102に記憶し、RAM102は、この信号を一定時間バッファリングした後、順次盛り上がり区間処理部104に出力する。なお、RAM102ではなくメモリカード等の外部記憶装置(図示せず)に記憶するようにしてもよいことは勿論である。   The video / audio data communication unit 103 stores the video / audio signal received via the antenna 106 in the RAM 102, and the RAM 102 buffers this signal for a certain period of time and then sequentially outputs it to the upswing section processing unit 104. Of course, the data may be stored not in the RAM 102 but in an external storage device (not shown) such as a memory card.

盛り上がり区間処理部104は、例えば図15に示すように、データライン120を介して入力された時間軸上の信号を周波数軸上の信号にスペクトル変換するスペクトル変換部150と、予め登録された重要パターンが記憶される重要パターン記憶部151と、各時間区間毎にデータが盛り上がり区間であるか否かを判定する判定部152と、盛り上がり区間を抽出する抽出部153と、各盛り上がり区間を統合する統合部154と、盛り上がり区間処理部104を統括して制御するデータ制御部155とにより構成される。   For example, as shown in FIG. 15, the climax section processing unit 104 includes a spectrum conversion unit 150 that performs spectrum conversion of a signal on the time axis input via the data line 120 to a signal on the frequency axis, and an important registered in advance. An important pattern storage unit 151 that stores patterns, a determination unit 152 that determines whether or not data is a climax section for each time interval, an extraction unit 153 that extracts a climax segment, and each climax segment are integrated. The integration unit 154 and a data control unit 155 that controls the climax section processing unit 104 in an integrated manner.

スペクトル変換部150は、入力された時間軸上の信号を前述した所定の時間区間毎にFFT(Fast Fourier Transform)等により周波数スペクトルに変換し、周波数強度分布を得る。そして判定部152は、重要パターン記憶部151から読み出した周波数強度分布と、スペクトル変換により得られた周波数強度分布とを比較して重要度を判定し、重要と判定された場合にはその旨をデータ制御部155に通知する。   The spectrum conversion unit 150 converts the input signal on the time axis into a frequency spectrum by FFT (Fast Fourier Transform) or the like for each predetermined time interval described above to obtain a frequency intensity distribution. Then, the determination unit 152 determines the importance by comparing the frequency intensity distribution read from the important pattern storage unit 151 and the frequency intensity distribution obtained by the spectrum conversion. The data control unit 155 is notified.

データ制御部155は、判定部152から通知を受け取ると抽出部153を起動させ、抽出部153は、その重要部分の前の信号をRAM102(図14)から読み出し、重要部分の信号及びその後の信号と合わせて統合部154に送る。そして統合部154は、抽出部153から送られた信号を順次記憶しておき、1つの信号として統合する。   When the data control unit 155 receives the notification from the determination unit 152, the data control unit 155 activates the extraction unit 153, and the extraction unit 153 reads the signal before the important part from the RAM 102 (FIG. 14), and the signal of the important part and the subsequent signal. To the integration unit 154. The integrating unit 154 sequentially stores the signals sent from the extracting unit 153 and integrates them as one signal.

図14に戻って通信回路105は、任意の時間に、又は視聴者側からの送信要求に応じて、統合部154(図15)で統合された信号を視聴者に対して発信する。   Returning to FIG. 14, the communication circuit 105 transmits the signal integrated by the integration unit 154 (FIG. 15) to the viewer at an arbitrary time or in response to a transmission request from the viewer.

以上のように、第1の実施の形態によれば、情報提供装置10において所定の時間区間毎に音声信号の周波数強度分布を調べ、その周波数強度分布について予め登録された重要パターンとのマッチングを行うことで、TV放送から視聴者が求める重要部分(盛り上がり部分)を自動的に抽出して統合してすることができ、視聴者に対してその重要部分を容易に提供することができる。また、視聴者は、頭出し等を行うことなく、重要部分を容易に視聴することができる。   As described above, according to the first embodiment, the information providing apparatus 10 checks the frequency intensity distribution of the audio signal for each predetermined time interval, and matches the frequency intensity distribution with a pre-registered important pattern. By doing so, it is possible to automatically extract and integrate the important part (swelling part) required by the viewer from the TV broadcast, and to easily provide the important part to the viewer. In addition, the viewer can easily view the important part without performing cueing or the like.

次に、以下に説明する第2実施の形態では、第1の実施の形態のように統合された重要部分の全てを視聴者に対して発信するのではなく、情報提供装置10が重要部分の一覧情報を作成して視聴者の携帯端末装置20に送信し、視聴者がその重要部分の中から所望の情報のみをダウンロードする。   Next, in the second embodiment described below, the information providing apparatus 10 does not transmit all of the integrated important parts to the viewer as in the first embodiment. The list information is created and transmitted to the mobile terminal device 20 of the viewer, and the viewer downloads only desired information from the important parts.

すなわち、図16のフローチャートに示すように、先ずステップS10において携帯端末装置20のユーザが重要部分一覧、例えばAチーム対Bチームの得点シーンの一覧を要求すると、ステップS11において、情報提供装置10は図17に示すような一覧情報を携帯端末装置20に送信する。これにより、携帯端末装置20の表示部には、図18に示すような画面が表示される。   That is, as shown in the flowchart of FIG. 16, when the user of the portable terminal device 20 first requests a list of important parts, for example, a list of scoring scenes of team A versus team B in step S10, in step S11, the information providing apparatus 10 The list information as shown in FIG. 17 is transmitted to the mobile terminal device 20. Thereby, a screen as shown in FIG. 18 is displayed on the display unit of the mobile terminal device 20.

次に携帯端末装置20のユーザが図18に示す一覧情報のうち、所望の得点シーンについてのチェックボックスをチェックし、さらに「選択部を受信する」とされたボタンを選択すると、ステップS12において携帯端末装置20は、情報提供装置10に対して選択部分の送信を要求する。   Next, when the user of the mobile terminal device 20 checks the check box for the desired scoring scene in the list information shown in FIG. 18, and selects the button “Receive selection unit”, the mobile phone in step S12. The terminal device 20 requests the information providing device 10 to transmit the selected part.

続いてステップS13において情報提供装置10が選択部分の1つを送信すると、ステップS14において携帯端末装置20は、受信した選択部分の保存又は再生を行う。そしてステップS15において情報提供装置10が選択部分の最後を送信すると、ステップS16において携帯端末装置20は、情報提供装置10に終了通知を送信する。   Subsequently, when the information providing apparatus 10 transmits one of the selected portions in step S13, the portable terminal device 20 stores or reproduces the received selected portion in step S14. When the information providing apparatus 10 transmits the last selected portion in step S15, the portable terminal apparatus 20 transmits an end notification to the information providing apparatus 10 in step S16.

なお、ACK通知送信を行う携帯端末装置20の場合には、選択部分の1つを受信すると、正常に受信したことを示すアクノレッジを情報提供装置10に返信し、正常に受信できなかった場合には、受信に失敗したことを示すアクノレッジを情報提供装置10に返信する。   Note that in the case of the mobile terminal device 20 that performs ACK notification transmission, when one of the selected portions is received, an acknowledgment indicating that it has been received normally is returned to the information providing device 10, and the mobile terminal device 20 has failed to receive normally. Returns an acknowledgment indicating that the reception has failed to the information providing apparatus 10.

このような処理を行う携帯端末装置20の詳細な構成例を図19に示す。図19に示すように、携帯端末装置20は、該携帯端末装置20の各部を統括して制御するCPU200と、不揮発性のメモリであるROM201と、揮発性のメモリであるRAM202と、表示部206に対する映像の表示を制御する表示制御部203と、RAM202に記憶された情報を表示部206で表示可能に再生する処理を行うデータ再生部204と、インターネット等のネットワークを介して通信する通信回路205とが制御ライン220及びデータライン230とを介して接続されている。さらに、制御ライン220には入力手段であるテンキー207が接続され、データライン230には音声を出力するスピーカ208と、音声を集音するマイクロホン209とが接続されている。   FIG. 19 shows a detailed configuration example of the mobile terminal device 20 that performs such processing. As shown in FIG. 19, the mobile terminal device 20 includes a CPU 200 that controls each part of the mobile terminal device 20, a ROM 201 that is a nonvolatile memory, a RAM 202 that is a volatile memory, and a display unit 206. A display control unit 203 that controls display of video on the display unit, a data reproduction unit 204 that performs processing for reproducing information stored in the RAM 202 so that the information can be displayed on the display unit 206, and a communication circuit 205 that communicates via a network such as the Internet. Are connected via a control line 220 and a data line 230. Furthermore, a numeric keypad 207 as an input means is connected to the control line 220, and a speaker 208 that outputs sound and a microphone 209 that collects sound are connected to the data line 230.

このような携帯端末装置20において、CPU200は、例えばROM201に記録されているプログラムに従って、プログラムを実行するための制御を行う。RAM202には、CPU200が各種処理を実行する上で必要なプログラムやデータが必要に応じて一時的に格納される。   In such a portable terminal device 20, the CPU 200 performs control for executing the program according to the program recorded in the ROM 201, for example. The RAM 202 temporarily stores programs and data necessary for the CPU 200 to execute various processes as necessary.

通信回路205は、アンテナ210を介して情報提供装置10と通信し、上述した重要情報一覧や、その一覧から選択した情報等を受信する。通信回路205は、受信した情報をRAM202に記憶する。なお、RAM202ではなくメモリカード等の外部記憶装置(図示せず)に記憶するようにしてもよいことは勿論である。   The communication circuit 205 communicates with the information providing apparatus 10 via the antenna 210, and receives the important information list described above, information selected from the list, and the like. The communication circuit 205 stores the received information in the RAM 202. Of course, the data may be stored not in the RAM 202 but in an external storage device (not shown) such as a memory card.

データ再生部204は、RAM202に記憶された重要情報一覧や選択された重要情報等のデータを表示部206で表示可能に再生する処理を行う。   The data reproducing unit 204 performs processing for reproducing data such as the important information list and the selected important information stored in the RAM 202 so that the data can be displayed on the display unit 206.

以上のように、第2の実施の形態によれば、情報提供装置10において抽出された重要部分(盛り上がり部分)の一覧情報を作成して視聴者の携帯端末装置20に送信し、携帯端末装置20において視聴者がその重要部分の中から所望の情報のみを指定してダウンロードすることにより、視聴者の選択した部分のみを簡便に視聴することができる。   As described above, according to the second embodiment, the list information of the important part (swelling part) extracted in the information providing apparatus 10 is created and transmitted to the mobile terminal device 20 of the viewer, and the mobile terminal device When the viewer designates and downloads only desired information from the important portions at 20, the viewer can easily view only the portion selected by the viewer.

続いて、以下に説明する第3の実施の形態では、第1、2の実施の形態のように情報提供装置10を介さず、携帯端末装置自身が受信したTV放送から重要部分を抽出して統合し、統合した重要部分を再生する。   Subsequently, in the third embodiment described below, the important part is extracted from the TV broadcast received by the mobile terminal device itself without using the information providing device 10 as in the first and second embodiments. Integrate and replay the critical parts that are integrated.

このような処理を行う携帯端末装置30の詳細な構成例を図20に示す。図20に示すように、携帯端末装置30は、該携帯端末装置30の各部を統括して制御するCPU300と、不揮発性のメモリであるROM301と、揮発性のメモリであるRAM302と、いわゆるTVチューナーであり、例えば放送局からのTV放送を受信する映像/音声データ通信部303と、上述したような盛り上がり区間を検出する盛り上がり区間処理部304と、表示部308に対する映像の表示を制御する表示制御部305と、RAM302に記憶された情報を表示部308で表示可能に再生する処理を行うデータ再生部306と、インターネット等のネットワークを介して通信する通信回路307とが制御ライン320及びデータライン330とを介して接続されている。さらに、制御ライン320には入力手段であるテンキー309が接続され、データライン330には音声を出力するスピーカ310と、音声を集音するマイクロホン311とが接続されている。   FIG. 20 shows a detailed configuration example of the mobile terminal device 30 that performs such processing. As shown in FIG. 20, the mobile terminal device 30 includes a CPU 300 that controls each part of the mobile terminal device 30, a ROM 301 that is a nonvolatile memory, a RAM 302 that is a volatile memory, and a so-called TV tuner. For example, a video / audio data communication unit 303 that receives a TV broadcast from a broadcasting station, a climax section processing unit 304 that detects a climax section as described above, and display control that controls display of video on the display unit 308. The control line 320 and the data line 330 include a unit 305, a data reproduction unit 306 that performs processing for reproducing information stored in the RAM 302 so that the information can be displayed on the display unit 308, and a communication circuit 307 that communicates via a network such as the Internet. And connected through. Further, a numeric keypad 309 as input means is connected to the control line 320, and a speaker 310 that outputs sound and a microphone 311 that collects sound are connected to the data line 330.

このような携帯端末装置30において、CPU300は、例えばROM301に記録されているプログラムに従って、プログラムを実行するための制御を行う。RAM302には、CPU300が各種処理を実行する上で必要なプログラムやデータが必要に応じて一時的に格納される。   In such a portable terminal device 30, the CPU 300 performs control for executing the program in accordance with, for example, a program recorded in the ROM 301. In the RAM 302, programs and data necessary for the CPU 300 to execute various processes are temporarily stored as necessary.

映像/音声データ通信部303は、アンテナ312を介して受信した映像/音声信号をRAM302に記憶し、RAM302は、この信号を一定時間バッファリングした後、順次盛り上がり区間処理部304に出力する。なお、RAM302ではなくメモリカード等の外部記憶装置(図示せず)に記憶するようにしてもよいことは勿論である。   The video / audio data communication unit 303 stores the video / audio signal received via the antenna 312 in the RAM 302, and the RAM 302 buffers this signal for a certain period of time and then sequentially outputs it to the upsurge section processing unit 304. Of course, the data may be stored not in the RAM 302 but in an external storage device (not shown) such as a memory card.

盛り上がり区間処理部304は、例えば図21に示すように、データライン330を介して入力された時間軸上の信号を周波数軸上の信号にスペクトル変換するスペクトル変換部350と、重要パターンが記憶される重要パターン記憶部351と、各時間区間毎にデータが盛り上がり区間であるか否かを判定する判定部352と、盛り上がり区間を抽出する抽出部353と、各盛り上がり区間を統合する統合部354と、盛り上がり区間処理部304を統括して制御するデータ制御部355とにより構成される。   For example, as shown in FIG. 21, the climax section processing unit 304 stores a spectrum conversion unit 350 that performs spectrum conversion of a signal on the time axis input via the data line 330 into a signal on the frequency axis, and stores important patterns. An important pattern storage unit 351, a determination unit 352 that determines whether or not the data is a climax section for each time interval, an extraction unit 353 that extracts the climax segment, and an integration unit 354 that integrates the climax segments. And a data control unit 355 that controls the climax section processing unit 304 in an integrated manner.

スペクトル変換部350は、入力された時間軸上の信号を前述した所定の時間区間毎にFFT等により周波数スペクトルに変換し、周波数強度分布を得る。そして判定部352は、重要パターン記憶部351から読み出した周波数強度分布と、スペクトル変換により得られた周波数強度分布とを比較して重要度を判定し、重要と判定された場合にはその旨をデータ制御部355に通知する。なお、重要パターン記憶部351に記憶される重要パターンは、デフォルトのパターンであってもよく、ユーザが任意に作成したパターンであってもよい。また、通信回路307のアンテナ313を介して、番組を放送する放送局からその番組の放送前にダウンロードされたものであってもよく、所定のサイトから購入したものであってもよい。   The spectrum conversion unit 350 converts the input signal on the time axis into a frequency spectrum by FFT or the like for each predetermined time interval described above to obtain a frequency intensity distribution. The determination unit 352 determines the importance by comparing the frequency intensity distribution read from the important pattern storage unit 351 with the frequency intensity distribution obtained by the spectrum conversion, and if it is determined to be important, the determination is made. The data control unit 355 is notified. Note that the important pattern stored in the important pattern storage unit 351 may be a default pattern or a pattern arbitrarily created by the user. Also, it may be downloaded from a broadcasting station that broadcasts a program via the antenna 313 of the communication circuit 307 before the program is broadcast, or may be purchased from a predetermined site.

データ制御部355は、判定部352から通知を受け取ると抽出部353を起動させ、抽出部353は、その重要部分の前の信号をRAM302(図20)から読み出し、重要部分の信号及びその後の信号と合わせて統合部354に送る。そして統合部354は、抽出部353から送られた信号を順次記憶しておき、1つの信号として統合する。   When the data control unit 355 receives the notification from the determination unit 352, the data control unit 355 activates the extraction unit 353, and the extraction unit 353 reads the signal before the important part from the RAM 302 (FIG. 20), and the signal of the important part and the subsequent signal. To the integration unit 354. The integrating unit 354 sequentially stores the signals sent from the extracting unit 353 and integrates them as one signal.

図20に戻ってデータ再生部306は、例えばユーザからの再生要求に応じて、統合部354(図21)で統合された信号を読み出し、表示部308で表示可能に再生する処理を行う。   Returning to FIG. 20, the data reproduction unit 306 reads out the signal integrated by the integration unit 354 (FIG. 21), for example, in response to a reproduction request from the user, and performs a process of reproducing the signal so that the display unit 308 can display it.

以上のように、第3の実施の形態によれば、携帯端末装置30において所定の時間区間毎に音声信号の周波数強度分布を調べ、その周波数強度分布について重要パターンとのマッチングを行うことで、TV放送からユーザが求める重要部分(盛り上がり部分)を自動的に抽出して統合してすることができ、重要部分を容易に視聴することができる。   As described above, according to the third embodiment, the portable terminal device 30 examines the frequency intensity distribution of the audio signal for each predetermined time interval, and matches the frequency intensity distribution with the important pattern. It is possible to automatically extract and integrate important parts (swelling parts) required by the user from the TV broadcast, so that the important parts can be easily viewed.

なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。   It should be noted that the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the present invention.

例えば、上述した実施の形態では、TV放送の音声信号に基づいて重要部分か否かを判断し、重要部分の音声及び映像を抽出するものとして説明したが、これに限定されるものではなく、例えばラジオ放送の場合には重要部分の音声信号のみを抽出するようにしても、同様の効果が得られる。   For example, in the above-described embodiment, it has been described that it is determined whether or not it is an important part based on an audio signal of TV broadcast, and the audio and video of the important part are extracted. However, the present invention is not limited to this. For example, in the case of radio broadcasting, the same effect can be obtained by extracting only the audio signal of the important part.

以上詳細に説明したように、本発明に係る情報処理装置は、音声信号における重要部分を抽出する情報処理装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段とを備えるものである。   As described above in detail, the information processing apparatus according to the present invention obtains the feature amount of the sound signal for each predetermined time interval in the information processing device that extracts an important part in the sound signal, and based on the feature amount. Importance determining means for determining importance in the time interval, extraction means for extracting the important part based on the importance, and integration means for integrating at least some of the extracted important parts. It is to be prepared.

ここで、本発明に係る情報処理装置は、上記統合手段によって統合された情報を外部に発信する情報発信手段をさらに備えるようにしてもよい。   Here, the information processing apparatus according to the present invention may further include an information transmission unit that transmits the information integrated by the integration unit to the outside.

このような情報処理装置によれば、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合するため、例えば統合された情報を視聴者に対して発信した場合、視聴者は容易に重要部分を視聴することができる。   According to such an information processing apparatus, for example, an important part is extracted from an audio signal of a television broadcast, and at least some of the extracted important parts are integrated. The viewer can easily view the important part.

また、本発明に係る携帯端末装置は、所定の時間区間毎に音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断し、上記重要度に基づいて上記音声信号における重要部分を抽出して統合する情報処理装置と通信する通信手段と、上記重要部分を再生する再生手段とを備えるものである。   Further, the mobile terminal device according to the present invention obtains a feature amount of an audio signal for each predetermined time interval, determines an importance level in the time interval based on the feature amount, and determines the audio signal based on the importance level. Communication means for communicating with an information processing apparatus that extracts and integrates the important part of the above and a reproducing means for reproducing the important part.

このような携帯端末装置によれば、例えばテレビジョン放送の音声信号から抽出され統合された重要部分を情報処理装置から受信し、この重要部分を再生することにより、ユーザは容易に重要部分を視聴することができる。   According to such a mobile terminal device, for example, an important part extracted and integrated from an audio signal of a television broadcast is received from the information processing apparatus, and the user can easily view the important part by reproducing the important part. can do.

また、本発明に係る携帯端末装置は、音声信号における重要部分を抽出して再生する携帯端末装置において、所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、上記重要度に基づいて上記重要部分を抽出する抽出手段と、抽出された複数の重要部分の少なくとも一部を統合する統合手段と、上記統合された情報を再生する再生手段とを備えるものである。   Further, the mobile terminal device according to the present invention obtains a feature amount of the audio signal for each predetermined time interval in a mobile terminal device that extracts and reproduces an important part in the audio signal, and the time based on the feature amount. Importance determination means for determining the importance in the section, extraction means for extracting the important part based on the importance, integration means for integrating at least some of the extracted important parts, and the integrated And reproducing means for reproducing the received information.

このような携帯端末装置によれば、例えばテレビジョン放送の音声信号から重要部分を抽出し、抽出された複数の重要部分の少なくとも一部を統合して再生するため、ユーザは容易に重要部分を視聴することができる。   According to such a portable terminal device, for example, an important part is extracted from an audio signal of a television broadcast, and at least some of the extracted important parts are integrated and reproduced. Can watch.

1 放送局、2 電話会社、3 受信端末、10 情報提供装置、11 重要度判断部、12 抽出部、13 記録部、14 統合部、15 発信部、20 携帯端末装置、103,303 映像/音声データ通信部、104,304 盛り上がり区間処理部、105,205,307 通信回路、203 表示制御部、204,306 データ再生部、206,308 表示部、207 テンキー、208,310 スピーカ   DESCRIPTION OF SYMBOLS 1 Broadcasting station, 2 Telephone company, 3 Receiving terminal, 10 Information provision apparatus, 11 Importance judgment part, 12 Extraction part, 13 Recording part, 14 Integration part, 15 Transmission part, 20 Portable terminal device, 103,303 Video / audio Data communication unit, 104, 304 Exciting section processing unit, 105, 205, 307 Communication circuit, 203 Display control unit, 204, 306 Data reproduction unit, 206, 308 Display unit, 207 Numeric keypad, 208, 310 Speaker

Claims (16)

音声信号における重要部分を抽出する情報処理装置において、
所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、
上記重要度に基づいて上記重要部分を抽出する抽出手段と、
抽出された複数の重要部分の少なくとも一部を統合する統合手段と
を備える情報処理装置。
In an information processing apparatus that extracts an important part in an audio signal,
Importance level judging means for obtaining a feature amount of the audio signal for each predetermined time interval and determining the importance level in the time interval based on the feature amount;
Extraction means for extracting the important part based on the importance,
An information processing apparatus comprising: integration means for integrating at least a part of the extracted plurality of important parts.
上記統合手段によって統合された情報を外部に発信する情報発信手段をさらに備える請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, further comprising: an information transmission unit that transmits the information integrated by the integration unit to the outside. 上記重要度判断手段は、上記時間区間毎の上記音声信号の周波数強度分布に基づいて、上記重要度を判断する請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the importance level determination unit determines the importance level based on a frequency intensity distribution of the audio signal for each time interval. 上記重要度判断手段は、上記時間区間毎に求められた上記周波数強度分布と、予め登録された重要部分の周波数強度分布とを比較することにより、上記重要度を判断する請求項3記載の情報処理装置。   4. The information according to claim 3, wherein the importance level determination means determines the importance level by comparing the frequency intensity distribution obtained for each time interval with a frequency intensity distribution of an important part registered in advance. Processing equipment. 上記音声信号には映像信号が付随しており、
上記抽出手段は、上記重要部分と該重要部分に対応する時刻の上記映像信号とを抽出する請求項1記載の情報処理装置。
The audio signal is accompanied by a video signal,
The information processing apparatus according to claim 1, wherein the extraction unit extracts the important part and the video signal at a time corresponding to the important part.
上記抽出手段は、上記重要部分と該重要部分の前後の所定の時間内における信号とを抽出する請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the extraction unit extracts the important part and a signal within a predetermined time before and after the important part. 上記統合手段は、複数の上記重要部分を時系列順又は任意の順序で統合する請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the integration unit integrates the plurality of important parts in a time-series order or an arbitrary order. 上記発信手段は、外部からの要求に応じて上記統合された情報を発信する請求項2記載の情報処理装置。   The information processing apparatus according to claim 2, wherein the transmission unit transmits the integrated information in response to an external request. 上記発信手段は、任意の時間に上記統合された情報を外部に発信する請求項2記載の情報処理装置。   The information processing apparatus according to claim 2, wherein the transmission unit transmits the integrated information to an outside at an arbitrary time. 上記重要部分が記憶される記憶手段をさらに備え、
上記抽出手段は、上記重要部分の複製を上記記憶手段に記憶する請求項1記載の情報処理装置。
A storage means for storing the important part;
The information processing apparatus according to claim 1, wherein the extraction unit stores a copy of the important part in the storage unit.
抽出された上記重要部分が記憶される記憶手段をさらに備え、
上記抽出手段は、上記重要部分の開始点及び終了点の情報を上記記憶手段に記憶し、
上記統合手段は、上記記憶手段に記憶された上記開始点及び終了点の情報に基づいて、上記重要部分を統合する請求項1記載の情報処理装置。
A storage means for storing the extracted important part;
The extraction means stores information on the start point and end point of the important part in the storage means,
The information processing apparatus according to claim 1, wherein the integration unit integrates the important parts based on information on the start point and end point stored in the storage unit.
所定の時間区間毎に音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断し、上記重要度に基づいて上記音声信号における重要部分を抽出して統合する情報処理装置と通信する通信手段と、
上記重要部分を再生する再生手段と
を備える携帯端末装置。
Information processing for obtaining a feature amount of a speech signal for each predetermined time interval, determining an importance level in the time interval based on the feature amount, and extracting and integrating important portions in the speech signal based on the importance level Communication means for communicating with the device;
A portable terminal device comprising: reproducing means for reproducing the important part.
上記通信手段は、上記情報処理装置から上記重要部分の一覧情報を受信すると共に、該一覧情報のうち所望の部分を指定する指定情報を上記情報処理装置に送信し、
上記再生手段は、上記指定情報に応じて上記情報処理装置から送信された上記所望の部分を再生すること
を特徴とする請求項12記載の携帯端末装置。
The communication means receives the list information of the important part from the information processing apparatus, transmits designation information for specifying a desired part of the list information to the information processing apparatus,
The portable terminal device according to claim 12, wherein the reproduction means reproduces the desired portion transmitted from the information processing apparatus in accordance with the designation information.
上記重要部分は、上記時間区間毎の上記音声信号の周波数強度分布と、予め登録された重要部分の周波数強度分布と比較して上記重要度を判断し、該重要度に基づいて抽出されたものである請求項12記載の情報処理装置。   The important part is extracted based on the importance by comparing the frequency intensity distribution of the audio signal for each time interval with the frequency intensity distribution of the important part registered in advance. The information processing apparatus according to claim 12. 上記音声信号には映像信号が付随しており、
上記再生手段は、上記重要部分と該重要部分に対応する時刻の上記映像信号とを再生する請求項12記載の携帯端末装置。
The audio signal is accompanied by a video signal,
The portable terminal device according to claim 12, wherein the reproduction means reproduces the important part and the video signal at a time corresponding to the important part.
音声信号における重要部分を抽出して再生する携帯端末装置において、
所定の時間区間毎に上記音声信号の特徴量を求め、該特徴量に基づいて該時間区間における重要度を判断する重要度判断手段と、
上記重要度に基づいて上記重要部分を抽出する抽出手段と、
抽出された複数の重要部分の少なくとも一部を統合する統合手段と、
上記統合された情報を再生する再生手段と
を備える携帯端末装置。
In a portable terminal device that extracts and reproduces an important part in an audio signal,
Importance level judging means for obtaining a feature amount of the audio signal for each predetermined time interval and determining the importance level in the time interval based on the feature amount;
Extraction means for extracting the important part based on the importance,
An integration means for integrating at least some of the extracted plurality of important parts;
A portable terminal device comprising: reproduction means for reproducing the integrated information.
JP2010142781A 2010-06-23 2010-06-23 Mobile terminal device, information processing method, and program Pending JP2010266880A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010142781A JP2010266880A (en) 2010-06-23 2010-06-23 Mobile terminal device, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010142781A JP2010266880A (en) 2010-06-23 2010-06-23 Mobile terminal device, information processing method, and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003105641A Division JP4828785B2 (en) 2003-04-09 2003-04-09 Information processing device and portable terminal device

Publications (1)

Publication Number Publication Date
JP2010266880A true JP2010266880A (en) 2010-11-25

Family

ID=43363842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010142781A Pending JP2010266880A (en) 2010-06-23 2010-06-23 Mobile terminal device, information processing method, and program

Country Status (1)

Country Link
JP (1) JP2010266880A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8966514B2 (en) 2011-03-04 2015-02-24 Sony Corporation Information processing apparatus, information processing method, and program
JP2016057355A (en) * 2014-09-05 2016-04-21 東日本電信電話株式会社 Content extraction device, content extraction method, and computer program
US10873777B2 (en) 2014-12-18 2020-12-22 Sony Corporation Information processing device and information processing method to calculate score for evaluation of action

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0380782A (en) * 1989-08-24 1991-04-05 Nippon Telegr & Teleph Corp <Ntt> Scene extraction processing method
JPH08292965A (en) * 1995-02-20 1996-11-05 Hitachi Ltd Video support system
JP2000312343A (en) * 1998-06-01 2000-11-07 Nippon Telegr & Teleph Corp <Ntt> High speed signal searching method and device, and recording medium therefor
JP2001143451A (en) * 1999-11-17 2001-05-25 Nippon Hoso Kyokai <Nhk> Automatic index generating device and automatic index applying device
WO2001072040A2 (en) * 2000-03-21 2001-09-27 Koninklijke Philips Electronics N.V. System and method for automatic content enhancement of multimedia output device
JP2002199333A (en) * 2000-12-27 2002-07-12 Canon Inc Device/system/method for processing picture, and storage medium
JP2002207491A (en) * 2001-01-10 2002-07-26 Denon Ltd Contents data distribution system, downloading terminal device, and portable telephone set
JP2002259720A (en) * 2001-03-02 2002-09-13 Internatl Business Mach Corp <Ibm> Contents summarizing system, image summarizing system, user terminal unit, summary image producing method, summary image receiving method, and program
JP2003005782A (en) * 2001-06-22 2003-01-08 Ricoh Co Ltd Method for delivering acoustic model for voice recognition
JP2003087728A (en) * 2001-06-26 2003-03-20 Pioneer Electronic Corp Apparatus and method for summarizing video information, and processing program for summarizing video information

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0380782A (en) * 1989-08-24 1991-04-05 Nippon Telegr & Teleph Corp <Ntt> Scene extraction processing method
JPH08292965A (en) * 1995-02-20 1996-11-05 Hitachi Ltd Video support system
JP2000312343A (en) * 1998-06-01 2000-11-07 Nippon Telegr & Teleph Corp <Ntt> High speed signal searching method and device, and recording medium therefor
JP2001143451A (en) * 1999-11-17 2001-05-25 Nippon Hoso Kyokai <Nhk> Automatic index generating device and automatic index applying device
WO2001072040A2 (en) * 2000-03-21 2001-09-27 Koninklijke Philips Electronics N.V. System and method for automatic content enhancement of multimedia output device
JP2002199333A (en) * 2000-12-27 2002-07-12 Canon Inc Device/system/method for processing picture, and storage medium
JP2002207491A (en) * 2001-01-10 2002-07-26 Denon Ltd Contents data distribution system, downloading terminal device, and portable telephone set
JP2002259720A (en) * 2001-03-02 2002-09-13 Internatl Business Mach Corp <Ibm> Contents summarizing system, image summarizing system, user terminal unit, summary image producing method, summary image receiving method, and program
JP2003005782A (en) * 2001-06-22 2003-01-08 Ricoh Co Ltd Method for delivering acoustic model for voice recognition
JP2003087728A (en) * 2001-06-26 2003-03-20 Pioneer Electronic Corp Apparatus and method for summarizing video information, and processing program for summarizing video information

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8966514B2 (en) 2011-03-04 2015-02-24 Sony Corporation Information processing apparatus, information processing method, and program
US9344760B2 (en) 2011-03-04 2016-05-17 Sony Corporation Information processing apparatus, information processing method, and program
JP2016057355A (en) * 2014-09-05 2016-04-21 東日本電信電話株式会社 Content extraction device, content extraction method, and computer program
US10873777B2 (en) 2014-12-18 2020-12-22 Sony Corporation Information processing device and information processing method to calculate score for evaluation of action

Similar Documents

Publication Publication Date Title
US11165988B1 (en) System and methods providing supplemental content to internet-enabled devices synchronized with rendering of original content
EP2954511B1 (en) Systems and methods for interactive broadcast content
CN102193794B (en) Link real-time media situation is to relevant application program and service
US10981056B2 (en) Methods and systems for determining a reaction time for a response and synchronizing user interface(s) with content being rendered
US20070260634A1 (en) Apparatus, system, method, and computer program product for synchronizing the presentation of media content
JP3891111B2 (en) Acoustic signal processing apparatus and method, signal recording apparatus and method, and program
US20090132924A1 (en) System and method to create highlight portions of media content
CN102959544A (en) Methods and systems for synchronizing media
CN105390144B (en) A kind of audio-frequency processing method and apparatus for processing audio
KR101358807B1 (en) Method for synchronizing program between multi-device using digital watermark and system for implementing the same
KR20140147096A (en) Synchronization of multimedia streams
JP4828785B2 (en) Information processing device and portable terminal device
JP2012070150A (en) Content playback device, method and program
JP2010266880A (en) Mobile terminal device, information processing method, and program
JP6560503B2 (en) Rise notification system
CN107484015A (en) Program processing method and device, terminal
JP2013098997A (en) Video analysis information transmitter, video analysis information distribution system and distribution method, video viewing system, and video viewing method
JP2006013796A (en) Digest video providing system, digest video providing apparatus and method, and terminal and digest video requesting method
JP2013098640A (en) Video analysis information uploading device and video viewing system and method
JP2005333280A (en) Program link system
KR100762616B1 (en) Digital multimedia broadcastingdmb system and words data proceeding method for proceeding words data in dmb
JP2013121096A (en) Voice regulator and digital broadcast receiver
JP5286136B2 (en) Digital broadcast receiver
JP2007288391A (en) Hard disk device
JP6129085B2 (en) Broadcast receiving device, program content confirmation data creation processing device, and program recording device

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120313

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120514

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120807