Experience Prototypistのマルチリンガル子育て+プログラミングブログ

Design Thinking、語学(英語、中国語、韓国語)、日中マルチリンガル育児、littleBitsやRaspberry Pi, Arduinoを使ったExperience Prototypingネタ。

産総研、録画したTV番組、見たい場面、音声で検索――事前の単語登録不要。



本日(2004年11月17日)の日経産業新聞7ページより。TV番組より音素片を抽出する、というのがミソ。つまりディクテーション用のエンジンでテキストを抽出してインデキシングするのではなく、音素を抽出しておき、検索時の音声入力中の音素と照合とのこと。きわめて雑な言い方をすれば、発音記号と発音記号のマッチング。

ちなみに、新聞記事によると対象言語が日本語であれば、400の音素片を認識する必要があるのに対し、英語の場合は1300とのこと。日本語って音のバラエティが少ないからねぇ。