Experience Prototypistのマルチリンガル子育て+プログラミングブログ

Design Thinking、語学(英語、中国語、韓国語)、日中マルチリンガル育児、littleBitsやRaspberry Pi, Arduinoを使ったExperience Prototypingネタ。

NEC携帯電話で音声認識



NECNECエレクトロニクスが携帯電話上で音声認識を行い、電子マニュアルを自然言語で検索するデモンストレーションを行った。

少し前のSamsungの件もあって、「音声でメールが打てる」のような捉え方をしている人も多いようだが、下に挙げる記事にもあるように「メールを音声で作成するのはまだ難しい」というのが正直なところかと思う。電子マニュアルの検索という用途であれば、対象ドメインやその中で使用されるボキャブラリー、グラマ等がある程度決まってくるので、それなりに使えるといったところだろう。

CPUには3つのCPUコアを持つNECマルチコアプロセッサMP211を使用、音声認識を(1)入力音声と音のモデルの類似度計算、(2)音響先読み等による探索範囲の絞り込み、(3)絞りこんだ範囲からの最適単語列の探索の3ステップに分け、各CPUコア上で同時実行することにより、高速な認識処理を実現しているとのこと。単純に3つのCPUコアでそれぞれ別の単語をターゲットにしたワードスポッティングをパラレルに実行しているのかな、と思っていたのだが、いわゆるディクテーションを実現しているようだ(前述のように「携帯電話の電子マニュアル検索」というドメインに特化しているのだが)。

http://pcweb.mycom.co.jp/news/2005/01/26/012.html

2005/02/17追記

ケータイのマニュアルを声で検索“万人に優しい端末”へ一歩前進
http://itpro.nikkeibp.co.jp/free/TIS/keitai/20050215/156179/