NECとNECエレクトロニクスが携帯電話上で音声認識を行い、電子マニュアルを自然言語で検索するデモンストレーションを行った。
少し前のSamsungの件もあって、「音声でメールが打てる」のような捉え方をしている人も多いようだが、下に挙げる記事にもあるように「メールを音声で作成するのはまだ難しい」というのが正直なところかと思う。電子マニュアルの検索という用途であれば、対象ドメインやその中で使用されるボキャブラリー、グラマ等がある程度決まってくるので、それなりに使えるといったところだろう。
CPUには3つのCPUコアを持つNECマルチコアプロセッサMP211を使用、音声認識を(1)入力音声と音のモデルの類似度計算、(2)音響先読み等による探索範囲の絞り込み、(3)絞りこんだ範囲からの最適単語列の探索の3ステップに分け、各CPUコア上で同時実行することにより、高速な認識処理を実現しているとのこと。単純に3つのCPUコアでそれぞれ別の単語をターゲットにしたワードスポッティングをパラレルに実行しているのかな、と思っていたのだが、いわゆるディクテーションを実現しているようだ(前述のように「携帯電話の電子マニュアル検索」というドメインに特化しているのだが)。
http://pcweb.mycom.co.jp/news/2005/01/26/012.html
2005/02/17追記
- ケータイのマニュアルを声で検索“万人に優しい端末”へ一歩前進
- http://itpro.nikkeibp.co.jp/free/TIS/keitai/20050215/156179/