たまには技術的なことを書かないと、テクニカルな人が書いているブログだと思われなくしまってしまうので、今回はかな漢字変換についての話題。
来年初頭にMicrosoftから新しいWindowsであるWindows Vistaがリリースされるが、このVistaのリリースに伴い、あるいは前後して、次に挙げるIME(かな漢字変換)がリリースされる。
- Windows Vista標準のIME
- Office 2007搭載のIME 2007
- ジャストシステムのATOK 2007
IME 2007の開発者である佐藤良治氏によると、Vista標準のIMEはOffice 2003添付のIMEと同等の変換精度だが、一方、IME 2007の方はこれまでの隣接するBi-Gram、隣接しない(2語の)係り受けだけでなく、Trigram/SLMという3語の隣接を考慮した変換を行っているとのこと。
- VistaとOffice 2007、かな漢字変換の結果が違うのはなぜ? (http://itpro.nikkeibp.co.jp/article/NEWS/20061204/255812/)
一方、ATOK 2007の方もATOKハイブリッドコアと呼ばれる新しい仕組みが入っているようだ。ハイブリッドというのが何と何とを掛け合わせたものなのか、説明を見てもはっきり書かれていないうえに、例に挙げられているATOK 2006からATOK 2007との変換精度の向上も、ハイブリッドコアがなくても実現できそうなものではあるが、まぁ、「何か」が変わったのであろう。
なお、JIS X 0213:2004対応は上記の全IMEで対応されているようだ(おそらくは2004に対応しない、というオプションも別途あることだろう)。
話は日本語だけに止まらず、MS謹製の中国語IME(簡体字、繁体字)や韓国語IME(こちらはまぁ、ハンチャ変換はそんなに求められてはいないのだろうが)など、気になることがいろいろあるので、Vistaリリース、楽しみだ。