音声認識エンジン「AmiVoice」

転勤あいさつのつもりで訪れた音声認識ベンチャー「アドバンスト・メディア」(本社・東京都豊島区東池袋3-1-1サンシャイン60 48F)で、同社の誇る音声認識エンジン「AmiVoice」のプレゼンを受ける羽目になった。同エンジンの特徴は以下の通り。

 ①従来の音声認識ソフトと異なり、事前学習を必要としない、つまり話者を特定しない画期的な音声認識エンジン

 ②優れた言語モデル・辞書を併せ持ち、特定単語の認識に留まらず、文章として高性能認識を可能とすることにより、ユーザビリティーを飛躍的に向上

 ③業界最高水準の認識率を誇り、特定の業種や領域に特化したソリューションをも提供することで、既に多くの分野で採用されているポテンシャル

 「AmiVoice」導入の主な事業分野は医療(病院でのカルテ、読影・診療リポートなどのデータ入力・編集作業)、娯楽&教育(ゲーム/TVでの入力アクションの容易化・自然化)、コンピューター・テレフォニー・インテグレ-ション(コールセンター業務、受付業務の高度化・効率化)、政府・公共(議会議事録、各種委員会議事録、裁判録などの作成)、ビジネス(営業報告データ、顧客とのやり取りの内容を音声・文字保存)、モバイル(携帯電話採用による高精度音声入力)などだ。

 本命はどうやら、携帯電話での音声入力の実現のようである。音声がたちまちテキストに早変わりするデモを見て嬉しくなった。何せ、携帯のあの狭いキーを操ることは土台あがいても女子高生やOLたちに適わない。とにかく指があんなに自由に動かない。

 それがこのエンジンを使えば、口頭で読み上げるだけで、簡単にテキストが打ち出される。ほれぼれするほどだ。キー操作において、女子高生にも劣るというコンプレックスから解放される。むしろ、一気に優位にさえ立てる。嬉しいことだ。

 音声認識も単語認識が可能になった第1世代(1960年~)から音声のテキスト化が可能になった第2世代、2001年からは本格的な実用化に入った第3世代を迎えている。第3世代まで踏み込んだ世界で唯一の音声認識技術が「AmiVoice」だという。技術は限りなく進化を続けているようである。

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.