マイクに向かって話すだけで文字を入力できる、自然言語対応の音声認識ソフト。「AmiVoice SP」は、人間が普通に話した声を文字に変換し、さまざまなアプリケーションに転送できる、自然言語対応の音声認識・入力ソフト。事前に声の登録を行う必要のない不特定話者対応でありながら、高い認識精度を誇る。キーボードに慣れていないユーザでも、高速な文字入力を可能にする。
使い方は簡単。「AmiVoice SP」をインストールしたら、通常使用するアプリケーション(ワープロやエディタなど)を起動し、マイクに向かって話しかければよい。話した声が文字に変換され、「AmiVoice SP」のエディタ画面に表示される。あとは、エディタ画面上で「転送」ボタンをクリックするか、音声で「文字を転送」と言えば、表示されている文字がアプリケーションに入力される。キーボードからの入力が可能なアプリケーションであれば、ほとんどのもので利用できる。
大きな特徴のひとつは「不特定話者対応」であること。あらかじめ決められた文章を読み上げ、話者の声や喋り方の癖などを学習させる必要のある特定話者対応ソフトに対し、「AmiVoice SP」では、こうした学習の時間や手間は不要。インストール後、すぐに使いはじめることができる。話者を特定しないため、途中で話者が入れ替わっても、そのまま入力を続けることが可能だ。
音声入力は自然言語に対応する。「単語同士を区切ってゆっくり話す」などといった必要もなく、日常会話のように、自然にマイクに向かって話しかければよい(単語同士を区切って話すより、自然に話した方が認識率は向上するという)。
日本語辞書を内蔵し、認識された入力は自動的にかな漢字交じりの文章に変換される。話したあとでユーザがかな漢字変換操作を行う必要はない。同音異義語などで誤った漢字に変換された場合には、該当する単語にマウスカーソルを当てるだけで他の変換候補が表示され、すぐに修正できる。
利用できる辞書は「ブログ日記・メール辞書」「しゃべりことば辞書」「書きことば辞書」「政治経済辞書」の4種類。用途に応じて辞書を切り替えることで、認識精度の向上を図ることが可能。辞書の切り替えはワンタッチで行える。固有名詞や専門分野の単語などを、ユーザが辞書登録することも可能だ。利用するユーザは複数を登録できる。単語登録や日本語変換の学習結果は、ユーザごとに記憶されるようになっている。
ユーザが直接話すのではなく、読み込ませた音声ファイルを認識させることも可能。ボイスレコーダなどの録音結果の書き起こし用としても使える。