現在、パソコン用音声合成ソフトには大きく分けて二つの種類がある。ひとつが昔ながらのソフトともいえる「文字を読み上げ、音声にする」タイプのもの。そしてもうひとつが最近の「VOCALOID」に代表されるような「歌詞とメロディを入力して歌わせる」タイプのものだ。「CeVIO Creative Studio S」は、二つの機能を一本で利用できる、高機能な音声合成ソフトだ。エンターテインメント要素が強い「歌声合成」ソフトと比べると、会話音声の合成はどちらかといえばビジネス向けのお堅いイメージが強い。実際、周りを見ても、機械によって作られた合成音声は無機質・無感情で、それが許されるシーンでしか使われていないことが多い。自販機や駅のアナウンスなどのように、聞き取りやすさや「お客さま」に対する印象が重要なアナウンスでは、純粋な合成音声ではなく、アナウンサーや声優の肉声によって録音されたものが再生されている。
対して「CeVIO さとうささら トークスターター」では、トーク音声合成でありながら、「さとうささら」という名前やキャラクタイラストを与え、あえてキャラクタ性を持たせてきた。こうした音声合成ソフトは「CeVIO」がはじめてというわけではないが、単語ごと、音素ごとにこれほど細かく感情パラメータを指定できる音声合成ソフトはほとんどない。まさに「エンターテインメント性を持たせたトーク音声合成ソフト」だ。
だからといって、ホビー向けやエンターテインメント向けというわけではない。自販機の「ありがとうございます」が、感情のこもらない合成音声では味気ないことからもわかるように、たとえビジネス用途であっても、あるいは単なる読み上げであっても、より肉声に近い音声の方が聞き取りやすいのだ。
(天野 司)