最新の音声合成エンジンを搭載し、表現力豊かな音声を作成できる“音声創作ソフト”。パラメータを操作することにより、感情を交えた音声も簡単に作ることができる。「CeVIO(チェビオ) さとうささら トークスターター」は、ユーザの指定した漢字かな混じり文章を自然な合成音声で読み上げてくれるソフト。音声合成にはHMM(Hidden Markov Model:隠れマルコフモデル)が応用されている。二つの音声合成機能、
- メロディと歌詞とから歌声を合成する「ソング」
- 漢字かな混じり文章の話し言葉を合成する「トーク」
を持つ「CeVIO Creative Studio S」にラインナップされる一本で、トーク機能とトーク機能向け女声ボイスデータ「さとうささら トークボイス」とが含まれる。テキストを入力するだけで、自然な読み上げ音声を作ることができる。音声合成ソフトには「入力した文章を一括で音声化するだけ」のものが多いが、「CeVIO Creative Studio S」の音声合成はそれらとは一線を画す。音声の入力は文章単位ではなく、より細かく区切る「セリフ」単位で行う。例えば「こんにちは」「私の名前は、さとうささらです」といった具合に区切って入力できる。入力したセリフは「CeVIO Creative Studio S」の画面上に単語の長さに応じた「帯」の形で表示される(動画編集ソフトのタイムライン方式の編集画面を想像すればよい)。
個々のセリフには、音声の大きさ(音量)、速さ、高さ、声質(大人っぽい、子どもっぽい)の各パラメータと、感情表現のパラメータとして「元気」「普通」「怒り」「哀しみ」を設定することが可能。例えば「名前の『さとうささら』の部分だけをゆっくり大きな声で発声させる」といった指定も簡単だ。文章単位の入力では、どうしてもコンピュータ的な、単調な合成になりがちだが、セリフごとに細かく設定できるため、表現力豊かな音声合成が可能となる。さらに凝りたければ、セリフを構成する個々の「音素」単位で大きさや強さ、音の高さなどを指定することも可能。単語ごとにアクセントを変えることもできる。
セリフは漢字かな混じりで入力できる。単語解析も行われるため、単にひらがなで入力するのに比べると、同音異義語でもアクセントの違和感が少ない。音声合成時には「!」や「?」といった文字や、ひらがな/カタカナの違いも考慮される。専門用語などの特殊な単語は、読み方やアクセントなどをユーザが登録することも可能だ。
セリフ単位で細かく入力するのが面倒な場合には、長文を一括で入力することも可能(長文入力モード)。長文入力モードでも、改行や句点(。)、あるいは最大200文字で文章がセリフに自動分割され、セリフごとの表情付けが行われるようになっている。
「CeVIO Creative Studio S」のトークボイスには、「さとうささら」のほか、女声の「すずきつづみ」、男声の「タカハシ」がある。「さとうささら トークスターター」にほかのトーク音声データを追加するだけで、複数の声で合成音声を作ることも可能。ソング機能の「さとうささらソングスターター」もあり、「トークスターター」に「ソングスターター」を追加すれば、トークとソング、二つの機能を組み合わせて使用できる。
追加ボイスをインストールした場合は、セリフごとに「どのボイスを使用するか」を選択できる。もちろんセリフごとのパラメータ設定は個々のボイスすべてに有効。対話形式の音声合成時には、それぞれ個別の感情表現を与えることができる。タイムライン方式の編集なので、発声のタイミングをコントロールしたり、一方の人物のボイスにもう一人のボイスを重ねて発声させたりといったことも可能。音声合成の結果は、複数のボイスを混ぜた形でひとつの音声ファイルに出力できる。ソング機能と組み合わせれば、歌声とトークとをあわせて発声させることも可能だ。
拡張機能では、Windows標準の音声合成API(Speech API)であるSAPI5に対応する。SAPI5対応のアプリケーションと組み合わせれば、ほかのソフト(例えばブラウザ読み上げ機能やTwitterの読み上げ機能など)から「CeVIO Creative Studio S」の音声合成エンジンを使って発声させることができる。