株式会社KDDI総合研究所

<別紙>

 

【技術的特徴】
今回新しく開発した音声合成ソフトウェアは、従来の「N2」よりも多くの処理を合成音声の出力と同時に行うことで、システムに必要なRAMサイズを大幅に削減しました。
従来は、1発声に対して、まず合成する音声の特徴(音声のスペクトルや基本周波数等)を全て求めてから音声波形を合成し出力していたため、求めた音声の特徴情報を一時的に保持するための大容量のRAMが必要でしたが、今回開発した音声合成ソフトウェアでは、音声の特徴を求める処理(パラメータ生成処理)を音声波形の生成処理・出力と並列に行うことで、音声合成に必要なRAMサイズを大幅に削減しました。このような並列処理を行うと、従来の方法の結果と比較し、求めた音声の特徴に誤差が生じやすいのですが、今回、設定のチューニングにより、処理量の大幅な増加を避けつつ実用上問題のないレベルに誤差を抑えています。

 

 

 

テキスト入力から音声合成ができるまでのイメージ

 

 

 

音声合成エンジンが動作するマイコンシステムの構成例・必要スペック

 

 

 

※ニュースリリースに記載された情報は、発表日現在のものです。 商品・サービスの料金、サービス内容・仕様、お問い合わせ先などの情報は予告なしに変更されることがありますので、あらかじめご了承ください。

ニュースリリース本文に戻る