株式会社KDDI総合研究所 このページを印刷する

音声合成ソフトウェア「N2」

端末単体で動作可能な省メモリで軽量な日本語音声読み上げソフトウェア
スマートフォンアプリやIoTデバイスに組み込み可能な開発者向けSDK

製品仕様

音声合成ソフトウェア「N2」TTSライブラリSDK

 

 

  TTSライブラリSDK
for Android
TTSライブラリSDK
for iOS
提供形態 Javaライブラリ(jar)
+
JNIライブラリ
Cライブラリ(Xcode
Framework形式)
インタフェース 独自Java API (Android
TextToSpeech API互換)
独自API
(C言語ベース)
入力形態 漢字かな交じり文/韻律記号付き仮名文字列
言語処理 文字コード Unicode(UTF-16)
辞書単語数 約24.4万語(大規模辞書)/約9.3万語(基本辞書)
辞書のカスタマイズ
(弊社カスタマイズ対応)

(ユーザ辞書機能あり)
音声合成処理 合成単位 音素
合成方式 パラメータ合成方式(HMM音声合成方式)
出力音声 Linear PCM (32kHz, 16bit, モノラル)
合成音声 声質 20種類(女声・男声各10種類)
声の高さ 可変(50~200%)
発声速度 可変(50~200%)
基本音量 固定
抑揚
(F0レンジ)
可変(0~200%)
動作環境 OS Android 1.6以降 iOS 5以降
CPU ARMv5TE以降
(ARM11 400MHz以上を推奨)
ARMv7-A/ARMv8-A ,
x86(シミュレータ用)
必要空きメモリ 6MB以上(1声質・基本辞書構成時)/
10MB以上(1声質・大規模辞書構成時)
空き容量 4MB以上(1声質・基本辞書構成時)/
6MB以上(1声質・大規模辞書構成時)

 

  TTSライブラリSDK
for Linux
TTSライブラリSDK
for Windows
提供形態 共有ライブラリ(.so)/
(RPM/deb形式パッケージによる提供)
Win32/Win64用DLL
ファイル
インタフェース 独自API(C言語ベース)
入力形態 漢字かな交じり文/韻律付き仮名文字列
言語処理 文字コード Unicode(UTF-16)
辞書単語数 約24.4万語(大規模辞書)/約9.3万語(基本辞書)
辞書のカスタマイズ (ユーザ辞書機能あり)
音声合成処理 合成単位 音素
合成方式 パラメータ合成方式(HMM音声合成方式)
出力音声 Linear PCM (32kHz, 16bit, モノラル)
合成音声 声質 20種類(女声・男声各10種類)
声の高さ 可変(50~200%)
発声速度 可変(50~200%)
基本音量 固定
抑揚
(F0レンジ)
可変(0~200%)
動作環境 OS RHEL 6以降(i686,x86_64)
Debian GNU/Linux 7以降
(amd64, armel, armhf, i386)
Ubuntu 14.04 LTS以降
(amd64, armel, armhf, i386)
Raspbian
Windows Vista以降
CPU ARMv5TE以降
(ARM11 400MHz以上を推奨)、
x86
x86
必要空きメモリ 6MB以上(1声質・基本辞書構成時)/
10MB以上(1声質・大規模辞書構成時)
空き容量 5MB以上(1声質・基本辞書構成時)/
8MB以上(1声質・大規模辞書構成時)

Android用テキスト音声合成(TTS)エンジン

 

 

提供形態 Android APKパッケージ
(無償版はGoogle Playからのダウンロード提供のみ)
インタフェース Android TextToSpeech API経由
入力形態 漢字かな交じり文
言語処理 文字コード Unicode(UTF-16)
辞書単語数 約24.4万語/約9.3万語(無償版)
辞書のカスタマイズ ×
音声合成処理 合成単位 音素
合成方式 パラメータ合成方式(HMM音声合成方式)
出力音声 Linear PCM (32kHz, 16bit, モノラル)
合成音声 声質 2種類(女声・男声各1種類)/20種類(声質追加データパッケージ計4種類導入時)
声の高さ 可変(50~200%)
発声速度 可変(50~200%)
基本音量 可変(5段階)
抑揚
(F0レンジ)
固定
動作環境 OS Android 1.6以降 (1.6~4.0.2では制限事項あり)
CPU ARMv5TE以降(ARM11 400MHz以上を推奨)
メモリ 6MB以上
空き容量 18MB以上/16MB以上(無償版)