Product Features 製品特長

未来のコミュニケーションを
切り拓く。
テクノロジーで創る、リアルな声。

FutureVoiceは、NTT人間情報研究所が長年に渡り研究してきた音声関連技術と最先端のテクノロジを搭載したAI音声プロダクトです。文脈を理解した正確な発音、感情のニュアンスを再現するリアルなイントネーション、スムーズな単語のつながりで、まるで人が話しているかのような自然な音声を実現。エンタメやデバイスの音声ガイドなどはもちろん、教育コンテンツや医療・介護領域、バーチャルヒューマン・デジタルアバター、インバウンド戦略などさまざまな分野で、伝えたい「声」を魅力的にお届けしていきます。

Feature

特長01

人の声と遜色ない自然な音声

高度な生成AI技術により、自然性 × 再現性 × 表現力を兼ね備えた音声を提供します。従来の合成音声のような不自然さを排除し、よりリアルな対話体験を実現します。
特長02

バリエーション豊かな音声

対話やオペレーター、アナウンサーなど、用途に合わせた50種類以上の多彩な話者を用意。すべての話者は声質を保ったまま外国語にも対応可能です。さらに、話し方の印象を細かく調整できる機能（※）により、シチュエーションに合った自然な音声を作り出せます。
（※）印象制御機能：音声の力強さや年齢感、張りなど13の属性を細かく設定できる機能
Feature

特長03

誰の声でも再現

高度な生成AI技術により、肉声感 × 多様性 × 明瞭性を兼ね備えた音声を提供します。従来の合成音声のような不自然さを排除し、よりリアルな対話体験を実現します。

FutureVoice Clone (Zero-shot)

わずか数秒程度の音声から声色の特徴を抽出し、その特徴を再現した合成音声を提供します。
多忙な方や声を失った方など、わずかな音声しか得られない方を含む、万人向けの合成音声による声の再現の用途に適しております。

FutureVoice Clone (Few-shot)

従来サービスに比べ必要な音声データ量を大きく削減しながらも、再現性や表現力を向上した合成音声を提供します。
著名人や有名キャラクタなど、声色・口調をより高い再現性が求められる用途に適しております。

※1 声の表現のバリエーションを増やす場合は、追加の音声の時間が必要

※2 再現する音声を取得してから合成音声を提供する迄の目安の期間

※3 再現する音声の収録環境が影響する可能性有り

※4 当社比
特長04

話者の声質を損なわずに
多言語の音声

NTTテクノクロス独自の『クロスリンガルAI音声技術』により、一言語で収録された音声があれば、その話者の声質や個性を保ったまま他言語での音声を生成することが可能です。つまり、一度の収録で、その人の声による多言語対応が実現できます。ネイティブ品質の外国語音声を「いつもの声」で届けられるため、キャラクター性を損なうことなく、グローバルな展開やインバウンド対応、国際的なイベント・コンテンツ制作に最適です。対応言語は、英語・中国語（普通話）・韓国語・フランス語・スペイン語です。
Feature

特長05

音声の調整・導入が
直感的でシンプル

直感的な操作性を追求した新UI(特許取得済(特許7729682))により、セリフごとの話者変更・話速や抑揚の調整・アクセントの最適化が行えます。Webブラウザ上でいつでもどこでも利用でき、スムーズな導入と運用が可能。クラウドサービスとオンプレミスの両方に対応しており、利用シーンに合わせて柔軟に導入できます。