Product Features 製品特長

未来のコミュニケーションを
切り拓く。
テクノロジーで創る、リアルな声。

FutureVoiceは、NTT人間情報研究所が長年に渡り研究してきた音声関連技術と最先端のテクノロジを搭載した音声合成プロダクトです。文脈を理解した正確な発音、感情のニュアンスを再現するリアルなイントネーション、スムーズな単語のつながりで、まるで人が話しているかのような自然な音声を実現。エンタメやデバイスの音声ガイドなどはもちろん、教育コンテンツや医療・介護領域、バーチャルヒューマン・デジタルアバター、インバウンド戦略などさまざまな分野で、伝えたい「声」を魅力的にお届けしていきます。

  • Feature

    特長01

    人の声と遜色ない自然な音声

    高度な生成AI技術により、肉声感 × 多様性 × 明瞭性を兼ね備えた音声を提供します。従来の合成音声のような不自然さを排除し、よりリアルな対話体験を実現します。

    「辛い」の語が文脈により「ツライ」「カライ」と異なる意味で使われる例を示すイラスト
  • 特長02

    バリエーション豊かな音声

    日本語50種類以上の話者をはじめ、外国語対応、老若男女の音声、さらには感情表現まで自由自在。さまざまなシチュエーションに合わせた音声を選択でき、対話向け・オペレーター向け・アナウンサー向けなど、用途に応じたバリエーションが充実しています。

    喜怒哀楽を表現したイラスト
  • Feature

    特長03

    誰の声でも再現

    高度な生成AI技術により、肉声感 × 多様性 × 明瞭性を兼ね備えた音声を提供します。従来の合成音声のような不自然さを排除し、よりリアルな対話体験を実現します。

    Zero-Shot音声合成

    わずか数秒程度の音声から声色の特徴を抽出し、その特徴を再現した合成音声を提供します。
    多忙な方や声を失った方など、わずかな音声しか得られない方を含む、万人向けの合成音声による声の再現の用途に適しております。

    Few-Shot音声合成

    従来サービスに比べ必要な音声データ量を大きく削減しながらも、再現性や表現力を向上した合成音声を提供します。
    著名人や有名キャラクタなど、声色・口調をより高い再現性が求められる用途に適しております。

    音声合成システムの対応言語や入出力形式などの仕様を表形式で示した画像

    ※1 声の表現のバリエーションを増やす場合は、追加の音声の時間が必要

    ※2 再現する音声を取得してから合成音声を提供する迄の目安の期間

    ※3 再現する音声の収録環境が影響する可能性有り

    ※4 当社比

  • 特長04

    話者の声質を損なわずに
    多言語の音声

    NTTテクノクロス独自の『クロスリンガル音声合成技術』により、一言語で収録された音声があれば、その話者の声質や個性を保ったまま他言語での音声を生成することが可能です。つまり、一度の収録で、その人の声による多言語対応が実現できます。ネイティブ品質の外国語音声を「いつもの声」で届けられるため、キャラクター性を損なうことなく、グローバルな展開やインバウンド対応、国際的なイベント・コンテンツ制作に最適です。対応言語は、英語・中国語(普通話)・韓国語・フランス語・スペイン語です。

    多言語で表現するイラスト
  • Feature

    特長05

    音声の調整・導入が
    直感的でシンプル

    直感的な操作性を追求した新UI(特許出願中)により、セリフごとの話者変更・話速や抑揚の調整・アクセントの最適化が行えます。Webブラウザ上でいつでもどこでも利用でき、スムーズな導入と運用が可能。クラウドサービスとオンプレミスの両方に対応しており、利用シーンに合わせて柔軟に導入できます。

    音声合成ソフトの画面で、セリフや声質、音量などの調整が可能なインターフェースが表示されている

Contact us

FutureVoiceの
お問い合わせはこちら