ソリューション・製品の詳細はこちら

2021年08月04日

NTTテクノクロス株式会社

NTTテクノクロス株式会社(本社:東京都港区、代表取締役社長:桑名 栄二 以下、NTTテクノクロス)は、音声合成ソリューション「FutureVoice(フューチャーボイス)」をバージョンアップし、最新のAI技術を活用してさらに自然な音声を実現するとともに、直感的かつ効率的にご利用できるようにユーザインタフェース(以下、UI)を刷新し、2021年8月4日より提供を開始します。

背景

人の声を人工的に作成する音声合成は、急速なAI技術の発展により、対話サービスをはじめ、ロボットやゲームアプリなどに活用されています。また今後、音声合成の利用拡大が見込まれるエンターテインメント業界や広告業界においては、自然な音声を簡易に作成して、さまざまな場面で利用したいというニーズが高まっています。

特長

(1)最新AI技術を活用し、さらに自然な音声を実現

NTT人間情報研究所が開発した最先端AI技術のニューラル波形生成型音声合成技術*1(以下、本技術)を活用することで、デジタル処理による機械的な音を極限まで削減し、さらに自然な音声を実現。声優や有名人の音声合成においては、声の再現性が一層高まり、活用の場面が一段と広がります。また、国内初*2となる独自の高速音声波形生成アルゴリズムにより、一般的なCPUにおける実用的な処理性能と業界トップレベルの自然な音声合成を両立しました。

バージョンアップした「FutureVoice」のイメージ
従来の音声合成
ニューラル波形生成型音声

(2)デザイン思考を基にUIを刷新(特許出願中)

お客様の潜在的な課題を抽出するNTTテクノクロスのデザイン思考を活用し、UIを刷新。直感的な操作を誘導するカラーデザインや表示形式(パターン表示やタグ付など)の採用に加え、動画のナレーション向けの音声制作において長文の音声を作成する際に、セリフ単位で管理することが可能となり、効率的な作業が行えます。さらに、ご要望が多かった声の高さの部分的な上げ下げや長さの調整を行う機能を付加し、イメージ通りの音声制作が可能です。

刷新した「FutureVoice」のUI

価格

 実際の利用環境などにより構成や価格が変わるため、詳細はお問い合わせください。

「FutureVoice」とは

 2006年に提供を開始した音声合成ソリューションで、さまざまな分野の「声」に活用できます。NTT人間情報研究所が開発した深層学習(DNN*3)を活用した最新の音声合成技術をもとに、少量の音声データから人の声と遜色ない肉声感・明瞭感のある自然な合成音声を実現します。(https://www.futurevoice.jp/別ウィンドウで開きます

用語解説・注釈

*1:ニューラル波形生成型音声合成
 韻律情報(声色・発声リズム・イントネーション等の声の特徴)に対して、音声波形生成処理にニューラルネットワークを適用し、従来の信号処理では実現が困難だった肉声感の向上、微小なノイズを軽減する技術。

*2:NTTテクノクロス調べ

*3:DNN
 Deep Neural Network(深層ニューラルネットワーク)の略。機械学習の一種であるニューラルネットワークの階層を深くしたアルゴリズムで、画像認識や音声認識などの分野で活用されている。

*「FutureVoice」はNTTテクノクロス株式会社の登録商標です。

*「FutureVoice」はNTTグループのAI「corevo®」の音声合成技術を活用したサービスの1つです。

*「corevo®」は日本電信電話株式会社の登録商標です。(https://www.ntt.co.jp/corevo/別ウィンドウで開きます

* 記載されている商品名・会社名などの固有名詞は一般に該当する会社もしくは組織の商標または登録商標です。

NTTテクノクロス株式会社概要

NTTテクノクロスは、NTT研究所の最先端技術を中核に、国内外の優れた商材を豊富な実績とノウハウで掛け合わせることで、お客様のビジネスシーンに最適なソリューションを創出します。時代に先駆けたソリューションにより、豊かな未来社会の実現に貢献し続けます。(https://www.ntt-tx.co.jp/別ウィンドウで開きます