VoiceMallオンプレミス型の機能
ここでは、VoiceMallオンプレミス型の機能をご紹介します。
Voice AI Proxy(音声AI連携オプション) new
音声認識・音声合成・自然言語処理・感情解析などのAI技術の急成長に伴い、各社より多種多様な音声関連のクラウド型サービスが提供されています。しかしながら、各社でAPIが異なることから、コンタクトセンターなどで利用されるIVRとクラウド型音声系サービスとの連携には、サービスごとに個別カスタマイズが必要となるため、他サービスへの切り替えには、その作業負荷が障壁となっていました。
「Voice AI Proxy」は、クラウド型音声系サービスの各社で異なるAPIをタイプ(音声認識、音声合成、自然言語処理[対話、分類]、音声感情解析)ごとに共通化し、これまで必要だった個別カスタマイズが不要となるオプションサービスです。
ポイント
- 最新の音声認識・音声合成+自然言語処理を個別にI/F構築することなく、設定レベルで利用することが可能です。対話型の自動応答(AI-IVR)が柔軟に構築できます。
- 発話内容に最適な音声系クラウドサービスの利用が可能になります。また各社の音声認識結果の比較も追加オプション(音声認識比較ツール)で行うことができます。
特長
- 各社音声系クラウドサービスとの連携が手軽に
各社のクラウド型音声系サービスのAPIを共通化し、これまでシステム連携時に必要だったサービス単位の個別カスタマイズが不要となり、サービスの導入時や切り替え時の作業が発生しません。 - 連携可能なサービスの豊富さ
連携可能なサービスには、NTT研究所が開発した深層学習(ディープラーニング)に基づく音声認識エンジン技術を活用した音声認識ソフトウェア「SpeechRec(スピーチレック)」や、音声合成ソリューション「FutureVoice(フューチャーボイス)」をはじめ、Google(Speech-to-Text、Dialogflow)、IBM(Watson Speech to Text、Watson Assistant)など、シームレスに連携でき、目的や用途に応じた組み合わせが可能です。今後、順次連携サービスを拡張予定です。タイプ 対応数 対応サービス 音声認識 5 SpeechRec Cloud、COTOHA API、Google Cloud Speech-to-Text、IBM Watson Speech to Text、Microsoft Azure Speech to Text 音声合成 3 FutureVoice Crayon Cloud、Google Cloud Text-to-Speech、IBM Watson Text to Speech 自然言語処理(対話) 2 Google Dialogflow、IBM Watson Assistant 自然言語処理(分類) 2 Google AutoML Natural Language、IBM Natural Language Classifier 音声感情解析 1 Empath ※各社クラウド型音声系サービスの利用条件は、該当する各社サービスの利用規約等に基づきます。
- 音声認識比較ツールの提供(サブオプション)
採用を検討している複数の音声認識サービスの比較検討や、現行システムで採用している音声認識サービスの精度確認が行えます。なお、音声認識比較ツールはクラウド型の提供形態となります。
※詳細は別途お問い合わせください。
Voice Dialog Editor
音声対話フロー(コールフロー)を効率よく作成するためのブラウザソフトウェアを用いたオーサリングツールです。
主な機能
- 音声フロー編集
- ガイダンス一覧
- 自由変数一覧
- パスワードの変更設定
- フロー作成状況確認
- VoiceXMLソース送信
- コンテンツコピー
- 情報暗号化設定
作成可能フロー
- ガイダンス再生
- 入力値(確認・分岐)
- 音声録音/ファイル保存
- 通話転送
- 情報送信
- VoiceXML作成
- ドキュメント呼び出し
- 変数代入
ノンストップシステム
障害時サーバ自動切換え機能
IVRの接続先サーバ(音声認識/合成/Webなど)名は、変数(例:$W)として与えられており、その変数部分はサーバ管理情報DBに管理されます。
サーバ管理情報には各サーバの接続優先順位やサーバの状態が記述されており、例えば(ASR)サーバ1に障害が発生した場合にはサーバ管理情報に従って自動的に別の(ASR)サーバ2に接続する仕組みとなっています。
また各サーバを変数として扱うことにより、特別なハードウェアを必要とせずに同一構成機器(ミラー)をグルーピングすることができます。
高負荷時他サーバ照会機能
接続を試みたサーバの負荷が許容範囲を超える場合には、そのサーバ自身が別のサーバを照会する自律的な負荷分散機能も実現します。
障害監視機能
遠隔からの障害監視および障害の検知・発報、復旧・再起動等の操作を行うことができます。監視端末は、パソコン・携帯(メール)・電話等各種端末に対応しております。
各監視対象端末からの、状態通知を待ち合わせる障害監視サービスと、監視対象のPCにインストールされ、PCの動作状況をシステムモニタサービスに通知する監視クライアントで構成されています。
複数サービスの同時提供
複数サービスを同時並行で効率的に提供するために必要な各種機能を備えています。
着ID毎の設定切換機能
利用者の着IDごとに異なるVoiceXMLドキュメントを再生することができます。
利用者ごとのサービス(ガイダンス)を再生することが可能です。
発信機能/発信規制
発信を行ったり、発信先の制限(規制)をかけたりすることができます。
最新の音声認識/音声合成
NTT研究所の先端技術で実現したSpeechRec(音声認識)とFutureVoice Crayon(音声合成)の最新バージョンを採用して、音声認識・合成の性能が格段に向上しました
音声認識について
- キーワードの音声認識だけでなく自由発話の音声認識が可能です。
- 日本語以外に英語の音声認識が可能です。
- 電話回線経由の音声認識性能が格段に向上しています。
- 音声認識エンジンとして、オンプレミス型SpeechRecの他に、ご希望に応じてクラウド型音声認識サービス(SpeechRec クラウドおよび他社クラウド(4社))をお選びいただけます。【2020年3月13日提供開始】
- 話し終わり判定機能※の採用により、自由発話で話し終わった時のボタン操作が不要です。【2020年3月13日提供開始】
※ 話し終わり判定機能:言葉の意味のまとまりをAIで自動判定するNTT研究所技術。
音声合成について
- 日本語以外に、英語、中国語、韓国語の音声合成が可能です。
- 人の声を特徴付ける「話者」と「口調」とを自由に組み合わせて、多様で高品質な音声合成が可能です(日本語のみ)。
その他の機能
変数秘匿処理機能
URLに応じて、telephone.dnis(発番)などの情報を秘匿できます。
システムコマンド
バージイン(割込)入力の有効、無効などをガイダンス案内中にプッシュボタン操作で可能にします。
BuiltinDll
on-premises独自の拡張DLLです。プラットホームの機能をすべて使用する事が可能です。
特定発番拒否
特定の発番からの着信を拒否します。