情報畑でつかまえてロゴ
本サイトは NTTテクノロスが旬の IT をキーワードに
IT 部門が今知っておきたい最新テクノロジーに関する情報をお届けするサイトです

【AI活用最前線】音声認識で仕事の現場はこう変わる!

人工知能(AI)の活用で今注目を集めているのが、人の話し言葉を聞き取って解釈する音声認識分野での活用です。「Siri」、や「Google Now」、「しゃべってコンシェル」のようなパーソナルアシスタント機能を日常生活で使用するだけでなく、仕事の現場でも導入が進んでいます。コンタクトセンターやホテル、アミューズメント施設などでの活用事例をご紹介します。

本コラムは「Bizニュース(月1~2回配信)」としてメールマガジンでご紹介しているコンテンツです。
下記の「Bizニュース配信登録」ボタンから登録いただくと、最新情報をお届けします!

BizMail

人工知能(AI)の進歩によって、私たちを取り巻く世界は劇的に変わりました。インターネットの検索エンジンやさまざまなソフトウェアはもちろんのこと、生活を取り巻く家電製品や自動車などにもAIが活用され、新たな世界が私たちの前に展開されようとしています。
なかでも昨今特に注目を集めているのが、AIの進歩によって精度を増した音声認識の分野です。人の話し言葉などを聞き取って解釈し、それに対して適切な反応をするソフトウェアや製品を開発するため、各社がしのぎを削ってさまざまな研究が進められています。

この記事では、音声認識を取り巻く最新の情報をご紹介しつつ、それが今後ビジネスの分野においてどのように活用されていくのかに思いを馳せてみましょう。

音声認識の「今」

音声認識の技術に注目が集まりつつある理由のひとつとして、スマートフォンやスマート家電などの普及により、「もっと手軽に機器を操作したい」というニーズが高まってきたということがあります。

AppleのiOSに搭載されている「Siri」、Android OSの「Google Now」、NTTドコモが提供する「しゃべってコンシェル」のようなパーソナルアシスタント機能は、今ではすっかり一般的なものとなりました。日本国内で普及し始めたころのSiriは受け答えにぎこちないところがありましたが、最近はユーザからの語り掛けに対して気の利いたジョークを返すまでに成長しているようです。

スマートフォンを片手で持って話し掛けるだけでさまざまな操作を行えるのが、こうしたパーソナルアシスタントの大きな利点といえるでしょう。この流れはスマートフォンだけでなく家電製品といった分野でも加速しつつあり、声で語り掛けて操作するいわゆる「音声認識家電」も徐々に普及してきています。また、ユーザからの語り掛けに応えてテレビやステレオ、コンピュータやそのほかの家電製品などを操作する、「Amazon Echo」や「Google Home」のような製品も世間の話題を呼んでいます。

音声認識が活躍している領域として、もうひとつ忘れてはならないのはロボットとのコラボレーションでしょう。 ソフトバンクの「Pepper」やヴィストンの「Sota」、富士ソフトの「Palmi」といったコミュニケーションロボットが続々開発され、街のあちこちで当たり前にロボットの姿を見かけることが増えてきました。 Pepperはソフトバンク代理店の店頭などで接客をするほか、銀行やホテルなどでも顧客の「おもてなし」に力を発揮しています。また、NTTグループのAI技術「corevo」を搭載したロボットSotaは観光地へ出向き、外国人観光客向けの観光案内ロボットとして大活躍しています。

こうしたロボットたちがわれわれ人間と自然に会話するためにも、音声認識の技術は必要不可欠なものだといえます。

biznewsイメージ1

音声認識の活用を取り巻く重要キーワード

上記の例にあるような音声認識を活用したサービスを実現するには、人の話し言葉(音声)を聞き取り、その内容を理解したうえで、そこから何らかの洞察を引き出すための、いくつかの異なる技術を組み合わせて活用する必要があります。 ここでは、音声認識を活用したサービスを取り巻く重要なキーワードをいくつかご紹介します。

  
音声認識(Auto Speech Recognition) 「音声認識(Auto Speech Recognition」は、音声認識を活用したサービスにおける入り口ともいうべき技術で、人の会話(音声)を聞き取ってテキストデータ化するものです。 逆に、テキストデータを音声化する技術は「音声合成(Speech Synthesis)」と呼ばれます。
自然言語処理(NLP) 「自然言語処理(Natural Language Processing/NLP)」は、人の自然な話し言葉を解釈したり、生成したりする技術です。NLPで「会話」を理解して初めて、そこから何らかの洞察を導き出すという次のステップに進むことができます。
情報要約 「情報要約」はデータから特定の単語やフレーズを抽出し、データに含まれる情報を要約する技術です。人の会話のように構造化されていないデータは、そのままの状態でソフトウェア的に解析するのは効率的ではありません。そこでまずは情報を要約し、要約した情報を分析の鍵とします。
感情認識 「感情認識」は、NLPで解析された情報をもとに話し手の感情を推測する技術です。会話のなかに含まれる単語や声の抑揚などを手掛かりとして、話し手の感情を読み取ります。ユーザとのコミュニケーションを目的としたロボットなどに、この技術がしばしば応用されます。
機械学習(Machine Learning) 人間の子どもが自ら学んで知識を獲得していくのと同じような学習能力を、ソフトウェア的に再現する技術を開発する試みが、近年になって積極的に行われています。これがいわゆる「機械学習」で、人工知能が与えられたデータから自らパターンを見つけ出し、自分自身で学習していくための手法です。 ロボットなどに状況に応じて判断する能力を与えるうえで、機械学習が重要な鍵となります。
深層学習(Deep Learning) 「深層学習」は機械学習の一種で、従来の機械学習よりも更に高度な技術です。人間や動物などの脳神経の動きを模したモデル(ニューラルネット)でデザインされていて、特定の分野においては人間の判断能力をはるかに超えるパフォーマンスを発揮することができます。

コンタクトセンターにおける活用

biznewsイメージ2

音声認識の技術はわれわれの生活の中に着実に浸透しつつありますが、この流れはビジネスの領域においても同じように加速してきています。
なかでも特に積極的な取り組みが見られる領域として、コンタクトセンター業務を挙げることができるでしょう。一般にコンタクトセンターではユーザからの問い合わせに人間のオペレーターが対応しますが、近年になって音声認識を含む人工知能を活用した「AIサポートセンター」が流行の兆しを見せています。コンタクトセンターの業務を支援するために、音声認識の技術を活用しているのです。

NTTソフトウェアの「ForeSight Voice Mining」では、FAQシステム等のナレッジシステムと連携し、音声認識によってお客様の声を理解、適切な回答候補をオペレーター画面にレコメンドします。これにより、応対に不慣れな新人オペレーター等の対応品質の向上を実現します。

また、音声認識の話題からは少し外れますが、ネスレ日本はWebサイトやLINEアプリなどからアクセスできるチャットボット式のコンタクトセンター「ネスレチャットアシスタント」を開設しました。ネスレチャットアシスタントはIBMの人工知能「Watson」を活用したサービスで、ユーザが入力した質問に対して、瞬時に回答を返します。この仕組みに音声入力・音声回答の機能を組み合わせれば、一般的なコンタクトセンターと同じようなサービスを提供できるかもしれません。

チャット式のオンラインサポートを自社サイトなどに採用している企業は少なくありませんが、現状ではオペレーターによる人力で運用されているケースがほとんどだといえるでしょう。今後は人工知能の応用により、この分野に大きな変化が現れてくるかもしれません。

音声認識が情報共有の形を変える

biznewsイメージ3

コンタクトセンター以外では、ホテルやアミューズメント施設などにおけるスタッフ支援の分野で興味深い活用事例が登場してきそうです。

宿泊客とコミュニケーションを取りつつサービスを提供するホテルスタッフにとって、スタッフ間での情報共有は命綱であり、大規模なホテルでは複数のスタッフがインカムを介してやりとりをしながら、ホスピタリティ向上に取り組んでいます。 こうしたスタッフ間のやり取りの履歴をリアルタイムにテキスト化して蓄積し、対話データの分析から潜在的なリスク予測といった洞察を導き出す仕組みが、今後はさまざまな領域において導入されていくのではないでしょうか。

また、蓄積された対応履歴をもとに自動でスタッフ向けマニュアルを生成するソリューションも遠からず登場しそうです。 先にご紹介したチャットボット式コンタクトセンターを応用すれば、深夜時間帯では宿泊客からの電話連絡を人工知能が対応し、ホテルの人件費を抑えることもできそうです。

以上、音声認識を取り巻く最近の状況をご紹介し、近い将来に起こり得ることに思いを馳せてみました。 人工知能、IoT、バーチャルリアリティ......などなど、次々に登場する「最新テクノロジー」の数々に、驚く心がいささか麻痺(まひ)しつつある昨今ですが、ビジネスを、そして生活を便利にする新たなソリューションが登場するのを楽しみに待ちたいところです。


ForSight Voice Mining

BizNewバナー


参考文献


※文中に記載した会社名、製品名などの固有名詞は、一般に該当する会社もしくは組織の商標または登録商標です。
※当ソリューション・製品に関するお問い合わせ、会員登録リンク、は、NTTソフトウェアのお問い合わせ専用ページ(社外サイト:MARKETINGPLATFORM)に遷移します 。(MARKETINGPLATFORMは、株式会社シャノンが提供しているクラウドアプリケーションです)

連載シリーズ
トレンドコラム
著者プロフィール
Bizニュース
Bizニュース
NTTソフトウェア株式会社
ビジネスソリューション事業部