イベントレポート:NTTテクノクロスフェア 2017(後編)
2017年9月21日「NTTテクノクロスフェア 2017」をベルサール東京・日本橋にて開催しました。後編ではAIが主役となったセミナープログラムの内容を中心に紹介していきます。
特集記事
- 2017年11月28日公開
ビジネスにおけるAI活用の最新事情~要素技術から活用ソリューションまで
2017年9月21日、NTTテクノクロスでは「Crossing of Technologies ―デジタルイノベーションを体感―」をコンセプトとし、プライベートイベント「NTTテクノクロスフェア 2017」をベルサール東京・日本橋にて開催しました。今回の記事では、AI、IoTなどの最先端技術の利用がもたらすベネフィットを「これからの未来社会」として紹介した、同イベントのセミナープログラム及び展示の内容を2回に分けてレポート。後編ではAIが主役となったセミナープログラムの内容を中心に紹介していきます。
【テクニカルセッション】「インタラクティブな知能」 ~AIと人間が役割分担して協調することで、より高度な問題解決を
テクニカルセッションには、国立情報学研究所及び総合研究大学院大学の教授を務め、昨年6月には一般社団法人人工知能学会の会長に就任した山田誠二氏が登壇。「インタラクティブな知能」とはいったい何なのか、その背景と必然性、必要な要素技術、研究の現状について語っていただきました。
現在の第3次AIブームの特徴と歴史
AIの簡単な歴史として、以下があげられます。
- 1)第1次AIブーム(1960年代)
・ダートマス会議、パーセプトロン - 2)第2次AIブーム(1980年代)
・記号処理・論理、エキスパートシステム - 3)第3次AIブーム(2010年代)
・ディープラーニング、大手IT企業での応用
現在の第3次AIブームに関しては、第1次ブームで礎が築かれたニューラルネットワークが復権を遂げるとともに、ディープラーニングが重要な役割を果たしています。また、過去のブームでは基礎的な研究が主体だったのに対して、第3次ブームの特徴としては、主に米国大手IT企業が中心に牽引していること、さらに、ビッグデータが使えるようになったこと、計算機パワーが高速かつ安価になったことも重要なポイントであると山田氏は述べました。
山田氏は第3次ブームの主役といえるディープラーニングについて、局所的な特徴を取り出す畳み込みニューラルネットワーク(CNN)層と重要ではない情報を落とすプーリング層という2つのペアを何層にも重ねているのが典型的な構造だと説明。そのうえで、1980年代にNHK放送技術研究所(当時)の福島邦彦氏が提唱し、世界的にもすでに認知されていたネオコグニトロンこそが、畳み込みニューラルネットワークの発想のもとになっているとし、「今のディープラーニングの基本的な構造は40年前に日本人研究者が作ったものであり、それは誇りに思っていい」と語りました。
ネオコグニトロン、そして、畳み込みニューラルネットワークは脳の視覚野の細胞モデルからインスパイアされて提唱されたものだからこそ、最も成功した分野は画像認識や分類だとしつつ、「ただし、ディープラーニングの見方と人間の見方はまったく違う」と強調。ディープラーニングを騙す画像例を紹介しながら、人間とディープラーニングの認識には違いがあるため、たとえば、顔認証などでもその見方の違いに着目することで、簡単に騙せるようになる可能もあると説明しました。
なぜ、AIは人と協調すべきなのか
ここで山田氏は、今回のテーマである「人間と協調するAI」に取り組むべき根拠として、以下を挙げました。
- 1)人間の高い知的能力
まず、「AIにはまだできないことが多くある」と示し、たとえば、常識的な推論が不得意な典型例としては、昨年にマイクロソフトの学習型AIチャットボット「Tay」が公開直後にヘイトスピーチを連発するようになってしまい、サービス停止を余儀なくされるという事態がありました。本来は発言から除外すべきキーワード集などを入れておくべきなのですが、数え上げられないほどあり、入力しきれないわけです。
また、自動運転のテスト走行中に生じたテスラ車の事故を例に挙げ、屋外での走行中にはカメラに対する日光の影響など、どのようなことが起こるかを事前に書き尽くせないという基本的な問題があると説明。物理世界でAIに完全依存するような使い方をするには、まだまだ注意が必要なレベルだと語りました。
次に、山田氏はAIと人間の知的能力の比較については、各々に優れている分野があるのみならず、全般的には歴然とした能力差があると指摘。囲碁や将棋、チェスなどでは人を圧倒するような能力を発揮するものの、基本的にはルールどおりにしか局面は動きません。それ以外の一般的な学習や推論、物理操作といった分野については、まだまだ人間のほうが優れているというわけです。
- 2)AIが使われる環境には人がいる
火星探査などは例外として、通常は人が近くにいて、人に助けを求められる環境で稼働するのですから、人が簡単に解けるような問題は人に任せて、AIが得意な問題はAIに任せることが、自然であり、実現性も高いと考えられるわけです。
これからのAI ⇒ インタラクティブな知能
山田氏は、このような背景から、人間とAIが得意分野を補い合い、役割分担・協力して問題解決するシステムの実現に取り組んでおり、それによって、「人間単体の能力を超え、AI単体能力よりもはるかに超える」ことを目指したいと強調。そのためには、両者の間でいかに信頼関係を築けるかという点に注目していると語りました。たとえば、自動運転では、AIの能力レベルを過信しても、過小評価してもいけないわけで、能力を適正に評価することが前提になると語りました。
インタラクティブ知能の実現のために
そのほか、山田氏はヒューマンインターフェースのデザインにおいては、人間は不合理な行動もよく行うゆえに、認知バイアスも必要だと説明。また、機械学習においては、人間が理解・適応しやすいような学習アルゴリズムを作ることが大事だと語りました。
最後に、山田氏は自らが実際に取り組んでいる「Interactive AI研究プロジェクト」を紹介しました。実際に、会津の若松城を訪ねる日帰りツアーの商品を推薦する擬人化エージェントによるヒューマンエージェントインタラクションのデモを披露。顧客がエージェントに対して「知識がある」と感じ、また、たとえばキュートなしぐさによって「感情の状態が上がる」という2つの条件が揃うことで、顧客との信頼関係を高められ、結果として、購買意欲が向上するというメカニズムが実験でも証明されたと説明しました。
【スペシャルセッション】「AIから超AIへ!」 ~理論から実践へのアプローチではなく、実践から理論へのアプローチへ
スペシャルセッションには、メディアアーティストであるとともに、筑波大学では学長補佐及び図書館情報メディア系助教、デジタルネイチャー研究室主宰を務め、ベンチャー企業Pixie Dust Technologies.Inc.のCEOとしても活動する落合陽一氏が登壇。波動合成/計測や計算機造形及び深層学習の検討を行い、現在は「超AI」プロジェクトにも取り組む中で見出された実践から理論へというアプローチについて語っていただきました。
作りたいものを現実化するために数学的な問題を解く
落合氏は、現在の主な取り組みとして、先頃、JST(国立研究開発法人 科学技術振興機構)の平成29年度戦略的創造研究推進事業(CREST)において、自身の研究提案が採択されたことで、今後5年にわたって実施される「超AI」プロジェクトの研究代表を務めているとしつつ、これまでのキャリアについて語りました。
主に音響や光などの波動を用いて、コンピュータ・グラフィックスの物理化や視覚的・触覚的な作品作りに取り組む落合氏は、その研究成果を世界的なコンピュータ・グラフィックス学会・国際会議・展覧会である「SIGGRAPH」で毎年発表しているほか、メディアアーティストとして芸術祭などの様々な場で最先端の科学技術とアートを融合させた作品展示を手がけており、その一部として、次のような作品をご紹介いただきました。
●コロイドディスプレイ
シャボン膜を超音波で微細に振動して、光を通過させずに、プロジェクターからの映像投射を行う。
●レビトロープ
浮遊する彫刻をイメージとし、空中に静止浮遊した6個のボールが緩やかに公転する。
落合氏はこうした作品を披露しつつ、最適化計算を行ったり、機械学習で構造を解析したりというアプローチを進めていくと、アクチュエータをいかに作るか、もしくは、どうやって人間の視聴覚をより新しいアプローチで開拓していくかということにつながっていくと語りました。また、デジタルパブリケーションしたものを現実世界で自由な形に動かせるようにすることも非常に魅力的な問題だと考えており、自由変形可能な構造を3次元的に定義するかといった数学的な問題を解いて、その構造をディープラーニングすることで、人間が理論的に解いたものを自由に機械が作れるかという問題が現在のマイブームだと述べました。
今後はEnd to Endによる解決、実践から理論へというアプローチが重要に
落合氏は、要素技術をいかに現実社会の問題解決につなげるかを考えるにあたっては、従来の人間による問題の発見と解決を起点としたプロダクションのあり方よりも、End to Endでのアプローチが有効だと感じていると語りました。つまり、問題とデータの発見が同時に行われ、それをディープラーニングにかけることで、とりあえず何か触れるもの、使えるものが作り出されて、それをマーケットへ投げるというアプローチです。
冒頭で紹介したCRESTの超AIプロジェクトに関しても、「計算機によって多様性を実現する社会に向けた超AI基盤に基づく空間視聴触覚技術の社会実装」がそもそものテーマだとし、高齢化社会では視聴覚や身体能力に関して極端なダイバーシティが生じるとともに、全員が同じではなく、人によって異なる障害が起こることが問題だと説明。つまり、個別にプログラムを書き、問題設定を行うのではなく、End to EndのAIによって解いていく、人の多様性をAIテクノロジーで支えることが非常に重要だと落合氏は考えます。
また、高齢化社会というものは昔から負のイメージで語られることが多かったものの、テクニカルには解ける問題だともいえます。つまり、目で見えること、耳で聞こえること、身体を動かすことに関して生じうる問題は普遍的なものであり、かつ、テクノロジーが最も得意な分野だと落合氏は指摘したうえで、そのアプローチの一例を紹介しました。
●Telewheel
自動運転/半自動運転/VR介助運転を切り替えられる車椅子です。
たとえば、老人ホームでは車椅子を押すだけではなく、ドアを開けたり、トイレの便座に乗せたりする必要があるため、1人の介助を2人で行わなければならないという問題がありますが、この車椅子によって、ワンオペレーションが可能になります。しかも、こうした現場では慢性的な人手不足に悩まされているため、AIによって人員が削減されるのではなく、本当の課題改善につながるというわけです。
落合氏は、イルカがテレコミニケーションと空間認識を同一の波動を用いて行っており、音響をベースとした収束・非収束、もしくは3次元のホログラム的な世界認識をしつつ、それを仲間と共有しているという話題にも触れました。人間が主に行っているような可視光をベースにした空間の把握だけではなく、こうした別の手法による3次元認識についても論じていくことが、今後の超AI基盤への取り組みにおいては重要だと語りました。
さらに落合氏は、今後は人工物と自然物の区別がつかない世界、つまり、デジタルネイチャーが主な対象となるとともに、前述のEnd to EndのAIによって、ディープラーニングなどで解決を図るという手法が主体となると強調。そういう世界においては、解決の過程を人間が理解することはかなわず、抽象化などを行う以前に解決されてしまうものだと語り、従来の自然を観察し、人間が理論化を行うことで問題の解決を図ってきた手法は、華厳宗で語られている「理事無碍(りじむげ)」のようなものであり、それに対して、End to EndのAIは「事事無碍(じじむげ)」だととらえられると述べました。
そのうえで、事事無碍のわかりやすい例として、End to End AIによるブランド服のデザインを挙げ、通常のデザイン工程とは逆に、膨大なファッションショーのデータをもとに、ディープラーニングによってイメージ絵を生成し、パタンナーに型紙起こしを依頼することで、実際の服に仕上げるという取り組みを紹介。実際に本物のデザイナーが作った服と区別がつかないものが出来上がったとし、「天才的なデザイナーが数千着の服を作成してさえいれば、そのブランドはほぼ無限に新たなデザインスケッチを生み出せる」と語りました。
最後に落合氏は、松尾芭蕉の「古池や蛙飛び込む水の音」という俳句もまた、事事無碍を明確に表したものだと語り、エンドポイントの言葉のみで構成されているにもかかわらず、(外国人には理解が難しいものの)日本人であればそこから情景を思い浮かべることができると説明し、講演を締め括りました。
【パネルディスカッション】「AIとは何者か?」 ~AIと共存する未来社会にむけて何をすべきか
山田誠二氏によるスペシャルセッション、落合陽一氏によるテクニカルセッションに続くパネルディスカッションでは、両氏に加えて、日本電信電話株式会社 メディアインテリジェンス研究所 所長の小澤 英昭氏、そして、モデレータとして東洋経済オンライン 編集長の山田俊浩氏も参加。「AIとは何者か?ーAIと共存する未来社会にむけて何をすべきかー」と題し、以下のような内容について熱い議論が交わされました。
AIが活躍する領域
まず、NTTテクノクロスの最新音声合成技術が用いられたタレント黒柳徹子さんのアンドロイド「totto」を例に、こうした特定キャラクターの人格や著名芸術家による作品づくりなどをAIで模倣する場合には、100年後もオリジナルのままという不変の価値を提供することも、トレンドに合わせた変化で賞味期限を延ばすことも可能というメリットがあるといった議論が行われました。また、AIの本質的な役割としては、問題として曖昧なところを見えるようにする、何らかの数式に落とすことだとしたうえで、一般にAIが得意だとされている領域以外にも活躍できる場は多いとも語られました。たとえば、クリエイティブな仕事はAIに向かないとされるが、「組み合わせを作って、それを評価する」と定義すれば、その繰り返しでカバーできる範囲は、むしろAIのほうが有利ではないか、また、いわゆる「説明責任」などもAIの得意な領域ではないかといった話題が上りました。
ヒトとAIはどう共存、協働するのか
人とAIが協働していく障壁となりうるものとして、個人情報保護などの要因、AIへの恐れなどが挙げられました。その典型として、世間には「AIによっていろんな情報が1箇所に集められている」といったイメージもあるとしたうえで、IoTと同様に、AIが個々のヒトやモノに存在し、必要な情報を必要なときに加工した状態でコミュニケーションするようなあり方が求められていくのではないかという意見も出されました。法制度の整備も必要かもしれないが、まずは社会のコンセンサスを得ていくような取り組みを行っていくべきだと語られました。
AIをビジネスにいかすために
AIの導入によって、コスト削減を図るのではなく、新たな付加価値をいかに作り出すか、社会の困難な問題をいかに解決するかが最も重要だとしたうえで、人間の代わりになると考えられがちだが、むしろ、新たな仕事が増え、また、新たな人材が必要になることを見逃してはいけないといった議論が行われました。AIが出した結果を見ながら日々チューニングを行ったり、どういう問題に対してどのようにAIを適用すべきかを考えるといったAIリテラシーを持ったエンジニアが今後重要となるため、企業や大学などは人材確保や教育のあり方を変えていく必要もあると語られました。
【ミニセミナー】AI時代のエンタープライズ・アーキテクチャ ~企業のAI活用入門編
会場ではAIからセキュリティから、IoTやブロックチェーンの活用事例など、様々な分野を扱ったミニセミナーも開催。「AI時代のエンタープライズ・アーキテクチャ~企業のAI活用入門編」と題したミニセミナーでは、昨今のAIを要素分解すると「認識」「判断」「データ処理」に分けられるとし、各々を詳しく解説したうえで、AI時代のIT戦略を考えるポイントを紹介。ビジネスの視点では、従来はヒトがやっていた「認識」と「判断」の一部分を肩代わりさせることによって、効果が大きそうな業務プロセスを見つけることが重要。そして、データの視点としては、従来はヒトがやっていた「認識」と「判断」を学習させるためのデータを取り揃えるために、IoTや社内に散在しているデータを集めることが必要だと提案しました。
【展示エリア】顧客接点におけるAI活用の"現在"と"近未来"を示す
コンタクトセンター向け音声マイニングシステムの最新テクノロジー
そのほか、展示エリアでもAI関連のソリューションが数多く展示されていました。
カスタマー・エクスペリエンス
ForeSight Voice Mining
AIの活用で顧客の生の声を分析し、営業成績の良いオペレーターの優良トーク、あるいはクレームなどを自動的に抽出するといった機能により、企業の経営課題を解決するソリューション。NTT研究所の最新の音声認識技術、音声マイニング技術を導入し、大量の通話をテキスト化、統計処理する、オールインワンの音声ビッグデータ・ソリューション。
SpeechRec
NTT研究所で開発された最先端の音声認識エンジンを搭載した、多様な環境下で利用可能な高精度音声認識(Automatic Speech Recognition)ソリューション。自由発話対応で、さらに音声認識の妨げになる背景雑音の影響を小さくする雑音適応機能などにより、電話回線経由などで入力された音声も高精度に認識できるという特長を持っており、NTTテクノクロスの音声認識関連技術、さらにはAI関連技術の中核を担っています。
東洋経済ONLINE レポート
東洋経済ONLINEにも、「最先端テクノロジーのベネフィットを体感NTTテクノクロスのデジタルイノベーション」として、イベントレポートが掲載されています。