話者ごとの音声分析に最適な多指向性マイクロフォン用開発キットを販売開始
~世界初!12方向の発話を瞬時に分離し集音、自動追従機能も搭載~
2020年11月11日
NTTアドバンステクノロジ株式会社
NTTテクノクロス株式会社
NTTアドバンステクノロジ株式会社(以下:NTT-AT、本社:神奈川県川崎市、代表取締役社長:木村丈治)とNTTテクノクロス株式会社(以下:NTT-TX、本社:東京都港区、代表取締役社長:串間和彦)は、NTTメディアインテリジェンス研究所の技術を活用して開発した世界初となる多指向性小型マイクロフォンモジュール(Voice Compass Direction Module)とアプリケーションの開発に必要な開発者用マニュアルをセットにした「Voice Compass Developer Kit」(以下:本製品)を、2020年12月上旬から販売します。
多指向性小型マイクロフォンモジュールは、最大12方向の音を個別に分離して集音する機能および話者の方向を自動で推定し位置変化に合わせて集音する自動追従機能を有することから、これらの機能を会議議事録システムに搭載することで、これまでは困難であった話者を分離・識別した音声認識が可能となるため、議事録作成業務の効率化が図れます。
本製品は、11月12日(木)~13日(金)に開催される「コールセンター/CRMデモ&コンファレンス2020 in 東京」に出展予定です。
背景
企業やそこで働く人々にとって、日常的に行われる会議の議事録作成は、大きな負担となっています。その手助けとなる自動議事録作成ツールは、多くの企業が開発し販売しています。しかし、一般的な置き型全指向性マイクを使用し複数人の会話を収録すると、話者の識別が困難なため、音声の認識率に悪影響をおよぼします。また、一人ひとりにマイクを用意すると、装着の煩わしさやコストの増加などの問題が発生します。
それらの問題を解決すべく生まれたのが本製品です。1台のマイクデバイスで最大12方向の高度な話者分離を実現し、正確かつ手軽な自動議事録作成に大きく貢献します。
本製品の特長
本製品は、NTTメディアインテリジェンス研究所で研究開発されたIM-ASTER*1技術をベースにしたマイクデバイス(NTT-ATが商品開発)とIM-ASTERライブラリ(NTT-TXが提供)、および開発者用マニュアルをセットで提供する製品です。
〔主な特長〕
●IM-ASTER技術により、最大12方向を個別に分離*2して集音を可能とする多指向性小型マイクロフォンモジュール
●話者の方向を自動で推定し、位置変化に合わせて集音する自動追従機能
●高品質な雑音抑圧機能
●8個のMEMS*3マイクとIM-ASTER技術によるソフトウェア処理で指向性をより鋭く形成
●約60gの軽量・小型のため持ち運びが簡単
●マイクデバイスはUSBバスパワー方式による給電
●12方向分離を商用化した製品は世界初*4
提供範囲
本製品では、マイクデバイスで集音した音声を、ソフトウェアで処理することにより音声分離を実現します。ソフトウェアはライブラリ形態での提供となります。
製品名 | 提供物 |
Voice Compass Developer Kit | Voice Compass Direction Module(マイクデバイス+IM-ASTERライブラリ)および開発者用マニュアル |
マイクデバイス
マイク素子数 | 8個 |
周波数特性 | 60~7,000Hz |
消費電流 | 150mA以下 |
電源 | USBバスパワー(DC5V) |
外形寸法 | H14.5×φ64.7mm |
質量 | 約61g(コード除く) |
対応OS | IM-ASTERライブラリの動作要件に準ずる |
付属品 | USB(A-miniB)コード(約1m) |
IM-ASTERライブラリ
提供形態 | ・64bit Windows DLL形式ライブラリ(Windows) ・共有ライブラリ(*.so)形式ライブラリ(Linux) |
|
機能 | ・方向別音声分離(最大12方向、自動追従時は最大6方向、集音範囲は約60°) ・自動追従機能(最大±30°の範囲) |
|
動作要件 | ||
Windows用 | CPU:Intel Core i5以上のCPU OS:Windows 10 64bit |
|
Ubuntu用 | CPU:Quad-Core Intel Atom E3845 1.91GHz以上 OS:Ubuntu 18.04 LTS |
|
ARM Linux用 | CPU:Cortex-Aシリーズ1.4GHz以上、NEON命令利用可 OS:Linux OS (ARM 32bit) |
開発者用マニュアル
・インターフェース仕様書
・サンプルプログラム
販売開始時期
2020年12月上旬
販売元
NTT-AT、NTT-TX
価格・販売
価格や販売に関する詳細につきましてはお問い合わせ下さい。
展示会のお知らせ
次の展示会に出展いたします。
コールセンター/CRM デモ&コンファレンス2020 in 東京
・開催期間:2020年11月12日(木)~13日(金)
・開催場所:池袋サンシャインシティ・文化会館
・出展内容:https://www.ntt-at.co.jp/eventseminar/event/2020/detail/e_20201112/
*1 IM:Intelligent Microphone
ASTER:Anti-distortion Suppression of noise with mask-based TransfER function estimation
*2 12方向から集音しますが、各方向の集音範囲は概ね60°程度となります。
*3 MEMS:Micro Electro Mechanical Systems(微小電気機械システム)
*4 2020年10月現在 NTT-AT調べ
※記載された会社名及び製品名は、各社の商標または登録商標です。