本文へジャンプ

成果報告書詳細
管理番号20180000000090
タイトル平成27年度ー平成29年度成果報告書 国際研究開発・実証プロジェクト/コファンド事業 日本ーイスラエル研究開発協力事業 光学マイクロフォンを利用したヘッドセットを用いた高騒音下でも使用可能な音声認識システムの研究開発
公開日2018/6/2
報告書年度2015 - 2017
委託先名株式会社フュートレック 株式会社ATR-Trek
プロジェクト番号P14005
部署名IoT推進部
和文要約平成27年度ー平成29年度成果報告書 国際研究開発・実証プロジェクト/コファンド事業 日本ーイスラエル研究開発協力事業「光学マイクロフォンを利用したヘッドセットを用いた高騒音下でも使用可能な音声認識システムの研究開発」

音声認識技術は、近年急速に応用が広がり有用なユーザーインターフェース(UI)技術として認知されてきた一方、騒音という外的要因に左右されやすいという側面があり、UIとしての汎用性が損なわれるケースがある。本プロジェクトでは、そういった音声認識の不確実性を補い、汎用入力インターフェースとしての技術的基礎を固めるべく、イスラエルのVocalZoom社(以下、VZ社)との共同開発として高騒音下でも使用可能な音声認識システムの実現を目指してスタートした。開発要素は以下の5つに大別される。1.光学マイクそのものの開発(VZ社担当) 2.光学マイク信号からの音声区間・ピッチ抽出手法の開発 3.音声区間・ピッチ情報を用いた雑音抑圧手法の開発 4.ユーザビリティーに配慮したヘッドセット実装 5.上記実装に最適化した音声認識システムの開発 開発は上記開発要素を組み合わせた上で、二つのフェーズに分けて実施した。フェーズ1(有線ヘッドセット開発)の目的と結果: 1-1 デバイスの基本特性の確認:基本的な諸特性を満たしていることの確認。 1-2 実使用環境での評価:基本的な外乱条件下で、実使用可能レベルにあることの確認。 1-3 雑音抑圧アルゴリズムの実装:DNN学習によるアルゴリズムを開発し、既存の音響マイクを用いた雑音抑圧特性を凌駕する特性を確認。フェーズ2(Bluetoothヘッドセット開発)の目的と結果: 2-1 Bluetoothでの通信の実現:音声+光信号を1chのBTプロファイルで損失なく伝送できるアルゴリズムを開発し、実時間動作を確認。 2-2 バッテリーオペレーションの実現:想定する動作モードで6時間の動作を確認。 2-3 雑音抑圧アルゴリズムの開発:1-3と2-1を組み合わせた雑音抑圧アルゴリズムを開発。 2-4 音声認識システムの開発と評価:100dBAを超える高騒音下において、50単語語彙で95%の認識率を確認。本研究では、小語彙のコマンド&コントロール系では実用レベルにあることが確認できたが、大語彙で実用レベルに上げることが今後の課題である。
英文要約Title: An ASR (Automatic Speech Recognition) with optical microphone based headset for improved speech recognition under high noise environment (FY2015-2017) Final Report

Automatic Speech Recognition (ASR) technology has been well accepted these days, and recognized as one of the most useful User Interface for coming era. While this being said, it is true that surrounding noise sometimes jeopardizes ASR’s position as a universal interface. This project was started in order to overcome this weak point of ASR by working with VocalZoom Systems (VZ) in Israel, which was developing a unique optical device sensing the vibration of human skin. Development items can be classified into the following five categories: 1. Development of optical device (done by VZ) 2. Development of Voice Activity Detection (VAD) and pitch information detection algorithm from the signal of optical device 3. Development of Noise Reduction (NR) algorithm by utilizing the VAD and pitch information 4. Development of head set 5. Development of optimized ASR system Development has been performed in two phases: development of wired headset and development of wireless (i.e., Bluetooth) headset. During the first phase (phase 1 -wired headset-), the followings were confirmed. 1-1. Basic specification of the device provided by VZ meets the target. 1-2. Phase 1 head set works under specified environments. 1-3. Implementation of the NR algorithm into the head set. NR algorithm using DNN learning were implemented and confirmed to perform better than the best acoustic mic. During the second phase (phase 2 -Bluetooth headset-), the followings were confirmed 2-1. Both optical signal and acoustic signal were mixed and transferred through Hands Free Profile (HFP: 1 channel BT profile) and separated after transfer without quality loss. 2-2. Battery operation was confirmed. 2-3. Development of NR algorithm combining 1-3 and 2-1. 2-4. Development and evaluation of speech recognition system. Even under 100dBA noise environment, the proposed ASR system showed the accuracy of 95% for command & control task. Improvement of the system to expand vocabulary size of ASR will be future work.
ダウンロード成果報告書データベース(ユーザ登録必須)から、ダウンロードしてください。

▲トップに戻る