成果報告書詳細
管理番号20120000000869
タイトル平成20年度-平成23年度成果報告書
「次世代ロボット知能化技術開発プロジェクト コミュニケーション知能(社会・生活分野)の開発 公共空間における情報支援知能モジュール群の開発」
公開日2013/4/10
報告書年度2008 - 2011
委託先名株式会社国際電気通信基礎技術研究所 株式会社イーガー オムロン株式会社、三菱重工業株式会社
プロジェクト番号P08013
部署名技術開発推進部
和文要約 件名:平成20年度-平成23年度 成果報告書 次世代ロボット知能化技術開発プロジェクト「コミュニケーション知能(社会・生活分野)の開発 公共空間における情報支援知能モジュール群の開発」
 本プロジェクトの目的は、状況が変わりやすい環境下でロボットが自律的にタスクを遂行するために必要な技術を開発すること、および、その普及である。一般の生活空間や多品種少量生産の製造現場などにおいては、頻繁に状況が変化する。このため人間共存環境で活動する次世代ロボットの実用化には、ロボットのタスク遂行能力の環境変化に対する頑健性が求められる。そこで、上述の目的を達成するために、以下に示すコミュニケーション知能モジュール群を開発し、環境に適応した動作が可能なロボットをこれらのモジュールを用いることによって比較的容易に構築できることを確認した。
 開発したコミュニケーション知能モジュール群は、コミュニケーションに必須の「見る」「聞く」「話す」「ジェスチャする」機能の基本を担う、環境状況対象認識知能、対話支援知能、対話制御知能、対話管理知能に大別される。環境状況対象認識知能モジュール群は、状況認識モジュールと人物追跡モジュール、対話支援知能モジュール群は、音声認識モジュール、発話区間推定モジュール、音声合成モジュール、顔動作推定モジュール、発話意図認識モジュール、動作生成モジュール、対話制御知能モジュール群は、対話コンテンツ管理モジュール、対話フロー制御モジュール、対話例外処理モジュール、対話管理知能モジュール群は、個人同定モジュール、対話履歴管理モジュールから構成されており、合計で13モジュール存在する。これらの組み合わせによって、人に情報提供を行う様々な場面に対応でき、さらに、他分野の知能ロボットにも利用可能である。各モジュールは、オープンソースのドライバ部分とバイナリ提供部分からなり、すべてRTコンポーネントとして実現することで、容易に再利用可能とした。オープンソースのドライバ部分のライセンスは、修正BSDライセンスを採用し、用途に応じて自由な改変が可能となっている。RTコンポーネント化されたモジュールは、リファンスモデルマニュアル(モジュールの利用説明書)を整備した。開発したすべてのモジュールは、再利用技術研究センターに登録し動作検証を受け、特定ハードウェアに依存しない汎用性の高いモジュールであることを確認した。
 一般的な騒がしさであると想定される商業施設(65dBA以上の騒音環境)で、「巡回・見守り・道案内」「商品説明」、「受付・情報提供」の3種類のタスクが、開発したモジュールの組み合わせによって適切に動作することを実験により検証した。具体的には、大阪市にある商業施設内の店舗で「商品説明タスク」と「道案内タスク」、京都府相楽群の商業施設において「受付・道案内タスク」と「商品説明タスク」を行う実験を実施した。各タスクには、人を見つけ、個人を同定し、履歴に応じて発話内容を変化させ、返答を聞き、動作を伴って分かりやすく情報を提供する作業が含まれている。実験の結果、タスク達成率70%以上、アンケート調査によるユーザ満足率70%以上であることを確認した。
英文要約Development topic: "Intelligent Robot Technology Software Project / Development of Intelligent Communication RT Modules for Providing Informational Services in Public Environments"(FY2008-FY2011) Final Report
This projects aims for a broader and more practical use of next generation robots in human-coexistent environments. In order to promote technological development and spreading of robots which can act autonomously and precisely in environments where conditions may easily change, such as living spaces and production sites, we developed communication intelligence modules which are robust for use in such environments.
The developed communication intelligence modules include basic functions of "see", "listen", "talk" and "gesture" which are indispensable for realizing communication, and are subdivided in ambient situation recognition intelligence, dialogue support intelligence, dialogue control intelligence and dialogue management intelligence.
Based on the combination of these modules, it is able to deal with several situations of information provision for people. Furthermore, these modules can easily be combined with the intelligence robots of other fields.
A total of 13 modules were developed: ambient situation recognition intelligence modules (situation recognition module, human tracking module), dialogue support intelligence modules (speech recognition module, utterance interval detection module, speech synthesis module, face parameter detection module, speech act recognition module, motion generation module), dialogue control intelligence modules (dialogue contents management module, dialogue flow control module, dialogue exception processing module), and dialogue management intelligence modules (person identification module, dialogue history management module).
Each module is composed by an open source-provided driver part and a binary-provided part. All modules were implemented as RT components, so that they are easily reusable by other parts. The license of the open source driver part can be freely modified according to the use, by adopting the revision BSD license. Reference manuals were also prepared for the RT component modules. All developed modules were registered in and inspected by the reuse technology research center, indicating a hardware-independent high usability of the modules.
The developed modules were combined and evaluated through three types of tasks ("patrol and guidance", "commodity explanation" and "reception and information provision") in commercial establishments like supermarkets and shopping malls, under background noises above 65 dBA. In each of the tasks, the person is found, identified, the utterance contents are modified according to the dialogue history, the answer is recognized, and information is provided along with appropriate gestures. The combined modules worked properly for all tasks by using a humanoid robot in commercial establishments. The experiments were realized at a store in ATC Osaka ("commodity explanation" and "guidance" tasks), and at Keihanna APITA Kyoto ("reception", "guidance" and "commodity explanation" tasks). The task achievement rates and the user's satisfaction grades were both higher than 70%.
ダウンロード成果報告書データベース(ユーザ登録必須)から、ダウンロードしてください。

▲トップに戻る