国立研究開発法人産業技術総合研究所は少量の日本語音声データで高性能な感情認識や音声認識を構築可能とする日本語音声基盤モデル「いざなみ」「くしなだ」を公開しました。
2025年3月12日
本成果の一部はNEDOの委託事業「人と共に進化する次世代人工知能に関する技術開発事業」によるものです。
国立研究開発法人 産業技術総合研究所(以下、産総研)はこのたび、日本語音声基盤モデル「いざなみ」「くしなだ」を公開しました。
NEDO AI・ロボット部では「人と共に進化する次世代人工知能に関する技術開発事業」を進めています。当該事業の1テーマであり、産総研が進める「実世界に埋め込まれる人間中心の人工知能技術の研究開発」による研究成果が、このたび公開された日本語音声基盤モデルの一部を構成しています。
-
図提供:産業技術総合研究所
従来、感情認識や音声認識を行うAIを構築するためには長時間の音声データが必要でした。本研究の成果である音声基盤モデル「いざなみ」や「くしなだ」と組み合わせることで、比較的短時間の音声データと当該音声に対する教師ラベルによって高性能な日本語音声AIの構築が可能となりました。
本研究成果は広く活用できる形で公開されており、今後企業および研究・教育機関、等により多様な音声AIが生み出されることが期待されます。
詳細は以下に示す産総研のホームページにて公開されておりますので、ぜひご覧ください。
- ◆産総研ホームページの本研究成果を紹介するページはこちらです。
- 産総研発表URL
- ◆「いざなみ」「くしなだ」はAIモデル公開プラットフォームHugging Faceからダウンロード可能です。
- Hugging Face