本文へジャンプ

成果報告書詳細
管理番号20190000000103
タイトル2017年度―2018年度成果報告書 次世代人工知能・ロボット中核技術開発 次世代人工知能技術分野 契約書関連業務における抜本的バックオフィス改革人工知能の調査研究
公開日2019/6/21
報告書年度2017 - 2018
委託先名株式会社シナモン
プロジェクト番号P15009
部署名ロボット・AI部
和文要約件名:2017年度―2018年度成果報告書 「次世代人工知能・ロボット中核技術開発/次世代人工知能技術分野/契約書関連業務における抜本的バックオフィス改革人工知能の調査研究」

本システムによる各タグの最終的な抽出精度は、約80%となった。本システム自体は、業務サポートの位置付けなので、約80%という精度自体は業務上問題ない。ただし、今後の精度改善に向けては、学習データ自体が手に入りにくいため、BiLSTMの学習において擬似的な条文の生成などにより、ある程度の表記揺れなども含めて頑健な学習を行えるようにする必要がある。
また、MLPに対しては、TF-IDFを利用することにより、かなり専門用語に寄った数値化を行えているが、BiLSTM においては一般的な辞書を利用しており法律的な言葉を特徴的なものとして扱うメカニズムが存在していない。この点の改良が精度を引き上げる可能性があると予想している。
英文要約Title: Research and development on an AI engine to increase the productivity of back office contract review work (FY2017-2018) Final Report

The final extraction accuracy of each tag by this system was about 80%. Since this system itself is the position of business support, accuracy of about 80% itself does not cause problems in business. However, in order to improve accuracy in the future, it is difficult to obtain the learning data itself, so that BiLSTM learning enables robust learning including some notation fluctuation due to generation of pseudo-clauses etc. There is a need.
Also, for MLP, by using TF-IDF, it is possible to digitize considerably in technical terms, but BiLSTM uses a general dictionary and features legal words There is no mechanism to handle as things. We anticipate that this improvement can raise the accuracy.
ダウンロード成果報告書データベース(ユーザ登録必須)から、ダウンロードしてください。

▲トップに戻る