株式会社KDDI総合研究所 このページを印刷する

AI分野の最難関国際学会ICML2023に論文が採録

2023年7月20日
株式会社KDDI総合研究所

KDDI総合研究所とイリノイ大学シカゴ校(以下、UIC)Bing Liu教授の研究グループとの共同研究において、継続学習(Continual Learning)に関する論文「Parameter-Level Soft-Masking for Continual Learning」(以下、本論文)が、AI分野の最難関国際学会である「ICML2023(注1)」に採録されました(論文採録率 27.9%:ICML 2023実績、2023年7月25日-7月27日発表予定)。

 

【研究概要】
従来の深層学習モデル(以下、モデル)は、あるデータセットAを一度学習したあとに別のデータセットBを学習すると、最初に学習したデータセットAに対する推定性能が著しく劣化することが知られています。これを「破滅的忘却(Catastrophic Forgetting)(以下、忘却)」といい、モデルを長期間運用する際の問題の一つとなっています。この問題に取り組む研究分野を「継続学習」と呼び、近年盛んに研究が進められています。
継続学習では、一つのデータセットを用いて学習を行うことを一つの「タスク」として、一つのモデルで複数のタスクを継続的に学習します。過去に学習したタスクの忘却を防ぎつつ、新しく学習するタスクについては過去のタスクとの類似性を利用してモデルの性能向上を図る「知識転移(Knowledge Transfer)」との両立が求められます。

 

本論文では、既存手法の多くが忘却抑制を優先した結果として知識転移を大きく損なっていること、多くのタスクを学習した際に新しいタスクに対する表現能力が徐々に低下することの二つを問題点として指摘しました。さらに、モデルサイズを拡張せず常に固定サイズのままで、忘却抑制、知識転移、表現能力の維持の三つを可能にする手法を提案しています。
提案手法ではまず、各タスクを学習した際にパラメータごとの重要度を算出し、モデルとは別に保存します。次に、新たなタスクを学習する際には、保存されたパラメータの重要度を参照して、過去のタスクにとって重要なパラメータについては、その更新幅を小さくするように制御する仕組み="soft-masking"を導入しました。この仕組みにより、過去のタスクに対する忘却が効果的に抑えられる一方で、類似したタスク間ではパラメータが自然に共有・更新されるため、知識転移の促進も期待されます。また、既存手法では、過去のタスクに重要なパラメータが固定されてしまうため、新たなタスクの学習を行う度に使用できるパラメータが減り、モデル全体の表現能力が徐々に低下していました。一方、提案手法では重要なパラメータの更新幅を小さくするものの、更新自体は許容することでモデル全体を学習可能に保つため、新たなタスクに対する表現能力が維持されます。評価実験を通じて、提案手法による忘却抑制が知識転移を阻害せずバランス良く両立できること、多くのタスクを学習しても表現能力を維持できることを報告し、複数のデータセットで既存手法を超えた最高性能(注2)を発揮することを示しました。

 

KDDI総合研究所は、AIが自律的に環境変化に適応して成長するAIを「成長可能AI」と定義し研究を進めています。本論文は固定サイズの単一モデルが多くのタスクに対しても忘却抑制と知識転移、表現能力の維持とをバランス良く実現したという点で、「成長可能AI」の技術確立に向け重要な意義を持つものです。
なお、今回の成果は、KDDI総合研究所が進める海外最先端の研究者との共同プロジェクトによるものです。

 

海外最先端の研究者との共同研究プロジェクトの開始(2020年10月26日報道発表)

 

【原著論文情報】
Tatsuya Konishi (KDDI総合研究所), Mori Kurokawa (KDDI総合研究所), Chihiro Ono (KDDI総合研究所), Zixuan Ke (UIC), Gyuhak Kim (UIC), Bing Liu (UIC), Parameter-Level Soft-Masking for Continual Learning, In Proceedings of ICML, 2023.  
Parameter-Level Soft-Masking for Continual Learning

 

KDDIとKDDI総合研究所は、2030年を見据えた次世代社会構想「KDDI Accelerate 5.0」を策定し、その具体化に向け、イノベーションを生むためのエコシステムの醸成に必要と考えられる「将来像」と「テクノロジー」の両面についてBeyond 5G/6Gホワイトペーパーにまとめました。両社は新たなライフスタイルの実現を目指し、7つのテクノロジーとそれらが密接に連携するオーケストレーション技術の研究開発を推進します。今回の成果は7つのテクノロジーの中の「AI」に該当します。
KDDI総合研究所は、2022年4月にHuman-Centered AI研究所を設立し、人とAIが共生し、インタラクションを通じて共に成長する技術の研究開発を推進しています。今後、本論文の研究成果を基に、AIが自律的に環境変化に適応して成長する「成長可能AI」の技術確立に向けた取り組みを進めていきます。

 

 

 

(注1)The Fortieth International Conference on Machine Learning

(注2)AIによる画像認識性能の評価で一般的に利用されるデータセット(CIFAR100やImageNetなど)を複数タスク(10、20 または100)に分割したものを継続学習し評価しました。下記の表では、全タスクの平均正解率(Accuracy)を示しています。
12の既存手法(下記の表のNCLからEWCまで)に対し、提案手法=SPGが多くのデータセットで最高性能を発揮することを確認しました。特に、ImageNetを100タスクに分割した最も難しいデータセット=I-100では既存手法の最高性能を+6.2%と大きく上回り、多くのタスクを学習しても表現能力が維持されるという提案手法の有用性を示しました。

 

 

 

・MTLとONEは継続学習の問題設定(=単一モデルで複数タスクを逐次学習していく)に従う手法ではなく、参考値として記載。
・EWC-GIとSPG-FIは提案手法の派生形として、参考値として記載。

 

※ニュースリリースに記載された情報は、発表日現在のものです。 商品・サービスの料金、サービス内容・仕様、お問い合わせ先などの情報は予告なしに変更されることがありますので、あらかじめご了承ください。