慶應義塾大学 教授 青木 義満 先生に執筆いただきました。アノテーション作業を効率化するための、Active Learning研究の取り組みについて解説していただきました。
本文
アノテーション作業のコストを減らすための方法として、教師なし学習、半教師あり学習、Active Learningなどの学習手法が近年、注目されています。
教師なし学習や、半教師あり学習はラベル付けされていないサンプルを十分に利用してモデルを学習させることを目的としています。
一方、Active Learningは教師データを作成する際、大量のデータの全てに対してアノテーションをするのではなく、モデルの学習に効果的なサンプルを優先するようにアノテーションを行うことによって、アノテーションの総量を少なく抑えながら教師データの作成とモデルの学習を行うことを目的としています。
ここでは、アノテーション作業を効率化するための、Active Learning研究の取り組みについて、紹介します。