※日経ソフトウエア 2018年11月号の記事を再構成

ディープラーニングに代表される機械学習が、数式が苦手な人でも“ざっくり分かる”、プログラミングおよびソフトウエア開発の専門誌である「日経ソフトウエア」連載講座。第2回は機械学習の5つの代表的な用途を整理して紹介する。回帰、分類……、あなたはいくつ知っているだろうか。

用途ごとに適した機械学習アルゴリズム

 AI(人工知能)を理解するには、現在一般的に使われている機械学習のアルゴリズムを知ることが大切だ。そこで、代表的な機械学習のアルゴリズムを、数式を極力使わずに紹介していく(それでもどうしても数式は出てくるのだが……)。図1に機械学習の用途ごとに代表的なアルゴリズムをまとめてみた。

図1 ●機械学習の用途と代表的なアルゴリズム

 機械学習の学習の仕方は、「教師あり学習」と「教師なし学習」に大別できる(もうひとつ「強化学習」と呼ばれる学習の方法もあるが、ここでは触れない)。教師あり学習とは、入力と正解がセットになったトレーニングデータをあらかじめ用意しておき、コンピューターに学習を行わせる方法だ。通常は、人間が教師役となって、あらかじめ入力とそれに対する正解をコンピューターに与え、その入力と正解を基にコンピューターがその特徴を学習していき、未知の入力に対して正解を導き出せるようになる。例えば、「猫」と「犬」の画像を学習させるなら、猫だと分かっている画像と犬だと分かっている画像をたくさん用意して学習させていくことで、トレーニングに使っていない未知の画像を入力したときに、その画像が「猫」なのか「犬」なのか判別できるようになる。それに対して、教師なし学習は正解が与えられず、膨大な入力データの中から、機械自身が特徴や定義を発見していくというもの。アルゴリズムによって、教師あり学習と教師なし学習を使い分けることになる。

第1回
「人工知能=ディープラーニング」は正しい理解ではない
第3回
線形回帰とは?|機械学習アルゴリズム10種(1)