大学教員が書いた就活・転職活動のお守り

就活ではトヨタ系企業をはじめとする一流企業への就職、転職ではサードドアを開けて新しいキャリアを開くことを目指して頂くサイトです。

機械学習の種類と学習方法の違いについて

教師あり学習とは?

 

「教師あり」というと、何か手取り足取り教えてくれる存在があって、それが学習方法や学習内容を教えてくれるというような印象を受けてしまうかもしれませんが、そういうことではないです。

 

教師あり学習は、人間が正解の決まったデータをAIに学習させる方法です。例えば、ある写真を準備して、「これは、ナイフです。」ということを教えて、別の写真を準備して、「これは、お皿です。」ということを教えます。その他、食器類の写真を沢山準備して、AIに教えていきます。

 

すると、違う形や色のお皿をAIに見せた時に、「これはお皿です。」と判断できるようになるということです。

 

通常の世界で、教師が教える内容は正解であるという前提なので、正解をAIに教えるのが「教師あり学習」と覚えるのもよいと思います。

 

教師なし学習とは?

 

人間が結論を教えない形で、例えば、自動車の写真をランダムにAIに学習させていきます。すると、AIが自らその写真のどこかの特徴毎にいくつかのグループ分けを行います。これを「クラスタリング」と呼びます。そのグループ化のための特徴は、AI自身の判断により見出されるもので、どの特徴でグループかしているかは、人間の方に通知される訳ではないので分かりません。

 

AIに沢山の写真を継続的に学習させていくと、例えば、「軽自動車」がグループ化されて、「軽自動車」という概念を学習していくようなことが行われます。AIは、「軽自動車」という言葉を知らないので、AI自身はどのように理解しているのかわかりませんが、ある「軽自動車」の写真が提示された時には、その写真の自動車が、そのグループに属するものだという理解が出来るということだと思います。

 

同じように、有名な例として、「Googleの猫」というものがありまして、YouTubeから大量の様々な種類の画像を取り出してきて、AIに学習させた所、いくつものグループが作られて、その中に、「猫」のグループが作られていたということです。AIは、「猫」という言葉を知らないのですが、猫の存在を認識出来たということです。

 

強化学習とは?

 

「試行錯誤」を通じて「価値を最大化するような行動」を学習する方法です。明確に正解が出せない場合についての学習方法です。

 

例えば、株式売買で、買値よりも株価が高い時に、「その時点で売る」という行動をするか、「もう少し値上がりする予測ができるので、売らずに保有したままにする」という行動をするかの選択があった時に、本当に値上がりした場合は、後者の行動が正しい判断になります。

 

このような後者の行動をした場合に「報酬」が与えられ、逆に、前者のような行動をした時には、「罰」が与えられます。

 

「報酬」が与えられると、最終目的の達成に近づき、「罰」が与えられると、逆に、最終目的の達成から遠ざかることになります。

 

「報酬」が出来るだけ沢山貰えるような行動を出来るように学習を行っていくのか、強化学習と言われるものだということです。