今回の記事は機械学習における「正則化」とは何かに答える記事になります。初心者でもわかるようにできるだけ簡単に解説を行っていきますので是非参考にしてみて下さい。
機械学習における正則化とは?
AIのモデルを学習する際には訓練データを与え学習をさせるという流れが一般的です。
しかし、モデルを学習する際に訓練データが十分ではない場合があります。その際に、データサイズに大して相対的に複雑なモデルの構造を使用してしまうと、「過学習」がおきます。
過学習とは簡単にいうと、訓練データでは良い結果になるが実データを入力した際に精度が悪いという現象です。
訓練データでの精度とモデルの複雑さを調整する方法として、「正則化」という方法があります。
では実際に「正則化」をする方法をご紹介していきます。
正則化の方法
方法としてはAIの学習モデルを学習させる際に、モデルの複雑さがますとペナルティーを与え、このペナルティーを訓連誤差に加えて最も訓練誤差が小さくなる学習モデルを求めるようにします。
L1正則化、L2正則化と言われる方法があります。
基本的にL1正則化は次元圧縮のために用いられ、L2正則化はモデルの過学習を防ぐことで用いられます。結果としてはL2正則化が精度が高い傾向になるとされています。
では今回の記事は以上です。他にも多数の機械学習関連の用語説明記事を記載しているので是非そちらも参考にして見てください。
コメント