今回の記事は、「回帰」という統計的やデータ分析において多用される用語の一つで機械学習を学ぶ上でに大いに関係してくる用語なのでご紹介していきます。
『回帰(かいき、(英: regression)とは、統計学において、Y が連続値の時にデータに Y = f(X) というモデル(「定量的な関係の構造 」)を当てはめる事。別の言い方では、連続尺度の従属変数(目的変数)Y と独立変数(説明変数)X の間にモデルを当てはめること。X が1次元ならば単回帰、X が2次元以上ならば重回帰と言う。Y が離散の場合は分類と言う。 』
公式的にいうと上記のような説明になります。
これだと難しすぎます。簡単に噛み砕いて説明すると下記です。
『時間変化などの時系列的なつながりのあるデータから次の結果を予測するという統計手法のこと。』
要は株価予測や天気予測などですね。天気は季節性もありますが時系列的な時間変化も大いに関係してくるので統計的な流れから明日の天気を予測することが具体的な例になります。
時系列データの予測に関しては私の記事でも解説しているので気になる方は記事をご参照いただjhユチ幸いです。
コメント
[…] 簡単に噛み砕くと以前解説した、回帰の自己相関が強い場合に使用する分析手法です。ここで出てきた自己相関に関しては自己相関リンクでもわかりやすく解説しておりますが、簡単にいうと「時間の経過とともにどれだけ元の状態と関係なくなっていくかの指標(関数)です。」つめりこの指標が弱いと自己相関が強いといえます。こう言った場合に使用する分析手法が自己回帰でその分析のテンプレが自己回帰(AR)モデルです。 […]