適合度テスト

フィット感の良さとは何でしょうか？

適合度は、観察されたデータが統計モデルの期待値とどの程度一致しているかを評価します。

統計を深く掘り下げると、「モデルはデータにどの程度適合するのか?」とよく疑問に思うことがあります。あなたのモデルはとても良いです。フィット感が低い？おそらくモデルを再検討する必要があるでしょう。これがフィット感の良さの本質です。より具体的には:

適合度が高いということは、観測値がモデルの期待値に近いことを意味します。
適合度が低い場合は、観測値が期待値から比較的離れていることを示します。

データによく適合するモデルは正確な予測とより深い洞察を提供できますが、適合が不十分な場合は誤解を招く結論や予測につながる可能性があります。信頼性の高い結果と情報に基づいたアクションを実現するには、適切なフィットを確保することが重要です。
適合度の尺度は、観察されたデータとモデルによって期待される値との差の大きさを要約します。適合度検定は、差が統計的に有意かどうかを判断します。さらに、より良い表現を提供するモデルを選択する際のガイドにもなります。適切な適合度の測定とテストは設定によって異なります。

回帰モデルの適合度

回帰モデルでは、正確な予測と有意義な洞察を確保するために適合度を理解することが重要です。ここでは、データとの一貫性を明らかにする主要な指標を詳しく見ていきます。
回帰モデルは、観測値と予測値の差が小さく、偏りがない場合にデータによく適合します。統計学者はこれらの差を残差と呼びます。

適合度が増加するにつれて、データポイントはモデルの適合線に近づきます。

R 二乗 (R²)
R 二乗は、線形回帰モデルの適合度統計量です。便利な 0 ～ 100% スケールを使用して、モデルによって説明される従属変数の変動のパーセンテージを測定します。

R 二乗は、近似された回帰直線の周囲のデータの分布を評価します。データセットの場合、R 二乗値が高いほど、サンプルデータと適合値の差が小さいことを示します。

分布が広いモデルの R 二乗は 15% ですが、分布が狭いモデルの R 二乗は 85% です。

R² を説明された変動のパーセンテージと考えてください。 R² が大きいほど、適合性が高くなります。

R² 高: モデルは多くの変動を捉えます。
R² 低: モデルではほとんどの分散を説明できません。

それだけが指標ではないことを覚えておいてください。 R² が高いからといって必ずしも完璧なモデルであるとは限りません。

回帰標準誤差(S)

この回帰標準誤差は、観測値と予測値の間の絶対差の一般的なサイズを提供する適合度の尺度です。 S は従属変数 (DV) の単位を使用します。

S 値が小さい: 予測値はデータ値に近い。
S 値が大きいということは、予測値の偏差が大きいことを意味します。
モデルが体脂肪率 (DV) を予測するために体格指数 (BMI) を使用するとします。したがって、モデルの S 値が 3.5 である場合、その予測値は通常、観察された体脂肪率の値より 3.5% 高いことがわかりますが、それを単独で見てはいけません。コンテキストを理解するには、これを従属変数の単位と比較する必要があります。

結果	観察	期待値

	Search