統計は難しいね。
けど仕組みは簡単なんだよ。
正規分布やt分布とかさF分布って言うのがあってさ、その分布を使って推定するんだよ。
簡単な話。
その時に使うのが統計量ってやつでさ、その統計量がどういう分布に従うのかが決まっていて、その分布表を見ながらさ、簡単な話通常あり得るのか、有り得ないのか判断するだけ。
回帰分析とかも、本質は一緒なんだけどさ、あれは、実測値と誤差が最も小さくなる係数を最尤法もしくは最小二乗法で求めているだけなんだけどさ。
少し毛色が違うんだけどね。
けど、最終的に係数が0じゃないか、モデルの全ての係数が0じゃないかって確率計算するのはさ、検定なんだよ。
その際にさ、正規分布しているかどうかが、味噌になってくるんだけどさ。
けど、ぶっちゃけるとさ、既に最小二乗法で最も誤差が少ない係数を導き出しているんだからさ、その係数がゼロの確率とかって判断する必要性なくない。
あれ区間推定するんだよ。母集団のね。
その区間に0が含まれているかどうかを判別するんだけどさ、
母集団の推定せずにさ標本データだけで勝負するならさ、別にF検定もt検定もいらなくてさ、決定係数だけ見れば良いんだよね。
その考え方がさ、今の機械学習でさ、
やっぱり母集団の推定も必要だよねって考え方が、統計学なんだよね。
だって説明付かないでしょってね。( ´艸`)
うーーん。
俺実はさ、そんなに細かい事は覚えてないのよ。
全てざっくりざっくり覚えていてさ、但し本質はこんなもんじゃないかな?
そんなもんよ。統計学ってさ。

0 件のコメント:
コメントを投稿