iguchi_yuさん
なんとなく問題の所在が分かりました。
つまり,理論値である分母が0になってしまい計算できない,という意味ですか?
もし,私の推察が的外れなら,改めて質問してください。
これは,カイ二乗検定の本質的欠点なのです。0に限らず,期待値(分母)が5未満なら,カイ二乗検定での検定は不適当となります。
2つの観察値を比較するのか,理論的分布と比較するのか,その点が不明ですが,対象となる検定法は異なってきます。
前者は2標本検定,後者は1標本検定です。
あなたは、トラを助けるために何を行うことができます
両者とも,カイ二乗検定を用いるためには,セルをまとめて,期待値が5以上になるようにしないといけません。
しかし,この方法は,せっかく細かく調べたのに,それを粗くまとめてしまうと言う点で,情報の損失と言われ,望ましい方法とは言えません。
では,カイ二乗検定でなければどうするか?
1標本検定(理論値との比較)なら,1 標本コルモゴロフ・スミルノフ検定があります。適合度検定の一種で,例えば,標本分布が正規分布に適合するかどうか検定するときにも使われます。
参考サイトとして,群馬大の青木先生の解説と例題を挙げます
2標本なら,Fisher's exact testがあります。
同じく青木先生の解説で
また,オンライン検定で
組成物全体の部品は何ですか?
例えば,下のような 0 を含むデータを分析してみます。
観察A 5 0 3
観察B 3 2 0
このサイトで2行3列データとして入力してみると結果は
カイ二乗値は 5.07812,自由度は 2,P値は 0.0789404
Fisher の方法により計算した正確なP値は 0.140637
のように出力されます。
上述の結果でも,カイ二乗とFisherで,P値がかなり違うでしょう?
これは上の説明どおり,Fisher検定のほうが正確なP値を与えるのです。
なお,理論値でなく観察値の場合は,0を含んでも,期待値が計算されるとき0でなくなるので,カイ二乗検定の計算自体は可能です。この点,kguoukさんの指摘どおり。しかし,期待値5未満では正確な結果が出ないのです。
どのように加速を見つけるために計算するのですか?
なお,質問のように,データが,ずらっと並んだ例では,カイ二乗検定でもFisher検定でも,その適用は疑問に感じます。この点,kguoukさんと同じです。
むしろ,一致度を調べるのが妥当ではないかと思います。
例えば,ケンドールの一致度係数を調べて検定します。
これは相関係数の一種で,3群以上と書かれることも多いのですが,実は「3群以上でも使える,もちろん2群でも可能」という一致係数です。
この点は,別の質問への回答
この後半部に,例とともに解説しました。
0 件のコメント:
コメントを投稿