R言語を使いWeb教材「アイスクリーム屋さんで学ぶ楽しい統計学」1の「無相関検定」について進めていきます(第3回)。
標本集団の相関係数
500枚のアンケートを母集団とし、その母集団から無作為抽出した20個の標本データについて今回は検討する。なお検討する内容は、「年齢と1ヶ月当たりの来店回数の関係について」である。
- 無作為抽出した20個の標本データ
> 年齢<-c(18,20,22,19,21,23,17,13,22,24,21,15,19,17,20,16,21,26,18,19)
> 1ヶ月あたり来店数<-c(8,8,7,6,6,5,7,3,6,5,6,2,7,5,7,4,6,4,5,7)
- 散布図
> plot(年齢,1ヶ月あたり来店数)

- 相関係数
> 相関係数<-cor(年齢,1ヶ月あたり来店数)
> 相関係数
[1] 0.2665227
今回のサンプルについては「弱い相関」がみとめられた。
無相関検定
今回のサンプルの相関係数について検定を行う。
帰無仮説H0: ρ=0(母相関は0である)
母集団の相関係数がゼロである。
対立仮説H1: ρ≠1(母相関は0ではない)母集団の相関係数はゼロではない。
今回は帰無仮説のもと自由度(df=n-2)のt分布にしたがうように検定統計量を変換する。
> 相関係数*sqrt(length(年齢)-2)/sqrt(1-相関係数^2)
[1] 1.173196
t分布による棄却域
- 棄却域を5%とした場合
> qt(0.025,18) #自由度18のt分布における下側確率のtの値
[1] -2.100922
> qt(0.025,18,lower.tail=FALSE) #自由度18のt分布における上側確率のtの値
[1] 2.100922
- 棄却域を1%とした場合
> qt(0.005,18) #自由度18のt分布における下側確率のtの値
[1] -2.87844
> qt(0.005,18,lower.tail=FALSE) #自由度18のt分布における上側確率のtの値
[1] 2.87844
検定推定量(1.17)はいずれの棄却域に入らないので、帰無仮説は採択された。
つまり、今回のように標本数20での相関係数0.267は、母集団の相関係数が0と仮定したときに十分起こりうる。
したがって、0.267という相関係数は有意な値とはいえないという結論となる。
- web教材「アイスクリーム屋さんで学ぶ楽しい統計学」第3章 無相関検定 http://kogolab.chillout.jp/elearn/icecream/chap3/sec0.html