R言語を使いWeb教材「ハンバーガーショップで学ぶ楽しい統計学」1の「t検定(対応あり)」について進めていきます(第5回)。

1人に2種類を評価してもらう
ワクワクバーガーとモグモグバーガーを食べた女子高生の点数(100点満点)および平均と標本偏差
> ワクワクバーガーの点数<-c(90,75,75,75,80,65,75,80)
> mean(ワクワクバーガーの点数)
[1] 76.875
> ワクワクバーガーの標本偏差<-mean((ワクワクバーガーの点数-mean(ワクワクバーガーの点数))^2)
> ワクワクバーガーの標本偏差
[1] 43.35938

> モグモグバーガーの点数<-c(95,80,80,80,75,75,80,85)
> mean(モグモグバーガーの点数)
[1] 81.25
> モグモグバーガーの標本偏差<-mean((モグモグバーガーの点数-mean(モグモグバーガーの点数))^2)
> モグモグバーガーの標本偏差
[1] 35.9375
それそれの平均の差を計算してみると
> mean(モグモグバーガーの点数)-mean(ワクワクバーガーの点数)
[1] 4.375
となりワクワクバーガーのほうが、4.38だけ低いことになりました。

対応があるとは?
この差について検定することになるが、今回は「対応のある」検定を行います。
そこでまず「対応あり」と「対応なし・独立」の違いについて説明します。
「対応なし・独立」とはランダムに2群に割り振った場合の2群データです。 つまり「2つの独立した母集団から標本を選んでくる」という条件を指します。それに対して「対応あり」とは、似ている被験者2人をペアンにして、ペアの一方を1群、他方を2群に分けて割り当てるという方法が’あります。こうした方法で分けられた2群のデータを対応あるデータといいます。つまり、 「1つの母集団から標本を選んでくる」という条件を指します。
具体的には「 ワクワクバーガーとモグモグバーガーを食べた女子高生がつけた点数の差の母集団」ということです。

対応のあるt検定
ワクワクバーガーの点数からモグモグバーガーの点数を引いて「点数の差」を計算する。
> 点数の差<-モグモグバーガーの点数-ワクワクバーガーの点数
> 点数の差
[1] 5 5 5 5 -5 10 5 5
点数の差の平均と標本標本偏差を求める。
> mean(点数の差)
[1] 4.375

> 点数の差の標本平均<-mean((点数の差-mean(点数の差))^2)
> 点数の差の標本平均
[1] 15.23438
このように、点数の差の平均はそれぞれの差の平均と同じ4.38になることがわかります。
指標tを計算してみる
指標tは、 「平均の差/(標本から求めた標準偏差/√標本数)」で求まる
> 指標t<-mean(点数の差)/(sd(点数の差)/sqrt(length(点数の差)))
> 指標t
[1] 2.965615
t分布表をみる
今回はサンプル数が8 人のので自由度8-1=7のt分布にしたがいます。有意水準を5%のときの棄却率をもとめる。
> qt(0.025,7) #自由度7で上側確率0.025%のt値
[1] -2.364624
> qt(0.975,7) #自由度7で上側確率0.975%のt値
[1] 2.364624
これを図示する。
> curve(dt(x,7),-3,3)
> abline(v=qt(0.025,7))
> abline(v=qt(0.975,7))
指標tは2.97であり、5%の棄却域に入っているので帰無仮説は棄却されます。
つまり、 「ワクワクとモグモグの評価点の平均には差がある」ということになりました。

Rの関数を使いt検定をする
t検定を関数t.test()で一発検定する。
> t.test(点数の差)

One Sample t-test

data: 点数の差
t = 2.9656, df = 7, p-value = 0.02094
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
0.8866067 7.8633933
sample estimates:
mean of x
4.375
もしくは、
> t.test(ワクワクバーガーの点数,モグモグバーガーの点数,paired=TRUE)

Paired t-test

data: ワクワクバーガーの点数 and モグモグバーガーの点数
t = -2.9656, df = 7, p-value = 0.02094
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-7.8633933 -0.8866067
sample estimates:
mean of the differences
-4.375


  1. Web教材「ハンバーガーショップで学ぶ楽しい統計学」第5章 t検定(対応ありhttp://kogolab.chillout.jp/elearn/hamburger/chap5/sec0.html