SlideShare a Scribd company logo
6
Most read
12
Most read
13
Most read
分割表と 検定
2013/7/6
統計勉強会 Day5
永安
ここでの目的
• 連続値ではない観測値について、有意な差がある
のかどうかを調べたい。
– 順序尺度:満足度1~5、優・良・可・不可、など
– 名義尺度:男・女、発生した・しなかった、など
• 理論値と(有意な)差があるか?
• 二つ(以上)の集団で(有意な)差があるか?
検定の方法3つ
• 適合度検定
– 標本から求められる度数分布と、理論的な分布が同一かどうかを検
定する
• 独立性の検定
– 観測結果が二つの異なった要因で分類できる状況で、異なる要因が
互いに独立である(=相手の影響を受けていない)かどうかを調べる。
– 「原因と結果」になりそうなものの関係性。
• 同等性の検定
– 独立性の検定と形式的には同等。
– 帰無仮説と対立仮説の立て方が逆になる。
– 「差があるとは言えない」ではなく、「同じである」ことを検定。
【復習】 分布とは
• 【復習】 統計量の計算方法
– = + + ⋯ +
= ( − ) + ( − ) + ⋯ + ( − )
= ∑ ( − )
統計量
• 統計量の計算方法
– = + + ⋯ +
= ∑
( )
• : 観測された頻度
• : 仮説のもとで期待される頻度
• 自由度 : 分割数 − 1
①適合度検定
• ある事象の理論的確率(古典的確率)を基準に、経験的確率
(統計的確率)の「バラつき」を算出する。
• 算出したバラつきについて、有意な大きさかどうか(=偶然で
はないと言えるか)を検定する。
• サイコロの例:
– サイコロの目が平等に出ていない、ということを検定したい場合
– 帰無仮説 :すべての目が平等に出る
– 対立仮説 	:目が不平等に出る
– バラつきの総和( 統計量)を計算し、臨界値を超えていれば、「有
意なレベルで出る目が平等ではない」と言える。(=帰無仮説を棄却)
適合度検定:サイコロの例
• 300回サイコロを投げた場合の例
	 統計量 = 9.52
有意水準1%、自由度5の臨界値 = 15.09
	 < なので、 は棄却できない。
→出目が不平等とは言えない。
1 2 3 4 5 6
58 43 61 38 57 43
50 50 50 50 50 50
( − ) 64 49 121 144 49 49
( − ) / 1.28 0.98 2.42 2.88 0.98 0.98
②独立性の検定
• 別々の要素が互いに影響を及ぼしているかどうかを調べる。
• 理論的な確率(同時確率)が、観測値とどれくらい離れているかを検定。
• 歴史と統計の成績の例
– 帰無仮説 :歴史と統計の成績は独立である(関係ない)
– 対立仮説 	:歴史と統計の成績は独立ではない(互いの影響を受けている)
• 周辺確率
– 個別の事象が発生する確率
• 例:P(歴史の成績が良)
• 同時確率
– 二つ以上の事象が同時に発生する確率
• 例:P(歴史の成績が良 | 統計の成績が優)
– 周辺確率の積として求められる
独立性の検定:周辺確率の算出
• 観測値 を記入する
• 周辺確率を求める(標本サイズ117を1.00とする)
歴史\統計 優 良 計
優 24 41 65
良 14 38 52
計 38 79 117
歴史\統計 優 良 計
優 0.56
良 0.44
計 0.32 0.68 1.00
独立性の検定:理論値の算出
• 同時確率(理論値 の確率)を求める
• 理論値 (頻度)を求める(標本サイズ117を掛ける)
歴史\統計 優 良 計
優 0.18 0.38 0.56
良 0.14 0.30 0.44
計 0.32 0.68 1.00
歴史\統計 優 良 計
優 21.1 43.9 65
良 16.9 35.1 52
計 38 79 117
独立性の検定:観測値と理論値
• 観測値 (頻度=人数)
• 理論値 (頻度=人数)
歴史\統計 優 良 計
優 24 41 65
良 14 38 52
計 38 79 117
歴史\統計 優 良 計
優 21.1 43.9 65
良 16.9 35.1 52
計 38 79 117
独立性の検定: 検定
• すべての要素を並べて、観測値と理論値との偏差を計算、
総和をカイ二乗検定する
自由度 = 分割数 − 1 (分割数 − 1)
統計量 = 1.33
有意水準10%、自由度1の臨界値 = 2.7
	 < なので、 (成績は独立である)は棄却できない。
→成績が独立でない(=関係している)とは言えない。
歴史\統計 優・優 優・良 良・優 良・良
24 41 14 38
21.1 43.9 16.9 35.1
( − ) / 0.40 0.19 0.50 0.24
その他のキーワード
• フィッシャーの直接確率検定(正確確率検定)
– 2 x 2分割表(自由度1、2変数)の場合
– 標本数が小さい(分割表のセルの期待値に10未満のものがある)場
合
– 表中の数値の偏りが大きい場合にはカイ二乗近似は不正確。この場
合には正確確率検定
– 標本数が大きい場合や、数値の偏りが小さい場合(差がなさそうに見
える場合)にはカイ二乗検定
• イェーツの連続性の補正
– 同時確率と観測確率の差を小さくするように、0.5ずつ補正する
– 原則として2×2分割表ではYatesの連続補正を使う(?)
③同等性の検定
• 積極的に「同じである」ことを検定したい場合に用いる
– 「違いがあるとは言えない」ではなく
• 仮説の設定
– 帰無仮説 :母集団Aと母集団Bは同じである
– 対立仮説 	:母集団Aと母集団Bは異なっている
いろいろ除外してみた
• 各年齢層を除外して同等性の検定を行う
– :各年齢層で所得と労働時間の考え方は同一
– :各年齢層で考え方が異なる
– :23.21
除外対象 ~19歳 ~29歳 ~39歳 ~49歳 ~59歳 ~69歳 70歳~
統計量 19.28 25.22 24.10 23.20 25.85 21.74 24.54
臨界値 	 < < < 	 < < 	 < <
を棄却 × ○ ○ × ○ × ○
年齢層で 異なる 異なる 異なる 異なる
例題:A/Bスプリットテスト
あるWebサービスのユーザ登録用のランディングページを改良し、
A/Bスプリットテストを実施した。
<問1>
• 以前のデザインのページ
– 10,450アクセス、ユーザ登録167件、コンバージョンレート1.60%
• 新しいデザインのページ
– 8,445アクセス、ユーザ登録153件、コンバージョンレート1.81%
コンバージョンレートを考えた時、新デザインのページに有意な改善
があったと言えるか。有意水準5%で検定せよ。
<問2>
サンプルサイズが10倍になったらどうか。アクセス数10倍、ユーザ
登録数10倍、有意水準1%として再度検定せよ。

More Related Content

DOC
12 ασκήσεις ταλαντώσεων
PDF
心理学・行動経済学を活用した行動変容とAI
PDF
初めて論文を書くあなたへ_論文執筆の際に頻回に行ったアドバイスをまとめました.私が目指す格好いい論文を書くためのtipsです.
PDF
統計(人間科学のための基礎数学)
PDF
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
PPTX
治せる認知症 Treatable dementia
PDF
関数(&統計の続き)(人間科学のための基礎数学)
PDF
απόδειξη ταλάντωσης σε λείο οριζόντιο επίπεδο
12 ασκήσεις ταλαντώσεων
心理学・行動経済学を活用した行動変容とAI
初めて論文を書くあなたへ_論文執筆の際に頻回に行ったアドバイスをまとめました.私が目指す格好いい論文を書くためのtipsです.
統計(人間科学のための基礎数学)
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
治せる認知症 Treatable dementia
関数(&統計の続き)(人間科学のための基礎数学)
απόδειξη ταλάντωσης σε λείο οριζόντιο επίπεδο

What's hot (20)

PDF
内受容感覚から見る情動 (PEACE 3rd, 2017)
PPTX
心理学における「再現性」の問題とBayes Factor
PPTX
被討厭的勇氣
PDF
Rinko - twitter mood predicts the stock market
PPTX
統計的検定と例数設計の基礎
PDF
Ασκήσεις στο 1ο Κεφάλαιο Χημείας Γ΄ Λυκείου (παλιά ύλη)
PDF
査読 (Peer Review)
PPTX
相関分析と回帰分析
DOC
κεφάλαιο 372
PPTX
画像処理応用
DOCX
Rによるprincomp関数を使わない主成分分析
PPT
το φαινόμενο-του-ρατσισμού
PDF
20190118 新年の抱負1分で話せ講演会資料
PDF
データ入力が終わってから分析前にすること
PPTX
数学好きから見た量子コンピュータ~57を因数分解した話~
PPTX
距離とクラスタリング
PDF
非劣性試験の入門
PPTX
通識心理_0409記憶
DOCX
ΚΡΙΤΙΚΗ
PDF
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
内受容感覚から見る情動 (PEACE 3rd, 2017)
心理学における「再現性」の問題とBayes Factor
被討厭的勇氣
Rinko - twitter mood predicts the stock market
統計的検定と例数設計の基礎
Ασκήσεις στο 1ο Κεφάλαιο Χημείας Γ΄ Λυκείου (παλιά ύλη)
査読 (Peer Review)
相関分析と回帰分析
κεφάλαιο 372
画像処理応用
Rによるprincomp関数を使わない主成分分析
το φαινόμενο-του-ρατσισμού
20190118 新年の抱負1分で話せ講演会資料
データ入力が終わってから分析前にすること
数学好きから見た量子コンピュータ~57を因数分解した話~
距離とクラスタリング
非劣性試験の入門
通識心理_0409記憶
ΚΡΙΤΙΚΗ
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
Ad

Similar to 統計勉強会 分割表とカイ二乗検定 (10)

PDF
Rm20130626 10key
PDF
20130901_survey_nagoya
PDF
Rm20140702 11key
PDF
Rm20140507 4key
PDF
20121125_アンケートを作ろう@アンケート研究会
PDF
Rm20150513 4key
PPTX
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
PPTX
20170223 srws第八回 sof、grade、prospero登録
PPTX
20170223 srws第八回 sof、grade、prospero登録
PDF
理科教育学研究のための統計分析入門
Rm20130626 10key
20130901_survey_nagoya
Rm20140702 11key
Rm20140507 4key
20121125_アンケートを作ろう@アンケート研究会
Rm20150513 4key
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
20170223 srws第八回 sof、grade、prospero登録
20170223 srws第八回 sof、grade、prospero登録
理科教育学研究のための統計分析入門
Ad

More from Satoshi Nagayasu (20)

PDF
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
PDF
Oracle対応アプリケーションのDockerize事始め
PDF
アナリティクスをPostgreSQLで始めるべき10の理由@第6回 関西DB勉強会
PDF
In-Database Analyticsの必要性と可能性
PDF
10 Reasons to Start Your Analytics Project with PostgreSQL
PDF
pgDay Asia 2016 & 2017
PDF
A Story Behind the Conference, or How pgDay Asia was born
PDF
データベースエンジニアがデータヘルスの2年間で見たもの(仮)
PDF
PostgreSQL 9.4, 9.5 and Beyond @ COSCUP 2015 Taipei
PDF
[WIP] pgDay Asia 2016
PDF
PostgreSQL 9.4 and Beyond @ FOSSASIA 2015 Singapore
PDF
PostgreSQL 9.4
PDF
PostgreSQL Community in Japan
PPTX
海外の技術カンファレンスに行こう! Let’s go tech conferences overseas!
PPTX
Django/Celeyを用いたデータ分析Webアプリケーションにおける非同期処理の設計と実装
PDF
映画「マネーボール」に学ぶデータ分析と組織行動論
PDF
PgAccelerator
PDF
PostgreSQL Internals - Buffer Management
PDF
PostgreSQL - C言語によるユーザ定義関数の作り方
PPT
遊休リソースを用いた 相同性検索処理の並列化とその評価
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
Oracle対応アプリケーションのDockerize事始め
アナリティクスをPostgreSQLで始めるべき10の理由@第6回 関西DB勉強会
In-Database Analyticsの必要性と可能性
10 Reasons to Start Your Analytics Project with PostgreSQL
pgDay Asia 2016 & 2017
A Story Behind the Conference, or How pgDay Asia was born
データベースエンジニアがデータヘルスの2年間で見たもの(仮)
PostgreSQL 9.4, 9.5 and Beyond @ COSCUP 2015 Taipei
[WIP] pgDay Asia 2016
PostgreSQL 9.4 and Beyond @ FOSSASIA 2015 Singapore
PostgreSQL 9.4
PostgreSQL Community in Japan
海外の技術カンファレンスに行こう! Let’s go tech conferences overseas!
Django/Celeyを用いたデータ分析Webアプリケーションにおける非同期処理の設計と実装
映画「マネーボール」に学ぶデータ分析と組織行動論
PgAccelerator
PostgreSQL Internals - Buffer Management
PostgreSQL - C言語によるユーザ定義関数の作り方
遊休リソースを用いた 相同性検索処理の並列化とその評価

統計勉強会 分割表とカイ二乗検定