Submit Search
統計勉強会 分割表とカイ二乗検定
5 likes
8,172 views
Satoshi Nagayasu
1 of 16
Download now
Downloaded 18 times
1
2
3
4
5
6
Most read
7
8
9
10
11
12
Most read
13
Most read
14
15
16
More Related Content
DOC
12 ασκήσεις ταλαντώσεων
Μαυρουδης Μακης
PDF
心理学・行動経済学を活用した行動変容とAI
Techon Organization
PDF
初めて論文を書くあなたへ_論文執筆の際に頻回に行ったアドバイスをまとめました.私が目指す格好いい論文を書くためのtipsです.
eijiaramaki1
PDF
統計(人間科学のための基礎数学)
Masahiro Okano
PDF
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Koichiro Gibo
PPTX
治せる認知症 Treatable dementia
朝樹 松崎
PDF
関数(&統計の続き)(人間科学のための基礎数学)
Masahiro Okano
PDF
απόδειξη ταλάντωσης σε λείο οριζόντιο επίπεδο
Panagiotis Liagkridonis
12 ασκήσεις ταλαντώσεων
Μαυρουδης Μακης
心理学・行動経済学を活用した行動変容とAI
Techon Organization
初めて論文を書くあなたへ_論文執筆の際に頻回に行ったアドバイスをまとめました.私が目指す格好いい論文を書くためのtipsです.
eijiaramaki1
統計(人間科学のための基礎数学)
Masahiro Okano
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Koichiro Gibo
治せる認知症 Treatable dementia
朝樹 松崎
関数(&統計の続き)(人間科学のための基礎数学)
Masahiro Okano
απόδειξη ταλάντωσης σε λείο οριζόντιο επίπεδο
Panagiotis Liagkridonis
What's hot
(20)
PDF
内受容感覚から見る情動 (PEACE 3rd, 2017)
Ryota Kobayashi
PPTX
心理学における「再現性」の問題とBayes Factor
Shushi Namba
PPTX
被討厭的勇氣
Brian Lin
PDF
Rinko - twitter mood predicts the stock market
Anchuuu Annaka
PPTX
統計的検定と例数設計の基礎
Senshu University
PDF
Ασκήσεις στο 1ο Κεφάλαιο Χημείας Γ΄ Λυκείου (παλιά ύλη)
Βασίλης Μαντάς
PDF
査読 (Peer Review)
Shoji Takahashi
PPTX
相関分析と回帰分析
大貴 末廣
DOC
κεφάλαιο 372
Eleni Kots
PPTX
画像処理応用
大貴 末廣
DOCX
Rによるprincomp関数を使わない主成分分析
wada, kazumi
PPT
το φαινόμενο-του-ρατσισμού
panosfilologos
PDF
20190118 新年の抱負1分で話せ講演会資料
勝裕 小室
PDF
データ入力が終わってから分析前にすること
Masaru Tokuoka
PPTX
数学好きから見た量子コンピュータ~57を因数分解した話~
Satoyuki Tsukano
PPTX
距離とクラスタリング
大貴 末廣
PDF
非劣性試験の入門
Yasuyuki Okumura
PPTX
通識心理_0409記憶
Visual Cognition and Modeling Lab
DOCX
ΚΡΙΤΙΚΗ
Eleni Kots
PDF
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
Yusuke Kaneko
内受容感覚から見る情動 (PEACE 3rd, 2017)
Ryota Kobayashi
心理学における「再現性」の問題とBayes Factor
Shushi Namba
被討厭的勇氣
Brian Lin
Rinko - twitter mood predicts the stock market
Anchuuu Annaka
統計的検定と例数設計の基礎
Senshu University
Ασκήσεις στο 1ο Κεφάλαιο Χημείας Γ΄ Λυκείου (παλιά ύλη)
Βασίλης Μαντάς
査読 (Peer Review)
Shoji Takahashi
相関分析と回帰分析
大貴 末廣
κεφάλαιο 372
Eleni Kots
画像処理応用
大貴 末廣
Rによるprincomp関数を使わない主成分分析
wada, kazumi
το φαινόμενο-του-ρατσισμού
panosfilologos
20190118 新年の抱負1分で話せ講演会資料
勝裕 小室
データ入力が終わってから分析前にすること
Masaru Tokuoka
数学好きから見た量子コンピュータ~57を因数分解した話~
Satoyuki Tsukano
距離とクラスタリング
大貴 末廣
非劣性試験の入門
Yasuyuki Okumura
通識心理_0409記憶
Visual Cognition and Modeling Lab
ΚΡΙΤΙΚΗ
Eleni Kots
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
Yusuke Kaneko
Ad
Similar to 統計勉強会 分割表とカイ二乗検定
(10)
PDF
Rm20130626 10key
youwatari
PDF
20130901_survey_nagoya
Takanori Hiroe
PDF
Rm20140702 11key
youwatari
PDF
Rm20140507 4key
youwatari
PDF
20121125_アンケートを作ろう@アンケート研究会
Takanori Hiroe
PDF
Rm20150513 4key
youwatari
PPTX
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
SR WS
PPTX
20170223 srws第八回 sof、grade、prospero登録
SR WS
PPTX
20170223 srws第八回 sof、grade、prospero登録
SR WS
PDF
理科教育学研究のための統計分析入門
Hiroshi Unzai
Rm20130626 10key
youwatari
20130901_survey_nagoya
Takanori Hiroe
Rm20140702 11key
youwatari
Rm20140507 4key
youwatari
20121125_アンケートを作ろう@アンケート研究会
Takanori Hiroe
Rm20150513 4key
youwatari
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
SR WS
20170223 srws第八回 sof、grade、prospero登録
SR WS
20170223 srws第八回 sof、grade、prospero登録
SR WS
理科教育学研究のための統計分析入門
Hiroshi Unzai
Ad
More from Satoshi Nagayasu
(20)
PDF
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
Satoshi Nagayasu
PDF
Oracle対応アプリケーションのDockerize事始め
Satoshi Nagayasu
PDF
アナリティクスをPostgreSQLで始めるべき10の理由@第6回 関西DB勉強会
Satoshi Nagayasu
PDF
In-Database Analyticsの必要性と可能性
Satoshi Nagayasu
PDF
10 Reasons to Start Your Analytics Project with PostgreSQL
Satoshi Nagayasu
PDF
pgDay Asia 2016 & 2017
Satoshi Nagayasu
PDF
A Story Behind the Conference, or How pgDay Asia was born
Satoshi Nagayasu
PDF
データベースエンジニアがデータヘルスの2年間で見たもの(仮)
Satoshi Nagayasu
PDF
PostgreSQL 9.4, 9.5 and Beyond @ COSCUP 2015 Taipei
Satoshi Nagayasu
PDF
[WIP] pgDay Asia 2016
Satoshi Nagayasu
PDF
PostgreSQL 9.4 and Beyond @ FOSSASIA 2015 Singapore
Satoshi Nagayasu
PDF
PostgreSQL 9.4
Satoshi Nagayasu
PDF
PostgreSQL Community in Japan
Satoshi Nagayasu
PPTX
海外の技術カンファレンスに行こう! Let’s go tech conferences overseas!
Satoshi Nagayasu
PPTX
Django/Celeyを用いたデータ分析Webアプリケーションにおける非同期処理の設計と実装
Satoshi Nagayasu
PDF
映画「マネーボール」に学ぶデータ分析と組織行動論
Satoshi Nagayasu
PDF
PgAccelerator
Satoshi Nagayasu
PDF
PostgreSQL Internals - Buffer Management
Satoshi Nagayasu
PDF
PostgreSQL - C言語によるユーザ定義関数の作り方
Satoshi Nagayasu
PPT
遊休リソースを用いた相同性検索処理の並列化とその評価
Satoshi Nagayasu
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
Satoshi Nagayasu
Oracle対応アプリケーションのDockerize事始め
Satoshi Nagayasu
アナリティクスをPostgreSQLで始めるべき10の理由@第6回 関西DB勉強会
Satoshi Nagayasu
In-Database Analyticsの必要性と可能性
Satoshi Nagayasu
10 Reasons to Start Your Analytics Project with PostgreSQL
Satoshi Nagayasu
pgDay Asia 2016 & 2017
Satoshi Nagayasu
A Story Behind the Conference, or How pgDay Asia was born
Satoshi Nagayasu
データベースエンジニアがデータヘルスの2年間で見たもの(仮)
Satoshi Nagayasu
PostgreSQL 9.4, 9.5 and Beyond @ COSCUP 2015 Taipei
Satoshi Nagayasu
[WIP] pgDay Asia 2016
Satoshi Nagayasu
PostgreSQL 9.4 and Beyond @ FOSSASIA 2015 Singapore
Satoshi Nagayasu
PostgreSQL 9.4
Satoshi Nagayasu
PostgreSQL Community in Japan
Satoshi Nagayasu
海外の技術カンファレンスに行こう! Let’s go tech conferences overseas!
Satoshi Nagayasu
Django/Celeyを用いたデータ分析Webアプリケーションにおける非同期処理の設計と実装
Satoshi Nagayasu
映画「マネーボール」に学ぶデータ分析と組織行動論
Satoshi Nagayasu
PgAccelerator
Satoshi Nagayasu
PostgreSQL Internals - Buffer Management
Satoshi Nagayasu
PostgreSQL - C言語によるユーザ定義関数の作り方
Satoshi Nagayasu
遊休リソースを用いた相同性検索処理の並列化とその評価
Satoshi Nagayasu
統計勉強会 分割表とカイ二乗検定
1.
分割表と 検定 2013/7/6 統計勉強会 Day5 永安
2.
ここでの目的 • 連続値ではない観測値について、有意な差がある のかどうかを調べたい。 – 順序尺度:満足度1~5、優・良・可・不可、など –
名義尺度:男・女、発生した・しなかった、など • 理論値と(有意な)差があるか? • 二つ(以上)の集団で(有意な)差があるか?
3.
検定の方法3つ • 適合度検定 – 標本から求められる度数分布と、理論的な分布が同一かどうかを検 定する •
独立性の検定 – 観測結果が二つの異なった要因で分類できる状況で、異なる要因が 互いに独立である(=相手の影響を受けていない)かどうかを調べる。 – 「原因と結果」になりそうなものの関係性。 • 同等性の検定 – 独立性の検定と形式的には同等。 – 帰無仮説と対立仮説の立て方が逆になる。 – 「差があるとは言えない」ではなく、「同じである」ことを検定。
4.
【復習】 分布とは • 【復習】
統計量の計算方法 – = + + ⋯ + = ( − ) + ( − ) + ⋯ + ( − ) = ∑ ( − )
5.
統計量 • 統計量の計算方法 – =
+ + ⋯ + = ∑ ( ) • : 観測された頻度 • : 仮説のもとで期待される頻度 • 自由度 : 分割数 − 1
6.
①適合度検定 • ある事象の理論的確率(古典的確率)を基準に、経験的確率 (統計的確率)の「バラつき」を算出する。 • 算出したバラつきについて、有意な大きさかどうか(=偶然で はないと言えるか)を検定する。 •
サイコロの例: – サイコロの目が平等に出ていない、ということを検定したい場合 – 帰無仮説 :すべての目が平等に出る – 対立仮説 :目が不平等に出る – バラつきの総和( 統計量)を計算し、臨界値を超えていれば、「有 意なレベルで出る目が平等ではない」と言える。(=帰無仮説を棄却)
7.
適合度検定:サイコロの例 • 300回サイコロを投げた場合の例 統計量
= 9.52 有意水準1%、自由度5の臨界値 = 15.09 < なので、 は棄却できない。 →出目が不平等とは言えない。 1 2 3 4 5 6 58 43 61 38 57 43 50 50 50 50 50 50 ( − ) 64 49 121 144 49 49 ( − ) / 1.28 0.98 2.42 2.88 0.98 0.98
8.
②独立性の検定 • 別々の要素が互いに影響を及ぼしているかどうかを調べる。 • 理論的な確率(同時確率)が、観測値とどれくらい離れているかを検定。 •
歴史と統計の成績の例 – 帰無仮説 :歴史と統計の成績は独立である(関係ない) – 対立仮説 :歴史と統計の成績は独立ではない(互いの影響を受けている) • 周辺確率 – 個別の事象が発生する確率 • 例:P(歴史の成績が良) • 同時確率 – 二つ以上の事象が同時に発生する確率 • 例:P(歴史の成績が良 | 統計の成績が優) – 周辺確率の積として求められる
9.
独立性の検定:周辺確率の算出 • 観測値 を記入する •
周辺確率を求める(標本サイズ117を1.00とする) 歴史\統計 優 良 計 優 24 41 65 良 14 38 52 計 38 79 117 歴史\統計 優 良 計 優 0.56 良 0.44 計 0.32 0.68 1.00
10.
独立性の検定:理論値の算出 • 同時確率(理論値 の確率)を求める •
理論値 (頻度)を求める(標本サイズ117を掛ける) 歴史\統計 優 良 計 優 0.18 0.38 0.56 良 0.14 0.30 0.44 計 0.32 0.68 1.00 歴史\統計 優 良 計 優 21.1 43.9 65 良 16.9 35.1 52 計 38 79 117
11.
独立性の検定:観測値と理論値 • 観測値 (頻度=人数) •
理論値 (頻度=人数) 歴史\統計 優 良 計 優 24 41 65 良 14 38 52 計 38 79 117 歴史\統計 優 良 計 優 21.1 43.9 65 良 16.9 35.1 52 計 38 79 117
12.
独立性の検定: 検定 • すべての要素を並べて、観測値と理論値との偏差を計算、 総和をカイ二乗検定する 自由度
= 分割数 − 1 (分割数 − 1) 統計量 = 1.33 有意水準10%、自由度1の臨界値 = 2.7 < なので、 (成績は独立である)は棄却できない。 →成績が独立でない(=関係している)とは言えない。 歴史\統計 優・優 優・良 良・優 良・良 24 41 14 38 21.1 43.9 16.9 35.1 ( − ) / 0.40 0.19 0.50 0.24
13.
その他のキーワード • フィッシャーの直接確率検定(正確確率検定) – 2
x 2分割表(自由度1、2変数)の場合 – 標本数が小さい(分割表のセルの期待値に10未満のものがある)場 合 – 表中の数値の偏りが大きい場合にはカイ二乗近似は不正確。この場 合には正確確率検定 – 標本数が大きい場合や、数値の偏りが小さい場合(差がなさそうに見 える場合)にはカイ二乗検定 • イェーツの連続性の補正 – 同時確率と観測確率の差を小さくするように、0.5ずつ補正する – 原則として2×2分割表ではYatesの連続補正を使う(?)
14.
③同等性の検定 • 積極的に「同じである」ことを検定したい場合に用いる – 「違いがあるとは言えない」ではなく •
仮説の設定 – 帰無仮説 :母集団Aと母集団Bは同じである – 対立仮説 :母集団Aと母集団Bは異なっている
15.
いろいろ除外してみた • 各年齢層を除外して同等性の検定を行う – :各年齢層で所得と労働時間の考え方は同一 –
:各年齢層で考え方が異なる – :23.21 除外対象 ~19歳 ~29歳 ~39歳 ~49歳 ~59歳 ~69歳 70歳~ 統計量 19.28 25.22 24.10 23.20 25.85 21.74 24.54 臨界値 < < < < < < < を棄却 × ○ ○ × ○ × ○ 年齢層で 異なる 異なる 異なる 異なる
16.
例題:A/Bスプリットテスト あるWebサービスのユーザ登録用のランディングページを改良し、 A/Bスプリットテストを実施した。 <問1> • 以前のデザインのページ – 10,450アクセス、ユーザ登録167件、コンバージョンレート1.60% •
新しいデザインのページ – 8,445アクセス、ユーザ登録153件、コンバージョンレート1.81% コンバージョンレートを考えた時、新デザインのページに有意な改善 があったと言えるか。有意水準5%で検定せよ。 <問2> サンプルサイズが10倍になったらどうか。アクセス数10倍、ユーザ 登録数10倍、有意水準1%として再度検定せよ。
Download