統計學類型數據檢驗_第1頁
統計學類型數據檢驗_第2頁
統計學類型數據檢驗_第3頁
統計學類型數據檢驗_第4頁
統計學類型數據檢驗_第5頁
已閱讀5頁,還剩29頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統計學類型數據檢驗1第一頁,共三十四頁,2022年,8月28日類型數據分析目的:本講結束后,學生們應能夠:

將類型數據整理為列聯表解釋卡方分布的性質運用卡方分布進行同質性檢驗運用卡方分布進行獨立性檢驗解釋卡方檢驗的SPSS輸出結果2第二頁,共三十四頁,2022年,8月28日類型數據分析講課提綱

列聯表–交叉列聯表所講述的內容總體之間的同質性兩個變量之間的獨立性將統計學運用于具體情形–SPSS發揮的作用3第三頁,共三十四頁,2022年,8月28日列聯表

--交叉列聯表所講述的內容收集抽樣單位特征或特點方面的資料整理數據以反映每種類型的計數情況與“類型”有聯系的觀察值被稱為類型數據

4第四頁,共三十四頁,2022年,8月28日列聯表

--交叉列聯表所講述的內容例題1 根據同一特征對兩個樣本進行分類CF(商業廣告片)在電視上播放之前,通常要經過檢驗和修改。一名軟飲料生產商想在電視上播放一個新的商業廣告片。他為這個廣告制作了兩個版本,即CF-A和CF-B。這名生產商想對廣告片的兩個版本進行初步的檢驗。為此,他將其中一個版本的廣告片播放給一半觀眾看,另一個版本的廣告片播放給另一半觀眾看,然后他對這些觀眾進行電話調查并將他們的反應分為以下幾類:不記得

記得

只記得廣告內容

觀看過的內容

廣告中的要點5第五頁,共三十四頁,2022年,8月28日列聯表

--交叉列聯表所講述的內容這兩個不同版本的商業廣告片是否在人們頭腦中留下了同樣的印象?6第六頁,共三十四頁,2022年,8月28日列聯表

--交叉列聯表所講述的內容7第七頁,共三十四頁,2022年,8月28日列聯表

--交叉列聯表所講述的內容例題2 根據兩種特征對一個樣本進行分類勞工合同期限與行業類型之間是否具有聯系?8第八頁,共三十四頁,2022年,8月28日列聯表

--交叉列聯表所講述的內容卡方(2)分布--

它由一系列分布組成,其具體形狀取決于一個參數,即自由度(df)卡方分布是一種抽樣分布卡方分布傾向右側隨著自由度(df)增大,卡方分布將接近正態分布9第九頁,共三十四頁,2022年,8月28日列聯表

--交叉列聯表所講述的內容df=1df=6df=10df=420246812141610第十頁,共三十四頁,2022年,8月28日列聯表

--交叉列聯表所講述的內容卡方檢驗的基本思想--

比較觀察頻數和期望頻數如果觀察頻數接近期望頻數,則可以作為接受原假設(H0)的證據運用卡方檢驗--

檢驗同質性檢驗擬合優度檢驗獨立性檢驗總體方差是否相等11第十一頁,共三十四頁,2022年,8月28日總體之間的同質性當把從兩個樣本中抽取的數據根據同一特征進行了分類并表示為列聯表之后目的是檢驗不同總體的反應類型是否相同為了回答這個問題,我們利用卡方檢驗來檢驗同質性12第十二頁,共三十四頁,2022年,8月28日總體之間的同質性例題1:兩個不同版本商業廣告片的反應類型每種版本的商業廣告片代表一個總體每一種反應類型代表未知的總體比例13第十三頁,共三十四頁,2022年,8月28日總體之間的同質性原假設為具有“同質性”或“相似的反應類型”,可以將其寫成H0:

pA1

=pB1,pA2

=pB2,pA3

=pB3

14第十四頁,共三十四頁,2022年,8月28日總體之間的同質性根據H0,pi可以被估計為和如果原假設為真,兩個總體的每種反應類型都應當具有相同的比例,讓我們分別用一些常見的比例符號p1,p2,p3來表示15第十五頁,共三十四頁,2022年,8月28日總體之間的同質性期望頻數--16第十六頁,共三十四頁,2022年,8月28日總體之間的同質性檢驗統計量如果觀察頻數與期望頻數相差很大,我們就認為原假設為假17第十七頁,共三十四頁,2022年,8月28日總體之間的同質性2

=0.674+0.502+2.006+0.770+0.573+2.292=6.8172值是否過大,使得我們不得不拒絕H0?將該值與從2表中獲得的“臨界值”進行比較查表之前需要知道1. 自由度 d.f.=(r–1)(c–1)2. 右尾上面的面積()–顯著水平18第十八頁,共三十四頁,2022年,8月28日總體之間的同質性019第十九頁,共三十四頁,2022年,8月28日總體之間的同質性自由度d.f.=(2–1)(3–1)=2顯著水平,=0.05=5.99臨界值

6.817>5.99數據顯示:當顯著水平=0.05時,檢驗統計量太大,因此我們應當拒絕H0觀眾在觀看完兩種不同版本的商業廣告片之后,其反應類型會有明顯的差異20第二十頁,共三十四頁,2022年,8月28日總體之間的同質性進行卡方同質檢驗的步驟

1.構造假設2.建立列聯表并計算期望頻數3.計算檢驗統計量4.計算自由度并查找臨界值5.進行決策并得出結論21第二十一頁,共三十四頁,2022年,8月28日總體之間的同質性H0:各個總體的反應類型具有相同的概率HA:與其他總體相比,有些總體的反應類型有不同的概率檢驗統計量自由度=(r–1)(c–1)拒絕H0

如果2>(檢驗統計量>臨界值

)22第二十二頁,共三十四頁,2022年,8月28日兩個變量之間的獨立性當按照兩種特征對數據進行了歸類并將其表示為雙向列聯表時實質性問題是:這兩種特征是否在總體中進行了獨立分布?為了回答這個問題,我們需要利用2來進行獨立性檢驗23第二十三頁,共三十四頁,2022年,8月28日兩個變量之間的獨立性思考一下,當顯著水平

=0.05時,勞工合同期限是否與行業類型有聯系?24第二十四頁,共三十四頁,2022年,8月28日兩個變量之間的獨立性1.構造假設H0:合同期限與行業類型相互獨立HA:合同期限與行業類型相互不獨立2.計算期望頻數如果原假設為真,則我們預計可以得到P(期限

行業)=P(期限)

P(行業)25第二十五頁,共三十四頁,2022年,8月28日兩個變量之間的獨立性因此,可以根據下表計算期望頻數26第二十六頁,共三十四頁,2022年,8月28日兩個變量之間的獨立性3.檢驗統計量=4.157自由度=(2–1)(3–1)=24.臨界值=5.995.4.157<5.99(即檢驗統計量<臨界值)

接受H0數據顯示:當顯著水平=0.05時,合同期限與行業類型相互獨立27第二十七頁,共三十四頁,2022年,8月28日兩個變量之間的獨立性H0:兩個因子相互獨立HA:兩個因子相互不獨立檢驗統計量自由度=(r–1)(c–1)拒絕

H0

如果 2>(即檢驗統計量>臨界值)28第二十八頁,共三十四頁,2022年,8月28日將統計學運用于具體情形

--

SPSS發揮的作用

定義數據–變量圖有三個變量有待定義:行業、期限、計數29第二十九頁,共三十四頁,2022年,8月28日將統計學運用于具體情形

--

SPSS發揮的作用

輸入數據–數據圖將3欄、6排數據按以下方式輸入根據計數衡量各種情形(數據衡量情形)

30第三十頁,共三十四頁,2022年,8月28日將統計學運用于具體情形

--

SPSS發揮的作用進行分析–菜單條1.在菜單條中單擊

分析描述統計學交叉列表…2.將行業規定為行,期限規定為列

單擊小格…

并且

檢查期望數和各行的百分比

單擊統計并且 方檢驗和PhiandCramer’sV

3.單擊OK31第三十一頁,共三十四頁,2022年,8月28日將統計學運用于具體情形

--

SPSS發揮的作用

SPSS輸出結果–可以用皮爾生卡方來表示卡方檢驗統計值

2=4.157 自由度=2p–值=0.125(>0.05)由于p–值>,因此我們接受

H0即數據支持原假設:即行業類型與合同期限是相互獨立的

32第三十二頁,共三十四頁,2022年,8月28日將統計學運用于具體情形

--

SPSS發揮的作用行業類型與期限交叉列表

101874824514.1180.150.8245.04.1%76.3%19.6%100.09113.932.2155.08.4%69.0%22.6%100.0%232948340023.0294.083.0400.05.8%73.5%20.8%100.0%計數每一類行業的期望數計數每一類行業的期望數

計數每一類行業

的期望數

制造型

非制造型

行業類型

總計少于2年2–

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論