




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、STATA 從入門到精通第六章第六章 列聯(lián)表分析列聯(lián)表分析Page 2STATA從入門到精通從入門到精通6.1列聯(lián)表分析列聯(lián)表分析n列聯(lián)表是分析兩個分類變量(名義變量或者定序變量)之間關系的基列聯(lián)表是分析兩個分類變量(名義變量或者定序變量)之間關系的基本統(tǒng)計方法。設兩個變量本統(tǒng)計方法。設兩個變量A和和B分別有分別有r和和c個類型,則他們可以構成一個個類型,則他們可以構成一個的列聯(lián)表。的列聯(lián)表。n獨立性檢驗統(tǒng)計量獨立性檢驗統(tǒng)計量在對兩變量進行列聯(lián)表分析時,首先要檢驗它們的獨立性,這就涉及到在對兩變量進行列聯(lián)表分析時,首先要檢驗它們的獨立性,這就涉及到獨立性檢驗統(tǒng)計量,常用的統(tǒng)計量有皮爾遜卡方統(tǒng)計
2、量(獨立性檢驗統(tǒng)計量,常用的統(tǒng)計量有皮爾遜卡方統(tǒng)計量(Pearson Chi-Square)和似然比統(tǒng)計量()和似然比統(tǒng)計量(Likelihood Ratio)。)。Fisher精確檢驗仍采用卡方統(tǒng)計量作為檢驗統(tǒng)計量,只是在計算統(tǒng)計量精確檢驗仍采用卡方統(tǒng)計量作為檢驗統(tǒng)計量,只是在計算統(tǒng)計量的分布時,利用概率論中的超幾何分布來計算每一種情況發(fā)生的概率,的分布時,利用概率論中的超幾何分布來計算每一種情況發(fā)生的概率,然后才能得到然后才能得到P值。當樣本量較大,或者列聯(lián)表的行數(shù)及列數(shù)較大時,值。當樣本量較大,或者列聯(lián)表的行數(shù)及列數(shù)較大時,F(xiàn)isher檢驗的計算量會變得很大,以至于無法承受。檢驗的計算量
3、會變得很大,以至于無法承受。Page 3STATA從入門到精通從入門到精通n 列聯(lián)表中的相關測量統(tǒng)計量列聯(lián)表中的相關測量統(tǒng)計量n 對于名義變量,通常采用基于卡方統(tǒng)計量的各種統(tǒng)計量來進行關聯(lián)性對于名義變量,通常采用基于卡方統(tǒng)計量的各種統(tǒng)計量來進行關聯(lián)性度量,最常的是度量,最常的是Cramers V系數(shù)系數(shù)n 對于有序變量,關聯(lián)性度量的統(tǒng)計量通常是基于觀測中的一致對和不對于有序變量,關聯(lián)性度量的統(tǒng)計量通常是基于觀測中的一致對和不一致對的個數(shù)??梢远x以下統(tǒng)計量來描述有序變量之間的有序關聯(lián)一致對的個數(shù)??梢远x以下統(tǒng)計量來描述有序變量之間的有序關聯(lián)性的大?。盒缘拇笮。?統(tǒng)計量:統(tǒng)計量:gamma統(tǒng)計
4、量和統(tǒng)計量和 Kendall統(tǒng)計量統(tǒng)計量nPage 4STATA從入門到精通從入門到精通6.2 Stata的列聯(lián)表分析的列聯(lián)表分析table和和tabulate命令命令6.2.1使用使用table命令生成列聯(lián)表命令生成列聯(lián)表table命令可以用于生成一維到多維的列聯(lián)表,表中不僅可以包含常見的命令可以用于生成一維到多維的列聯(lián)表,表中不僅可以包含常見的頻數(shù),還可以包含任意其他變量的描述性統(tǒng)計量。頻數(shù),還可以包含任意其他變量的描述性統(tǒng)計量。table命令的格式如下:命令的格式如下: table rowvar colvar supercolvar if in weight , options其中其中r
5、owvar代表行變量,代表行變量,colvar代表列變量,代表列變量,supercolvar代表更高階代表更高階的列變量,同之前一樣,的列變量,同之前一樣,in和和if用于選擇樣本或者選擇范圍,用于選擇樣本或者選擇范圍,weight用用于添加權重。于添加權重。Page 5STATA從入門到精通從入門到精通 表表6-2 table命令可以報告的統(tǒng)計量命令可以報告的統(tǒng)計量n freq 頻數(shù)頻數(shù)n mean 平均數(shù)平均數(shù)n sd 標準差標準差n semean 標準誤標準誤 (sd/sqrt(n)n sum 總和總和n count、n 觀測值個數(shù)觀測值個數(shù)n max 最大值最大值n min 最小值最小
6、值n median 中位數(shù)中位數(shù)n p# 各種百分位數(shù)各種百分位數(shù)n iqr IQR四分位距四分位距Page 6STATA從入門到精通從入門到精通n 【例【例6.1】 數(shù)據(jù)集數(shù)據(jù)集auto.dta是是Stata系統(tǒng)自帶的關于系統(tǒng)自帶的關于1978年汽車市場年汽車市場的一個調(diào)查數(shù)據(jù),該數(shù)據(jù)集共有的一個調(diào)查數(shù)據(jù),該數(shù)據(jù)集共有74個觀測值,個觀測值,12個變量。變量的具個變量。變量的具體情況是:體情況是:make是字符型變量,表明生產(chǎn)廠商。其他均為數(shù)值型變是字符型變量,表明生產(chǎn)廠商。其他均為數(shù)值型變量,量,price是汽車的價格(萬元),是汽車的價格(萬元),mpg是行駛里程(英里),是行駛里程(英
7、里),rep78是在該年度修理次數(shù),是在該年度修理次數(shù),foreign是虛擬變量,賦值是虛擬變量,賦值1代表國外產(chǎn),代表國外產(chǎn),0代代表國產(chǎn)。數(shù)據(jù)用幾個變量揭示了汽車的重要特征:表國產(chǎn)。數(shù)據(jù)用幾個變量揭示了汽車的重要特征:headroom、trunk、length、turn、displacemen、gea_ratio依次代表汽車內(nèi)部依次代表汽車內(nèi)部空間大小、后備箱空間大小、身長、轉彎半徑、排氣量和變速比??臻g大小、后備箱空間大小、身長、轉彎半徑、排氣量和變速比。n 本例演示如何利用本例演示如何利用table命令完成如下兩個任務:命令完成如下兩個任務:n (1)使用)使用table命令創(chuàng)建關于命
8、令創(chuàng)建關于rep78的頻數(shù)表,并在表中顯示的頻數(shù)表,并在表中顯示mpg的的觀測值個數(shù)、平均數(shù)、標準差和中位數(shù)。觀測值個數(shù)、平均數(shù)、標準差和中位數(shù)。n (2)使用)使用table命令創(chuàng)建關于命令創(chuàng)建關于foreign和和rep78的二維表格,并在表中的二維表格,并在表中顯示顯示mpg的平均數(shù)。的平均數(shù)。Page 7STATA從入門到精通從入門到精通n 【例【例6.2】本例使用一個關于肺炎的調(diào)查數(shù)據(jù)集】本例使用一個關于肺炎的調(diào)查數(shù)據(jù)集byssin1.dta來說明來說明table命令創(chuàng)建多維表格。數(shù)據(jù)集中每個觀測值代表了一類人,變量命令創(chuàng)建多維表格。數(shù)據(jù)集中每個觀測值代表了一類人,變量prob是該類
9、人罹患肺炎的概率,是該類人罹患肺炎的概率,smokes是代表是否吸煙的虛擬變量,是代表是否吸煙的虛擬變量,race是關于是否是白人的虛擬變量,是關于是否是白人的虛擬變量,workplace按照工作場所的煙塵按照工作場所的煙塵等級劃分為三類,等級劃分為三類,1為最少,為最少,3為最多,為最多,sex是性別,是性別,1代表男性。最代表男性。最關鍵的變量是關鍵的變量是pop,表示具有該觀測值的個體的數(shù)量,比如,表示具有該觀測值的個體的數(shù)量,比如,pop=3,則意味著樣本中有則意味著樣本中有3個人具有該觀測值所揭示的性質。在這個數(shù)據(jù)集個人具有該觀測值所揭示的性質。在這個數(shù)據(jù)集中,中,pop的取值從的取
10、值從0到到507不等,其中不等,其中0說明沒有任何個體具有該觀測說明沒有任何個體具有該觀測值所揭示的性質,值所揭示的性質,507則說明有則說明有507個個體具有同樣的性質。我們鼓個個體具有同樣的性質。我們鼓勵讀者使用勵讀者使用codebook命令對這些變量的具體賦值更深入地考察。命令對這些變量的具體賦值更深入地考察。n 下面我們演示如何完成如下兩個創(chuàng)建多維表格的任務。下面我們演示如何完成如下兩個創(chuàng)建多維表格的任務。n (1)創(chuàng)建一個關于)創(chuàng)建一個關于workplace、smokes和和race的三維列聯(lián)表。的三維列聯(lián)表。n (2)創(chuàng)建一個關于)創(chuàng)建一個關于workplace、smokes、ra
11、ce和和sex的四維列聯(lián)表。的四維列聯(lián)表。Page 8STATA從入門到精通從入門到精通表6-4 數(shù)據(jù)集byssin1.dta(部分數(shù)據(jù))smokesraceworkplacepopprobsexyeswhitemost400.075Maleyeswhiteless740Femaleyeswhiteleast2600.007692Maleyesothermost1640.152439Femaleyesothermost240.083333Femaleyesotherless1470.013605Femaleyesotherleast2630.011407Malenowhitemost160Ma
12、lenowhiteless350Malenowhiteleast1340Femalenoothermost810.074074Malenootherless480.020833Femalenootherleast1230.00813Femalenowhitemost40MalePage 9STATA從入門到精通從入門到精通6.2.2使用使用tabulate命令進行列聯(lián)表分析命令進行列聯(lián)表分析1 一維一維tabulate命令命令n tabulate的一維命令主要用于生成含有頻數(shù)的一維表格,使用比較簡的一維命令主要用于生成含有頻數(shù)的一維表格,使用比較簡單,當我們想查看某個變量的賦值情況時,也可以使
13、用單,當我們想查看某個變量的賦值情況時,也可以使用tabulate來得來得到大體的印象。下面是這個命令的標準結構:到大體的印象。下面是這個命令的標準結構:n tabulate varname if in weight , tabulate1_optionsn 同之前一樣,同之前一樣,in和和if用于選擇樣本或者選擇范圍,用于選擇樣本或者選擇范圍,weight用于添加權用于添加權重。重。n tabulate一維命令還有一個配套的方便工具一維命令還有一個配套的方便工具tab1,在其后可以添,在其后可以添加多個變量,然后加多個變量,然后stata會對每個變量創(chuàng)建以為表格,也就是相當于會對每個變量創(chuàng)建
14、以為表格,也就是相當于多次執(zhí)行多次執(zhí)行tabulate命令。命令。tab1的結構如下:的結構如下:n tab1 varlist if in weight , tab1_optionsPage 10STATA從入門到精通從入門到精通n 【例【例6.3】使用】使用auto.dta數(shù)據(jù)創(chuàng)建數(shù)據(jù)創(chuàng)建rep78和和foreign的一維頻數(shù)表。的一維頻數(shù)表。Page 11STATA從入門到精通從入門到精通2 二維二維tabulate命令命令n 二維二維tabulate命令在生成二維表格的同時,可以計算多種獨立性檢驗命令在生成二維表格的同時,可以計算多種獨立性檢驗統(tǒng)計量和相關測量統(tǒng)計量,包括常用的統(tǒng)計量和相
15、關測量統(tǒng)計量,包括常用的Pearsons chi-squared、likelihood-ratio chi-squared、Cram s V、Fishers exact test、Goodman and Kruskals gamma、Kendalls tau-b,這些統(tǒng)計量,這些統(tǒng)計量在前面均介紹過。下面是該命令的標準格式:在前面均介紹過。下面是該命令的標準格式:n tabulate varname1 varname2 if in weight , optionsn 同之前一樣,同之前一樣,in和和if用于選擇樣本或者選擇范圍,用于選擇樣本或者選擇范圍,weight用于添加權用于添加權重。重。
16、n 同同tabulate的一維表格一樣,二維的一維表格一樣,二維tabulate命令也有命令也有tab2,可用于快,可用于快速生成速生成varlist中所羅列的變量所有可能的二維表格,中所羅列的變量所有可能的二維表格,tab2的標準格式的標準格式如下:如下:n tab2 varlist if in weight , optionsPage 12STATA從入門到精通從入門到精通n 【例【例6.4】利用關于肺炎的調(diào)查數(shù)據(jù)】利用關于肺炎的調(diào)查數(shù)據(jù)byssin1.dta來檢驗得肺炎概率與來檢驗得肺炎概率與是否抽煙、工作場所空氣質量這兩個變量之間的獨立性(當然,憑借是否抽煙、工作場所空氣質量這兩個變量
17、之間的獨立性(當然,憑借常識,它們應該是有關系的),即分別對常識,它們應該是有關系的),即分別對probcat和和smokes以及以及probcat和和workplace做標準的列聯(lián)分析。做標準的列聯(lián)分析。Page 13STATA從入門到精通從入門到精通6.3利用利用Stata生成包含描述性統(tǒng)計量的列表生成包含描述性統(tǒng)計量的列表6.3.1 tabstat命令命令n tabstat可以在一個表格中顯示多個變量的多種描述性統(tǒng)計量,這些可以在一個表格中顯示多個變量的多種描述性統(tǒng)計量,這些統(tǒng)計量包括平均數(shù)、最大最小值、極差、方差、標準差、偏度、峰度統(tǒng)計量包括平均數(shù)、最大最小值、極差、方差、標準差、偏度
18、、峰度以及各種百分位數(shù)。以及各種百分位數(shù)。tabstat是是summarize命令的替代選擇,前者比命令的替代選擇,前者比后者更加靈活,可以自由選擇表格中包含的統(tǒng)計量種類。通過添加后者更加靈活,可以自由選擇表格中包含的統(tǒng)計量種類。通過添加by(),tabstat對每類觀測值報告各自的統(tǒng)計量。對每類觀測值報告各自的統(tǒng)計量。n tabstat的標準格式如下:的標準格式如下:n tabstat varlist if in weight , optionsn 同之前一樣,同之前一樣,in和和if用于選擇樣本或者選擇范圍,用于選擇樣本或者選擇范圍,weight用于添加權用于添加權重。重。Page 14S
19、TATA從入門到精通從入門到精通n rangerange = max - minn mean平均數(shù)平均數(shù)n sd 標準差標準差n variance方差方差n semean 標準誤標準誤 (sd/sqrt(n)n sum 總和總和n count 觀測值個數(shù)觀測值個數(shù)n max min 最大值最大值 最小值最小值n median 中位數(shù)中位數(shù)n p# 各種百分位數(shù)各種百分位數(shù)n p 相當于相當于p25 p50 p75n iqr IQR四分位距四分位距Page 15STATA從入門到精通從入門到精通n 【例【例6-6】利用】利用auto.dta數(shù)據(jù)集完成如下兩個任務:數(shù)據(jù)集完成如下兩個任務:n (1)生成包含)生成包含price、weight、mpg、rep78的均值的表格。的均值的表格。n (2)對上述四個變量按照)對上述四個變量按照foreign分類報告平均數(shù)、標準差和最小值、分類報告平均數(shù)、標準差和最小值、最
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商務活動參與證明與成效報告(6篇)
- 以保護環(huán)境為題材的議論文作文11篇范文
- 互聯(lián)網(wǎng)培訓AI應用行業(yè)跨境出海項目商業(yè)計劃書
- 休閑車節(jié)能減排解決方案創(chuàng)新創(chuàng)業(yè)項目商業(yè)計劃書
- 醫(yī)療AI模型訓練與驗證平臺行業(yè)深度調(diào)研及發(fā)展項目商業(yè)計劃書
- 靶向抗癌新藥企業(yè)制定與實施新質生產(chǎn)力項目商業(yè)計劃書
- 陜西科技大學鎬京學院《商務數(shù)據(jù)分析》2023-2024學年第二學期期末試卷
- 朔州師范高等??茖W校《ERP沙盤模擬》2023-2024學年第二學期期末試卷
- 紹興文理學院元培學院《學前兒童科學活動設計與指導》2023-2024學年第二學期期末試卷
- 2025至2030中國民宿行業(yè)市場發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 病例對照研究設計和實施步驟
- T∕CWAN 0033-2021 鋁合金攪拌摩擦焊體積型缺陷相控陣超聲檢測規(guī)范
- 報廢機動車拆解有限公司應急預案
- FMEA第五版(實例2)
- 基于微信小程序的連連看小游戲的設計與實現(xiàn)
- 國際汽車貿(mào)易檢驗、檢疫、索賠、仲裁與不可抗力
- (完整版)詳細化學物質及其CAS注冊號清單
- 智障兒童的家庭教育(課堂PPT)
- 《電路分析基礎》試題及答案
- 生物多樣性影響評價規(guī)范
- 日本文學概論1
評論
0/150
提交評論