




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第八章第八章 列聯(lián)表、列聯(lián)表、c c2檢驗(yàn)和對數(shù)線性模型檢驗(yàn)和對數(shù)線性模型 .三維列聯(lián)表(關(guān)于某項(xiàng)政策調(diào)查所得結(jié)果:table7.txt)觀點(diǎn):贊成觀點(diǎn):不贊成低收入中等收入高收入低收入中等收入高收入男201055810女25157279.列聯(lián)表前面就是一個(gè)所謂的三維前面就是一個(gè)所謂的三維列聯(lián)表列聯(lián)表(contingency table).這些變量中這些變量中每個(gè)都有兩個(gè)或更多的可能取值每個(gè)都有兩個(gè)或更多的可能取值。這些取值也稱為。這些取值也稱為水水平平;比如收入有三個(gè)水平,觀點(diǎn)有兩個(gè)水平,性別有兩個(gè)水平等。;比如收入有三個(gè)水平,觀點(diǎn)有兩個(gè)水平,性別有兩個(gè)水平等。該表為該表為322列聯(lián)表列聯(lián)表
2、在下面在下面SPSS數(shù)據(jù)中,表就和上面的不同,收入的數(shù)據(jù)中,表就和上面的不同,收入的“低低”、“中中”、“高高”用代碼用代碼1、2、3代表;性別的代表;性別的“女女”、“男男”用用代碼代碼0、1代表;觀點(diǎn)代表;觀點(diǎn)“贊成贊成”和和“不贊成不贊成”用用1、0代表。有些計(jì)代表。有些計(jì)算機(jī)數(shù)據(jù)對于這些代碼的形式不限(算機(jī)數(shù)據(jù)對于這些代碼的形式不限(可以是數(shù)字,也可以是字符可以是數(shù)字,也可以是字符串串)。)。.列聯(lián)表列聯(lián)表的中間各個(gè)變量不同水平的交匯處,就是這種水列聯(lián)表的中間各個(gè)變量不同水平的交匯處,就是這種水平組合出現(xiàn)的頻數(shù)或平組合出現(xiàn)的頻數(shù)或計(jì)數(shù)計(jì)數(shù)(count)。)。二維的列聯(lián)表又稱為二維的列聯(lián)
3、表又稱為交叉表交叉表(cross table)。)。列聯(lián)表可以有很多維。維數(shù)多的叫做列聯(lián)表可以有很多維。維數(shù)多的叫做高維列聯(lián)表。高維列聯(lián)表。注意前面這個(gè)列聯(lián)表的變量都是定性變量注意前面這個(gè)列聯(lián)表的變量都是定性變量;但列聯(lián)表也會(huì)但列聯(lián)表也會(huì)帶有帶有定量變量作為協(xié)變量。定量變量作為協(xié)變量。.二維列聯(lián)表的檢驗(yàn) 研究列聯(lián)表的一個(gè)主要目的是看這些變量是否相研究列聯(lián)表的一個(gè)主要目的是看這些變量是否相關(guān)。比如關(guān)。比如前面例子中的前面例子中的收入和觀點(diǎn)收入和觀點(diǎn)是否相關(guān)是否相關(guān)。這需要形式上的檢驗(yàn)這需要形式上的檢驗(yàn).二維列聯(lián)表的檢驗(yàn) 下面表是把該例的三維表簡化成下面表是把該例的三維表簡化成只有收入和觀點(diǎn)只有收
4、入和觀點(diǎn)的二維表的二維表( (這是這是SPSS自動(dòng)轉(zhuǎn)化的自動(dòng)轉(zhuǎn)化的: :Analyze-Descriptive Statistics-Crosstabs-.).OPINION * INCOME CrosstabulationCount71519414525128252403112301OPINIONTotal123INCOMETotal.二維列聯(lián)表的檢驗(yàn)二維列聯(lián)表的檢驗(yàn)對于上面那樣的二維表。我們檢驗(yàn)的零假設(shè)和備選對于上面那樣的二維表。我們檢驗(yàn)的零假設(shè)和備選假設(shè)為假設(shè)為H H0 0:觀點(diǎn)和收入這兩個(gè)變量不相關(guān)觀點(diǎn)和收入這兩個(gè)變量不相關(guān);H H1 1:這兩個(gè)變量相關(guān)。這兩個(gè)變量相關(guān)。這里的檢驗(yàn)統(tǒng)計(jì)
5、量在零假設(shè)下有(大樣本時(shí))這里的檢驗(yàn)統(tǒng)計(jì)量在零假設(shè)下有(大樣本時(shí))近似近似的的c c2 2分布。分布。當(dāng)該統(tǒng)計(jì)量很大時(shí)或當(dāng)該統(tǒng)計(jì)量很大時(shí)或p p- -值很小時(shí),就可以拒絕零假值很小時(shí),就可以拒絕零假設(shè),認(rèn)為兩個(gè)變量相關(guān)。設(shè),認(rèn)為兩個(gè)變量相關(guān)。.二維列聯(lián)表的檢驗(yàn)二維列聯(lián)表的檢驗(yàn)實(shí)際上有不止一個(gè)實(shí)際上有不止一個(gè)c c2 2檢驗(yàn)統(tǒng)計(jì)量。包括檢驗(yàn)統(tǒng)計(jì)量。包括Pearson c c2 2統(tǒng)計(jì)量統(tǒng)計(jì)量和和似然比似然比(likelihood ratio)c c2 2統(tǒng)計(jì)量統(tǒng)計(jì)量;它們都有漸近的;它們都有漸近的c c2 2分布。分布。對于我們的數(shù)據(jù),根據(jù)計(jì)算可以得到(對于對于我們的數(shù)據(jù),根據(jù)計(jì)算可以得到(對于
6、這兩個(gè)統(tǒng)計(jì)量均有)這兩個(gè)統(tǒng)計(jì)量均有)p p- -值小于值小于0.0010.001。因此。因此可以說,收入高低的確影響觀點(diǎn)。可以說,收入高低的確影響觀點(diǎn)。 .21niiiiOEQE12lnniiiiOTOEPearson c c2 2統(tǒng)計(jì)量統(tǒng)計(jì)量似然比似然比c c2 2統(tǒng)計(jì)量統(tǒng)計(jì)量.二維列聯(lián)表的檢驗(yàn)二維列聯(lián)表的檢驗(yàn)剛才說,這些剛才說,這些c c2 2統(tǒng)計(jì)量是近似的,那么統(tǒng)計(jì)量是近似的,那么有沒有精有沒有精確的統(tǒng)計(jì)量呢?確的統(tǒng)計(jì)量呢?當(dāng)然有。這個(gè)檢驗(yàn)稱為當(dāng)然有。這個(gè)檢驗(yàn)稱為FisherFisher精確檢驗(yàn)精確檢驗(yàn);它不是;它不是c c2 2分布,而是分布,而是超幾何分布超幾何分布。對本問題對本問題
7、, ,計(jì)算計(jì)算FisherFisher統(tǒng)計(jì)量得到的統(tǒng)計(jì)量得到的p p- -值也小于值也小于0.0010.001。FisherFisher精確檢驗(yàn)的又一例子精確檢驗(yàn)的又一例子.二維列聯(lián)表的檢驗(yàn)二維列聯(lián)表的檢驗(yàn)聰明的同學(xué)必然會(huì)問,既然有精確檢驗(yàn)聰明的同學(xué)必然會(huì)問,既然有精確檢驗(yàn)為什么為什么還要用近似的還要用近似的c c2 2檢驗(yàn)?zāi)兀繖z驗(yàn)?zāi)兀窟@是因?yàn)楫?dāng)數(shù)目很大時(shí),超幾何分布計(jì)算相當(dāng)緩慢(比近似這是因?yàn)楫?dāng)數(shù)目很大時(shí),超幾何分布計(jì)算相當(dāng)緩慢(比近似計(jì)算會(huì)差很多倍的時(shí)間);而且在計(jì)算機(jī)速度不快時(shí),根本計(jì)算會(huì)差很多倍的時(shí)間);而且在計(jì)算機(jī)速度不快時(shí),根本無法計(jì)算。因此人們多用大樣本近似的無法計(jì)算。因此人們多
8、用大樣本近似的c c2 2統(tǒng)計(jì)量。而列聯(lián)表統(tǒng)計(jì)量。而列聯(lián)表的有關(guān)檢驗(yàn)也和的有關(guān)檢驗(yàn)也和c c2 2檢驗(yàn)聯(lián)系起來了。檢驗(yàn)聯(lián)系起來了。.具體運(yùn)算:先加權(quán),加權(quán)之后,按照次序選具體運(yùn)算:先加權(quán),加權(quán)之后,按照次序選AnalyzeDescriptive StatisticsCrosstabs。在打開的對話框中,把在打開的對話框中,把opinion和和income分別選入分別選入Row(行)(行)和和Column(列);至于哪個(gè)放入行或哪個(gè)放入列是沒有關(guān)系(列);至于哪個(gè)放入行或哪個(gè)放入列是沒有關(guān)系的。的。如果要如果要Fisher精確檢驗(yàn)則可以點(diǎn)精確檢驗(yàn)則可以點(diǎn)Exact,另外在,另外在Statisti
9、cs中選擇中選擇Chi-square,以得到,以得到c c2檢驗(yàn)結(jié)果。檢驗(yàn)結(jié)果。最后點(diǎn)擊最后點(diǎn)擊OK之后,就得到之后,就得到有關(guān)有關(guān)Pearson c c2統(tǒng)計(jì)量、似然比統(tǒng)計(jì)量、似然比c c2統(tǒng)計(jì)量以及統(tǒng)計(jì)量以及Fisher統(tǒng)計(jì)量的統(tǒng)計(jì)量的輸出了輸出了( (這里的這里的Sig就是就是p-值值) )。 .Chi-Square Tests20.456a2.000.00021.1902.000.00020.713.00020.290b1.000.000.000.000123Pearson Chi-SquareLikelihood RatioFishers Exact TestLinear-by-Li
10、nearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)PointProbability0 cells (.0%) have expected count less than 5. The minimum expected count is 10.33.a. The standardized statistic is -4.504.b. 下面就是下面就是SPSSSPSS計(jì)算機(jī)對于這個(gè)問題的輸出計(jì)算機(jī)對于這個(gè)問題的輸出.高維列聯(lián)表和高維列聯(lián)表和( (多項(xiàng)分布多項(xiàng)
11、分布) )對數(shù)線性模型對數(shù)線性模型 前面例子前面例子原始數(shù)據(jù)是個(gè)三維列聯(lián)表,其檢驗(yàn)和對兩維類原始數(shù)據(jù)是個(gè)三維列聯(lián)表,其檢驗(yàn)和對兩維類似。似。但高維列聯(lián)表在計(jì)算機(jī)軟件的選項(xiàng)上有所不同,而且可但高維列聯(lián)表在計(jì)算機(jī)軟件的選項(xiàng)上有所不同,而且可以構(gòu)造一個(gè)所謂以構(gòu)造一個(gè)所謂( (多項(xiàng)分布多項(xiàng)分布) )對數(shù)線性模型對數(shù)線性模型(loglinear model)來進(jìn)行分析。來進(jìn)行分析。利用對數(shù)線性模型的好處是不僅可以直接進(jìn)行預(yù)測,而利用對數(shù)線性模型的好處是不僅可以直接進(jìn)行預(yù)測,而且可以增加且可以增加定量變量作為模型自變量的一部分。定量變量作為模型自變量的一部分。.對數(shù)線性模型對數(shù)線性模型現(xiàn)在簡單直觀地通過二
12、維表介紹一下對數(shù)線性模型,假現(xiàn)在簡單直觀地通過二維表介紹一下對數(shù)線性模型,假定不同的行代表第一個(gè)變量的不同水平,而不同的列代定不同的行代表第一個(gè)變量的不同水平,而不同的列代表第二個(gè)變量的不同水平。用表第二個(gè)變量的不同水平。用mij代表二維列聯(lián)表第代表二維列聯(lián)表第i行,行,第第j列的頻數(shù)。人們常假定這個(gè)頻數(shù)可以用下面的公式來列的頻數(shù)。人們常假定這個(gè)頻數(shù)可以用下面的公式來確定:確定:ln()ijijijm這就是所謂的對數(shù)線性模型。這里這就是所謂的對數(shù)線性模型。這里 i i為行變量的第為行變量的第i個(gè)水平對個(gè)水平對ln(mln(mijij) )的影響,而的影響,而 j j為列變量的第為列變量的第j個(gè)
13、水平對個(gè)水平對ln(mln(mijij) )的影響,這兩的影響,這兩個(gè)影響稱個(gè)影響稱為主效應(yīng)(為主效應(yīng)(main effect); ijij代表隨機(jī)誤差。代表隨機(jī)誤差。 .( (多項(xiàng)分布多項(xiàng)分布) )對數(shù)線性模型對數(shù)線性模型該模型看上去和回歸模型很象,但由于分布假設(shè)不同,不能簡單該模型看上去和回歸模型很象,但由于分布假設(shè)不同,不能簡單地用線性回歸的方法來套用地用線性回歸的方法來套用( (和和LogisticLogistic回歸類似回歸類似) );計(jì)算過程也;計(jì)算過程也很不一樣很不一樣( (把這個(gè)留給計(jì)算機(jī)去操心把這個(gè)留給計(jì)算機(jī)去操心) )。只要利用數(shù)據(jù)來擬合這個(gè)。只要利用數(shù)據(jù)來擬合這個(gè)模型就可
14、以得到對于參數(shù)模型就可以得到對于參數(shù)m m的估計(jì)的估計(jì)( (沒有意義沒有意義) ),以及,以及 i i和和 j j的的“估估計(jì)計(jì)”。有了估計(jì)的參數(shù),就可以預(yù)測出任何有了估計(jì)的參數(shù),就可以預(yù)測出任何i i,j j水平組合的頻數(shù)水平組合的頻數(shù)m mijij了了( (通過對數(shù)通過對數(shù)) ).( (多項(xiàng)分布多項(xiàng)分布) )對數(shù)線性模型對數(shù)線性模型注意,這里的估計(jì)之所以打引號是因?yàn)橐粋€(gè)變量注意,這里的估計(jì)之所以打引號是因?yàn)橐粋€(gè)變量的各個(gè)水平的影響是相對的的各個(gè)水平的影響是相對的, ,只有事先固定一個(gè)參數(shù)值只有事先固定一個(gè)參數(shù)值( (比如比如 1 1=0=0),),或者設(shè)定或者設(shè)定類似于類似于SSi i=0
15、=0這樣的約束,才可能估計(jì)出各個(gè)的這樣的約束,才可能估計(jì)出各個(gè)的值。值。沒有約束,這些參數(shù)是估計(jì)不出來的。沒有約束,這些參數(shù)是估計(jì)不出來的。 .(多項(xiàng)分布)對數(shù)線性模型(多項(xiàng)分布)對數(shù)線性模型二維列聯(lián)表的更完全的對數(shù)線性模型為二維列聯(lián)表的更完全的對數(shù)線性模型為ln()()ijijijijm 這里的這里的( (ijij代表第一個(gè)變量的第代表第一個(gè)變量的第i i個(gè)水平和第二個(gè)變量個(gè)水平和第二個(gè)變量的第的第j j個(gè)水平對個(gè)水平對ln(mln(mijij) )的共同影響,稱為的共同影響,稱為交叉效應(yīng)交叉效應(yīng)。即。即當(dāng)單獨(dú)作用時(shí),每變量的某水平對當(dāng)單獨(dú)作用時(shí),每變量的某水平對ln(mln(mijij)
16、)的影響只有的影響只有 i i( (或或 j j) )大,但如這兩個(gè)變量共同影響就不僅是大,但如這兩個(gè)變量共同影響就不僅是 i i+ + j j,而且還多出一項(xiàng)。而且還多出一項(xiàng)。 這里的交叉項(xiàng)的諸參數(shù)的大小也是相對的,也需要這里的交叉項(xiàng)的諸參數(shù)的大小也是相對的,也需要約束約束條件條件來得到其來得到其“估計(jì)估計(jì)” 。.用用table7.txttable7.txt數(shù)據(jù)擬合對數(shù)線性模型數(shù)據(jù)擬合對數(shù)線性模型假定(多項(xiàng)分布)對數(shù)線性模型為假定(多項(xiàng)分布)對數(shù)線性模型為 這里這里 i為收入(為收入(i1,2,31,2,3代表收入的低、中、高三個(gè)水平),代表收入的低、中、高三個(gè)水平), j為為觀點(diǎn)(觀點(diǎn)(j
17、1,21,2代表不贊成和贊成兩個(gè)水平),代表不贊成和贊成兩個(gè)水平),g gk為性別(為性別(k1,21,2代代表女性和男性兩個(gè)水平)表女性和男性兩個(gè)水平), , mijk代表三維列聯(lián)表對于三個(gè)變量的第代表三維列聯(lián)表對于三個(gè)變量的第ijk水平組合的出現(xiàn)次數(shù),水平組合的出現(xiàn)次數(shù), ijk為殘差為殘差 而從相應(yīng)的參數(shù)估計(jì)輸出結(jié)果,可以得到對而從相應(yīng)的參數(shù)估計(jì)輸出結(jié)果,可以得到對 i i的三個(gè)值的估計(jì)為的三個(gè)值的估計(jì)為0.5173, 0.2549,0.0000,0.5173, 0.2549,0.0000,對對 j j的兩個(gè)值的估計(jì)為的兩個(gè)值的估計(jì)為- -0.6931,0.0000,0.6931,0.0
18、000,對對g gk k的兩個(gè)值的估計(jì)為的兩個(gè)值的估計(jì)為 0.1139,0.00000.1139,0.0000。( (多項(xiàng)多項(xiàng)對數(shù)線性模型無常數(shù)項(xiàng)對數(shù)線性模型無常數(shù)項(xiàng)) )ln()ijkijkijkmg.對數(shù)線性模型對數(shù)線性模型高維表的檢驗(yàn)統(tǒng)計(jì)量和二維表一樣也包含了高維表的檢驗(yàn)統(tǒng)計(jì)量和二維表一樣也包含了Pearson c c2統(tǒng)計(jì)量和似然比統(tǒng)計(jì)量和似然比c c2統(tǒng)計(jì)量統(tǒng)計(jì)量, , 檢驗(yàn)對數(shù)線性模型擬合檢驗(yàn)對數(shù)線性模型擬合的好壞程度的。的好壞程度的。 就我們這里的三維列聯(lián)表問題,如果只考慮各個(gè)變量就我們這里的三維列聯(lián)表問題,如果只考慮各個(gè)變量單獨(dú)的影響,而不考慮變量組合的綜合影響,計(jì)算機(jī)單獨(dú)的影
19、響,而不考慮變量組合的綜合影響,計(jì)算機(jī)輸出的輸出的Pearson c c2統(tǒng)計(jì)量和似然比統(tǒng)計(jì)量和似然比c c2統(tǒng)計(jì)量得到的統(tǒng)計(jì)量得到的p-值分別為值分別為0.0029和和0.0011。 .多項(xiàng)分布對數(shù)線性模型的SPSS實(shí)現(xiàn)數(shù)據(jù)數(shù)據(jù)table7.sav 假定已經(jīng)加權(quán)假定已經(jīng)加權(quán) (加權(quán)一次并存盤了既可加權(quán)一次并存盤了既可) 這時(shí)的選項(xiàng)為這時(shí)的選項(xiàng)為AnalyzeLoglinearGeneral,首先選擇格子中頻數(shù)的分布首先選擇格子中頻數(shù)的分布,這里是多項(xiàng)分布這里是多項(xiàng)分布 (其默認(rèn)值是其默認(rèn)值是Poisson對數(shù)線性模型對數(shù)線性模型).然后把三個(gè)變量然后把三個(gè)變量(sex,opinion,inc
20、ome)選入選入Factors(因子因子);再選再選Model(模型模型),如果選,如果選Saturated(飽和模型飽和模型),那就是所有交叉那就是所有交叉效應(yīng)都要放入模型效應(yīng)都要放入模型;但如果不想這樣但如果不想這樣,可以選可以選Custom(自定義自定義),在在Building Terms(構(gòu)造模型的項(xiàng)構(gòu)造模型的項(xiàng))選選Main effect(主效應(yīng)主效應(yīng)),再把三個(gè)再把三個(gè)變量一個(gè)一個(gè)地選進(jìn)來變量一個(gè)一個(gè)地選進(jìn)來(如果兩個(gè)或三個(gè)一同選入,等于選入交叉如果兩個(gè)或三個(gè)一同選入,等于選入交叉效應(yīng)效應(yīng)).如果想要知道模型參數(shù),在如果想要知道模型參數(shù),在Options中選擇中選擇Estimate
21、s。最后最后Continue-OK即可得出結(jié)果即可得出結(jié)果.在計(jì)算機(jī)輸出的結(jié)果中可以找到我們感興趣的結(jié)果。在計(jì)算機(jī)輸出的結(jié)果中可以找到我們感興趣的結(jié)果。如果如果SPSS的的Viewer輸出不完全,可以選中不完全的輸出,利用輸出不完全,可以選中不完全的輸出,利用Edit-Copy Objects來復(fù)制到例如記事本那樣的文件中,就可以來復(fù)制到例如記事本那樣的文件中,就可以看到完整輸出了看到完整輸出了.注意,無論你對模型假定了多少種效應(yīng),并注意,無論你對模型假定了多少種效應(yīng),并不見得都有意義;有些可能是多余的。本來不見得都有意義;有些可能是多余的。本來沒有交叉影響,但如果寫入,也沒有關(guān)系,沒有交叉影
22、響,但如果寫入,也沒有關(guān)系,在分析過程中一般可以知道哪些影響是顯著在分析過程中一般可以知道哪些影響是顯著的,而那些是不顯著的。然后可決定舍取變的,而那些是不顯著的。然后可決定舍取變量。量。 .另一種對數(shù)線性模型另一種對數(shù)線性模型常用的對數(shù)線性模型主要是兩種常用的對數(shù)線性模型主要是兩種, ,我們已經(jīng)介紹我們已經(jīng)介紹了了多項(xiàng)分布多項(xiàng)分布對數(shù)線性模型對數(shù)線性模型(格子里面的頻數(shù)滿足多格子里面的頻數(shù)滿足多項(xiàng)分布項(xiàng)分布) )。另一類為另一類為PoissonPoisson對數(shù)線性模型對數(shù)線性模型. .它假定每個(gè)格子它假定每個(gè)格子里面的頻數(shù)滿足一里面的頻數(shù)滿足一個(gè)個(gè)PoissonPoisson分布分布. .
23、在統(tǒng)計(jì)軟件的選項(xiàng)中會(huì)有關(guān)于分布的選項(xiàng)的。在統(tǒng)計(jì)軟件的選項(xiàng)中會(huì)有關(guān)于分布的選項(xiàng)的。. Poison Poison對數(shù)線性模型對數(shù)線性模型 有的時(shí)候,類似的高維表并不一定滿足多項(xiàng)分布對數(shù)線性模型。下面例子是有的時(shí)候,類似的高維表并不一定滿足多項(xiàng)分布對數(shù)線性模型。下面例子是關(guān)于哮喘病人個(gè)數(shù)和空氣污染程度,年齡和性別的數(shù)據(jù)(關(guān)于哮喘病人個(gè)數(shù)和空氣污染程度,年齡和性別的數(shù)據(jù)(asthma.txt)數(shù)據(jù)為某地在一段時(shí)間記錄下來的數(shù)據(jù)為某地在一段時(shí)間記錄下來的60組在不同空氣污染狀態(tài)的不同年齡及不組在不同空氣污染狀態(tài)的不同年齡及不同性別的人的發(fā)生哮喘的人數(shù)。同性別的人的發(fā)生哮喘的人數(shù)。. Poison Po
24、ison對數(shù)線性模型對數(shù)線性模型 其中性別為定性變量其中性別為定性變量S(sex, 1代表女性,代表女性,2代表男性),代表男性),空氣污染程度空氣污染程度P也是定性變量(也是定性變量(polut, 1、2、3分別代表分別代表輕度、中度和嚴(yán)重污染),輕度、中度和嚴(yán)重污染),年齡年齡A (age)為定量變量,為那一組人的平均年齡;為定量變量,為那一組人的平均年齡;數(shù)目數(shù)目C (count)為相應(yīng)組的哮喘人數(shù)。為相應(yīng)組的哮喘人數(shù)。該表格和前面的列聯(lián)表的不同點(diǎn)在于每一格的計(jì)數(shù)并不該表格和前面的列聯(lián)表的不同點(diǎn)在于每一格的計(jì)數(shù)并不簡單是前面三個(gè)變量的組合的數(shù)目(某個(gè)年齡段,某種簡單是前面三個(gè)變量的組合的
25、數(shù)目(某個(gè)年齡段,某種性別及某種污染下的人數(shù)),而是代表了某個(gè)年齡段,性別及某種污染下的人數(shù)),而是代表了某個(gè)年齡段,某種性別及某種污染下發(fā)生哮喘的人數(shù)。某種性別及某種污染下發(fā)生哮喘的人數(shù)。 .Poisson對數(shù)線性模型假定哮喘發(fā)生服從假定哮喘發(fā)生服從PoissonPoisson分布;但是由于條件不同,分布;但是由于條件不同,PoissonPoisson分布的參數(shù)分布的參數(shù)l l也應(yīng)該隨著條件的變化而改變。這里的也應(yīng)該隨著條件的變化而改變。這里的條件就是給出的性別、空氣污染程度與年齡。當(dāng)然,如何影條件就是給出的性別、空氣污染程度與年齡。當(dāng)然,如何影響以及這些條件影響是否顯著則是我們所關(guān)心的。這
26、個(gè)模型響以及這些條件影響是否顯著則是我們所關(guān)心的。這個(gè)模型可以寫成可以寫成 這里這里m m為常數(shù)項(xiàng),為常數(shù)項(xiàng), i i為性別(為性別(i=1,2i=1,2分別代表女性和男性兩個(gè)水分別代表女性和男性兩個(gè)水平),平), j j為空氣污染程度(為空氣污染程度(j=1,2,3j=1,2,3代表低、中高三個(gè)污染水代表低、中高三個(gè)污染水平),平),x x為連續(xù)變量年齡,而為連續(xù)變量年齡,而g g為年齡前面的系數(shù),為年齡前面的系數(shù), ijij為殘差項(xiàng)。為殘差項(xiàng)。 ln( )ijijxlmg.PoissonPoisson對數(shù)線性模型對數(shù)線性模型從對于數(shù)據(jù)從對于數(shù)據(jù)(asthma.txt)(asthma.txt
27、)的的PoissonPoisson對數(shù)線性模型對數(shù)線性模型的相應(yīng)的相應(yīng)SPSSSPSS輸出,可以得到對輸出,可以得到對m m的估計(jì)為的估計(jì)為4.98204.9820,對對 i i的兩個(gè)值的的兩個(gè)值的“估計(jì)估計(jì)”為為-0.0608-0.0608、 0.00000.0000,對對 j j的三個(gè)值的的三個(gè)值的“估計(jì)估計(jì)”為為-0.1484-0.1484,0.12230.1223、0.00000.0000,對,對g g的估計(jì)為的估計(jì)為 0.01260.0126。注意,這里的對主效應(yīng)注意,這里的對主效應(yīng) I I和和 j j的估計(jì)只有相對意的估計(jì)只有相對意義;它們在一個(gè)參數(shù)為義;它們在一個(gè)參數(shù)為0 0的約
28、束條件下得到的。的約束條件下得到的。.PoissonPoisson對數(shù)線性模型對數(shù)線性模型看來,年齡和性別對哮喘影響不很顯著。輕度污染顯看來,年齡和性別對哮喘影響不很顯著。輕度污染顯然比中度污染和嚴(yán)重污染哮喘要好。但是似乎嚴(yán)重污然比中度污染和嚴(yán)重污染哮喘要好。但是似乎嚴(yán)重污染時(shí)哮喘稍微比中度污染少些染時(shí)哮喘稍微比中度污染少些( (不顯著不顯著) )。通過更進(jìn)一步的分析通過更進(jìn)一步的分析(這里略這里略),可以發(fā)現(xiàn),中度和嚴(yán),可以發(fā)現(xiàn),中度和嚴(yán)重空氣污染(無論單獨(dú)還是一起)和輕度空氣污染比重空氣污染(無論單獨(dú)還是一起)和輕度空氣污染比較都顯著增加哮喘人數(shù),而中度及嚴(yán)重污染時(shí)的哮喘較都顯著增加哮喘人
29、數(shù),而中度及嚴(yán)重污染時(shí)的哮喘人數(shù)并沒有顯著區(qū)別。人數(shù)并沒有顯著區(qū)別。.Poisson對數(shù)線性模型的對數(shù)線性模型的SPSS實(shí)現(xiàn)實(shí)現(xiàn)數(shù)據(jù)數(shù)據(jù)asthma.sav 假定已經(jīng)加權(quán)假定已經(jīng)加權(quán) 這時(shí)的選項(xiàng)為這時(shí)的選項(xiàng)為AnalyzeLoglinearGeneral,首先選擇格子中頻數(shù)的分布首先選擇格子中頻數(shù)的分布,這里是這里是Poisson分布。分布。然后把兩個(gè)變量(然后把兩個(gè)變量(sex,polut)選入)選入Factors(因子),把(因子),把a(bǔ)ge選入選入Cell Covariate(s)。再選再選Model(模型),這里以選(模型),這里以選Custom(自定義),在(自定義),在Buildi
30、ng Terms(構(gòu)造模型的項(xiàng))選(構(gòu)造模型的項(xiàng))選Main effect(主效應(yīng)),再把三個(gè)變量一個(gè)一個(gè)地選(主效應(yīng)),再把三個(gè)變量一個(gè)一個(gè)地選進(jìn)來。進(jìn)來。如果想要知道模型參數(shù),在如果想要知道模型參數(shù),在Options中選擇中選擇Estimates。最后。最后Continue-OK即可得出結(jié)果。即可得出結(jié)果。在結(jié)果中可以找到有關(guān)在結(jié)果中可以找到有關(guān)Pearson c c2統(tǒng)計(jì)量和似然比統(tǒng)計(jì)量和似然比c c2統(tǒng)計(jì)量的檢驗(yàn)結(jié)果及統(tǒng)計(jì)量的檢驗(yàn)結(jié)果及參數(shù)的估計(jì)(如果參數(shù)的估計(jì)(如果SPSS的的Viewer輸出不完全,可以選中不完全的輸出,輸出不完全,可以選中不完全的輸出,利用利用Edit-Copy Objects來復(fù)制到例如記事本那樣的文件中,就可以看到完來復(fù)制到例如記事本那樣的文件中,就可以看到完整輸出了)。整輸出了)。.思考:列聯(lián)表與Poisson對數(shù)線性模型,以及后面要介紹的試驗(yàn)設(shè)計(jì)的數(shù)據(jù)表有什么區(qū)別?.Fisher精確檢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 IEC 60730-2-8:2025 EXV EN Automatic electrical controls - Part 2-8: Particular requirements for electrically operated water valves,including mechanical requirements
- 【正版授權(quán)】 IEC 60530:1975 EN-D Methods for measuring the performance of electric kettles and jugs for household and similar use
- 【正版授權(quán)】 IEC 60335-2-4:2023 EXV-RLV EN Household and similar electrical appliances - Safety - Part 2-4: Particular requirements for spin extractors
- 產(chǎn)品開發(fā)進(jìn)度跟蹤表-新產(chǎn)品開發(fā)流程
- 薪資詳情與獎(jiǎng)金補(bǔ)助證明書(6篇)
- 移民招聘考試試題及答案
- 醫(yī)院中級考試試題及答案
- 六一創(chuàng)意集體活動(dòng)方案
- 六一夾珠子活動(dòng)方案
- 醫(yī)學(xué)考試試題及答案詳解
- 中國古典詩文朗誦與吟誦-江蘇師范大學(xué)中國大學(xué)mooc課后章節(jié)答案期末考試題庫2023年
- 景觀道路專項(xiàng)施工方案模板
- 器械科-醫(yī)療設(shè)備維修應(yīng)用PDCA循環(huán)管理品管圈QCC成果匯報(bào)
- 現(xiàn)代物流管理(第三版-錢廷仙)課件5.物流成本分析內(nèi)容與方法
- 基于單片機(jī)的PWM直流電機(jī)調(diào)速系統(tǒng)設(shè)計(jì)
- 思想政治理論綜合實(shí)踐智慧樹知到答案章節(jié)測試2023年太原理工大學(xué)
- 資產(chǎn)托管業(yè)務(wù)流程
- 13.人物描寫一組《摔跤》說課稿
- 變態(tài)心理學(xué)習(xí)題答案完整版
- GB/T 19632-2005殯葬服務(wù)、設(shè)施、用品分類與代碼
- GA/T 850-2021城市道路路內(nèi)停車位設(shè)置規(guī)范
評論
0/150
提交評論