




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 第十章第十章 其它抽樣方法技術(shù)其它抽樣方法技術(shù)本章要點(diǎn)本章要點(diǎn) 本章主要對(duì)樣本輪換、雙重抽樣、隨機(jī)化本章主要對(duì)樣本輪換、雙重抽樣、隨機(jī)化裝置、交叉子樣本等抽樣技術(shù)原理、方法、裝置、交叉子樣本等抽樣技術(shù)原理、方法、特點(diǎn)及應(yīng)用條件進(jìn)行了較為全面的介紹。具特點(diǎn)及應(yīng)用條件進(jìn)行了較為全面的介紹。具體要求體要求: 掌握本章所介紹的幾種抽樣技術(shù)的特點(diǎn)及掌握本章所介紹的幾種抽樣技術(shù)的特點(diǎn)及應(yīng)用條件,在抽樣實(shí)際工作中能夠正確運(yùn)用應(yīng)用條件,在抽樣實(shí)際工作中能夠正確運(yùn)用該種技術(shù),提高估計(jì)的精度與效果。該種技術(shù),提高估計(jì)的精度與效果。第一節(jié)第一節(jié) 樣本輪換樣本輪換第二節(jié)第二節(jié) 雙重抽樣雙重抽樣第三節(jié)第三節(jié) 隨機(jī)化裝
2、置隨機(jī)化裝置 第四節(jié)第四節(jié) 交叉子樣本交叉子樣本 抽樣調(diào)查除了對(duì)總體的一次性抽樣以外,很多重要的抽樣調(diào)查除了對(duì)總體的一次性抽樣以外,很多重要的調(diào)查是隔一段時(shí)間重復(fù)進(jìn)行的調(diào)查是隔一段時(shí)間重復(fù)進(jìn)行的, ,對(duì)于這種經(jīng)常性的抽樣問(wèn)對(duì)于這種經(jīng)常性的抽樣問(wèn)題,就必須重視其樣本輪換問(wèn)題的研究。題,就必須重視其樣本輪換問(wèn)題的研究。 對(duì)于樣本輪換問(wèn)題,我們至少應(yīng)考慮以下問(wèn)題:每次對(duì)于樣本輪換問(wèn)題,我們至少應(yīng)考慮以下問(wèn)題:每次調(diào)查的樣本如何組成?是采用固定樣本還是采用全新的調(diào)查的樣本如何組成?是采用固定樣本還是采用全新的樣本,或者是部分保留部分替換,即樣本輪換;在估計(jì)樣本,或者是部分保留部分替換,即樣本輪換;在估
3、計(jì)后期的總量或均值時(shí),是否需要利用前期的信息來(lái)改進(jìn)后期的總量或均值時(shí),是否需要利用前期的信息來(lái)改進(jìn)現(xiàn)期的估計(jì),以及如何利用;如果采用樣本輪換的方法,現(xiàn)期的估計(jì),以及如何利用;如果采用樣本輪換的方法,如何確定最優(yōu)的保留比例或替換比例。如何確定最優(yōu)的保留比例或替換比例。 第一節(jié)第一節(jié) 樣本輪換樣本輪換 一、樣本輪換的原因一、樣本輪換的原因 如果是單純地估計(jì)現(xiàn)值的情況,當(dāng)然最好每次重新抽取新如果是單純地估計(jì)現(xiàn)值的情況,當(dāng)然最好每次重新抽取新樣本,這樣必然會(huì)增加費(fèi)用;如果要逐期地與上期比較,則采樣本,這樣必然會(huì)增加費(fèi)用;如果要逐期地與上期比較,則采用固定樣本的方法為好,固定樣本可以消除樣本的因素而只觀
4、用固定樣本的方法為好,固定樣本可以消除樣本的因素而只觀察動(dòng)態(tài)的變化。然而,樣本長(zhǎng)期不變,隨著時(shí)間的推移,固定察動(dòng)態(tài)的變化。然而,樣本長(zhǎng)期不變,隨著時(shí)間的推移,固定樣本會(huì)顯露它的弊端,既難以反映總體的變化,而且受訪者也樣本會(huì)顯露它的弊端,既難以反映總體的變化,而且受訪者也會(huì)產(chǎn)生厭煩心理,出現(xiàn)不合作或回答質(zhì)量下降等問(wèn)題,從而影會(huì)產(chǎn)生厭煩心理,出現(xiàn)不合作或回答質(zhì)量下降等問(wèn)題,從而影響調(diào)查質(zhì)響調(diào)查質(zhì)量。另外,無(wú)論是采用固定樣本還是全新樣本都難以量。另外,無(wú)論是采用固定樣本還是全新樣本都難以正確地反映總體在各個(gè)不同時(shí)間上的水平及變化,因此,一種正確地反映總體在各個(gè)不同時(shí)間上的水平及變化,因此,一種廣泛采
5、用的方法是樣本輪換,即每隔一定時(shí)間(一個(gè)月、一季廣泛采用的方法是樣本輪換,即每隔一定時(shí)間(一個(gè)月、一季或一年)更換一定比例的單元,保留其余單元。或一年)更換一定比例的單元,保留其余單元。第一節(jié)第一節(jié) 樣本輪換樣本輪換 二、樣本輪換的最優(yōu)比例二、樣本輪換的最優(yōu)比例第一個(gè)時(shí)期采用有放回簡(jiǎn)單隨機(jī)抽樣方式抽出樣本量為第一個(gè)時(shí)期采用有放回簡(jiǎn)單隨機(jī)抽樣方式抽出樣本量為n n的樣本;在第二個(gè)時(shí)期采用有放回簡(jiǎn)單隨機(jī)抽樣方式選的樣本;在第二個(gè)時(shí)期采用有放回簡(jiǎn)單隨機(jī)抽樣方式選出樣本量為出樣本量為nqnq的舊有樣本點(diǎn)以便替換掉,即保留的樣本的舊有樣本點(diǎn)以便替換掉,即保留的樣本量為量為npnp,保留樣本的比例為,保留
6、樣本的比例為p p,同時(shí)獨(dú)立地依有放回簡(jiǎn)單,同時(shí)獨(dú)立地依有放回簡(jiǎn)單隨機(jī)樣本方式補(bǔ)充新的隨機(jī)樣本方式補(bǔ)充新的nqnq個(gè)新樣本點(diǎn),這里個(gè)新樣本點(diǎn),這里p+q=1p+q=1,這樣,這樣第二個(gè)時(shí)期的樣本量仍舊為第二個(gè)時(shí)期的樣本量仍舊為n n。設(shè)。設(shè): 第一節(jié)第一節(jié) 樣本輪換樣本輪換 為第一個(gè)時(shí)期與第二個(gè)時(shí)期相同的為第一個(gè)時(shí)期與第二個(gè)時(shí)期相同的npnp個(gè)單元在第一個(gè)時(shí)期個(gè)單元在第一個(gè)時(shí)期的均值。的均值。 為第一個(gè)時(shí)期為第一個(gè)時(shí)期nq個(gè)單元在第一個(gè)時(shí)期的均值。個(gè)單元在第一個(gè)時(shí)期的均值。 為為np個(gè)單元在第二個(gè)時(shí)期的樣本均值。個(gè)單元在第二個(gè)時(shí)期的樣本均值。 為為nq個(gè)補(bǔ)充單元在第二個(gè)時(shí)期的樣本均值。個(gè)補(bǔ)充單
7、元在第二個(gè)時(shí)期的樣本均值。為為 和和 之間的相關(guān)系數(shù)。之間的相關(guān)系數(shù)。 如果希望估計(jì)第二個(gè)時(shí)期的樣本均值并充分利用第一個(gè)時(shí)如果希望估計(jì)第二個(gè)時(shí)期的樣本均值并充分利用第一個(gè)時(shí)期的信息,令該估計(jì)量為期的信息,令該估計(jì)量為 ,那么它應(yīng)該是充分利用前后期,那么它應(yīng)該是充分利用前后期中保留樣本、不保留樣本和后期新補(bǔ)充樣本的加權(quán)平均數(shù)。中保留樣本、不保留樣本和后期新補(bǔ)充樣本的加權(quán)平均數(shù)。 第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxxxyyxxywy 設(shè)我們希望得到的估計(jì)量設(shè)我們希望得到的估計(jì)量 是兩期估計(jì)量的線性函數(shù),即是兩期估計(jì)量的線性函數(shù),即 = a +b +c + d (10.1) 要求估計(jì)其參數(shù)要求估計(jì)
8、其參數(shù)a,b,c,d。 因?yàn)橐驗(yàn)镋( )=E( )= ,E( )=E( )= , 所所以以E( )=(a+b) +(c+d) 。要使。要使 成為成為 的無(wú)偏估計(jì)的無(wú)偏估計(jì)量,需量,需a+b=0,c+d=1,也即,也即b=-a,d=1-c。代入(。代入(10.1),有),有 =a=a( - - )+c +c +(1-c1-c) 第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxxxyyxxywywyxywywyXXYYYwyxxyy第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxx該估計(jì)量的方差可以求得為:該估計(jì)量的方差可以求得為: 2222221 1(1 )2( )().yyx yxwccacV yaq p np nq
9、npn 其中其中 是第一個(gè)時(shí)期的方差,是第一個(gè)時(shí)期的方差, 是第二個(gè)時(shí)期的方差。我是第二個(gè)時(shí)期的方差。我們要求出們要求出a a和和c c,使得,使得 達(dá)到最小,就要以上公式分別對(duì)達(dá)到最小,就要以上公式分別對(duì)a a和和c c求偏微分并使之等于求偏微分并使之等于0 0,即可求出,即可求出a a和和c c的最優(yōu)值分別為:的最優(yōu)值分別為: 2x2y()wV y第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxx該估計(jì)量的方差可以求得為:該估計(jì)量的方差可以求得為: 22.1yxpqaq221paq第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxx將其代入公式(將其代入公式(10.110.1),就得到),就得到 2222222(1
10、)()111ywxpqpqqyxxyyqqq該估計(jì)量的方差為該估計(jì)量的方差為 :22221()1ywqV ynq第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxx如果不利用前期信息,只根據(jù)第二期的結(jié)果來(lái)估如果不利用前期信息,只根據(jù)第二期的結(jié)果來(lái)估計(jì)均值,那么計(jì)均值,那么 :其方差為其方差為 :ypyqy2()yVyn第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxx故利用前期信息后的設(shè)計(jì)效果為故利用前期信息后的設(shè)計(jì)效果為 : 從上式可以看出,當(dāng)從上式可以看出,當(dāng)?shù)闹当容^大時(shí),利用上期信息的值比較大時(shí),利用上期信息可以較大地提高可以較大地提高 的效率。表的效率。表10.110.1給出了不同的給出了不同的q q,值值時(shí)時(shí)
11、 的值。的值。222()1()1wVyqVyqwy()( )wV yV y第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxx 表表10.1 10.1 不同的不同的q q,值時(shí)值時(shí) 的值的值 ()( )wV yV y第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxx三、樣本輪換方法三、樣本輪換方法 (一)(一) 隨機(jī)輪換法隨機(jī)輪換法 在進(jìn)行輪換時(shí)按確定的輪換單位數(shù)目或比例,從原有樣本在進(jìn)行輪換時(shí)按確定的輪換單位數(shù)目或比例,從原有樣本中隨機(jī)抽出若干單位不再調(diào)查,而從其余未包括在樣本中的總中隨機(jī)抽出若干單位不再調(diào)查,而從其余未包括在樣本中的總體單位中抽取同樣數(shù)目的單位來(lái)代替。體單位中抽取同樣數(shù)目的單位來(lái)代替。第一節(jié)第一節(jié)
12、樣本輪換樣本輪換 xxx (二)(二) 等距輪換法等距輪換法 在總體抽樣框中確定出各個(gè)等距抽樣的樣本,在各次的調(diào)在總體抽樣框中確定出各個(gè)等距抽樣的樣本,在各次的調(diào)查中,按相應(yīng)位置的等距樣本單位進(jìn)行輪換。我國(guó)農(nóng)村住戶(hù)調(diào)查中,按相應(yīng)位置的等距樣本單位進(jìn)行輪換。我國(guó)農(nóng)村住戶(hù)調(diào)查就是采用這種輪換方式。查就是采用這種輪換方式。 (三)(三) 子樣本輪換法子樣本輪換法 從總體中抽出若干套子樣本,每次調(diào)查一定數(shù)量的子樣本,從總體中抽出若干套子樣本,每次調(diào)查一定數(shù)量的子樣本,逐次輪換其中的部分子樣本。逐次輪換其中的部分子樣本。 第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxx 子樣本輪換實(shí)際上就是每次采用交叉子樣本,而
13、交叉子子樣本輪換實(shí)際上就是每次采用交叉子樣本,而交叉子樣本不僅能有效地減少和控制估計(jì)偏差,而且由于每個(gè)交叉樣本不僅能有效地減少和控制估計(jì)偏差,而且由于每個(gè)交叉子樣本都能代表總體,即使有的子樣本資料搜集不到,我們子樣本都能代表總體,即使有的子樣本資料搜集不到,我們也可以用其他的子樣本甚至一個(gè)子樣本來(lái)觀察和推斷總體。也可以用其他的子樣本甚至一個(gè)子樣本來(lái)觀察和推斷總體。此外,用交叉子樣本還可以考察非抽樣誤差發(fā)生的程度。因此外,用交叉子樣本還可以考察非抽樣誤差發(fā)生的程度。因此,一般來(lái)說(shuō),子樣本輪換方法是以上三種樣本輪換方法中此,一般來(lái)說(shuō),子樣本輪換方法是以上三種樣本輪換方法中最好的。最好的。 第一節(jié)第
14、一節(jié) 樣本輪換樣本輪換 xxx四、樣本輪換應(yīng)遵循的原則四、樣本輪換應(yīng)遵循的原則(一)代表性。一是指輪換后的新樣本必須具有代表性,二是(一)代表性。一是指輪換后的新樣本必須具有代表性,二是指新選取的樣本原則上必須滿足與被輪換掉的原樣本同類(lèi)型,指新選取的樣本原則上必須滿足與被輪換掉的原樣本同類(lèi)型,有代表性。有代表性。(二)連續(xù)性。指樣本輪換后進(jìn)行抽樣調(diào)查取得的資料應(yīng)與樣(二)連續(xù)性。指樣本輪換后進(jìn)行抽樣調(diào)查取得的資料應(yīng)與樣本輪換前進(jìn)行調(diào)查所取得的資料連續(xù)并可比。本輪換前進(jìn)行調(diào)查所取得的資料連續(xù)并可比。第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxx (三)保證必選樣本點(diǎn)。所謂必選樣本點(diǎn),就是指進(jìn)行(三)保證
15、必選樣本點(diǎn)。所謂必選樣本點(diǎn),就是指進(jìn)行抽樣調(diào)查時(shí)必須作為樣本點(diǎn)的總體單元。保證必選樣本點(diǎn)抽樣調(diào)查時(shí)必須作為樣本點(diǎn)的總體單元。保證必選樣本點(diǎn),就是指必選樣本點(diǎn)不參加輪換,僅對(duì)非必選樣本點(diǎn)進(jìn)行,就是指必選樣本點(diǎn)不參加輪換,僅對(duì)非必選樣本點(diǎn)進(jìn)行輪換。輪換。 (四)遵循抽樣原理。指進(jìn)行樣本輪換時(shí),要按照抽樣(四)遵循抽樣原理。指進(jìn)行樣本輪換時(shí),要按照抽樣調(diào)查的原理來(lái)選取被輪換掉的樣本點(diǎn)和補(bǔ)入的新樣本點(diǎn)。調(diào)查的原理來(lái)選取被輪換掉的樣本點(diǎn)和補(bǔ)入的新樣本點(diǎn)。第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxx五、案例介紹五、案例介紹 美國(guó)人口現(xiàn)狀調(diào)查(美國(guó)人口現(xiàn)狀調(diào)查(current population surveyc
16、urrent population survey,CPSCPS)是國(guó)際上最著名的抽樣調(diào)查項(xiàng)目之一,已經(jīng)成為美國(guó)以及許多是國(guó)際上最著名的抽樣調(diào)查項(xiàng)目之一,已經(jīng)成為美國(guó)以及許多國(guó)家進(jìn)行居民調(diào)查的參考模型,其實(shí)施是在每個(gè)月包含國(guó)家進(jìn)行居民調(diào)查的參考模型,其實(shí)施是在每個(gè)月包含1919號(hào)的號(hào)的那一周進(jìn)行,調(diào)查的問(wèn)題涉及受訪者此前一周內(nèi)的活動(dòng)。調(diào)查那一周進(jìn)行,調(diào)查的問(wèn)題涉及受訪者此前一周內(nèi)的活動(dòng)。調(diào)查氛圍覆蓋全美氛圍覆蓋全美5050個(gè)州和哥倫比亞地區(qū)。個(gè)州和哥倫比亞地區(qū)。CPSCPS采用的就是樣本輪換采用的就是樣本輪換的方法,即每位受訪者連續(xù)的方法,即每位受訪者連續(xù)4 4個(gè)月接受訪問(wèn),然后退出樣本,個(gè)月接
17、受訪問(wèn),然后退出樣本,8 8個(gè)月后再進(jìn)入樣本,連續(xù)個(gè)月后再進(jìn)入樣本,連續(xù)4 4個(gè)月接受訪問(wèn),最后永久地退出樣本個(gè)月接受訪問(wèn),最后永久地退出樣本。第一節(jié)第一節(jié) 樣本輪換樣本輪換 xxxCPS 在在1995年年7月的抽樣設(shè)計(jì)方案中樣本輪換的特征:月的抽樣設(shè)計(jì)方案中樣本輪換的特征: 1 在任意一個(gè)月內(nèi),都有在任意一個(gè)月內(nèi),都有1/8 的住戶(hù)單元第一次接受調(diào)查,的住戶(hù)單元第一次接受調(diào)查,1/8的住戶(hù)單元第二次接受調(diào)查,依次類(lèi)推。的住戶(hù)單元第二次接受調(diào)查,依次類(lèi)推。 2每個(gè)月都由新的樣本組代替從樣本中永久退出的老樣本每個(gè)月都由新的樣本組代替從樣本中永久退出的老樣本組。組。 3 每個(gè)月都有一個(gè)樣本組在閑置
18、每個(gè)月都有一個(gè)樣本組在閑置8個(gè)月后重新接受調(diào)查,以個(gè)月后重新接受調(diào)查,以此代替剛剛進(jìn)入閑置期的樣本組。此代替剛剛進(jìn)入閑置期的樣本組。 4通過(guò)輪換設(shè)計(jì),保證每個(gè)樣本單元在通過(guò)輪換設(shè)計(jì),保證每個(gè)樣本單元在2個(gè)年份的個(gè)年份的4個(gè)相同個(gè)相同 月份里接受調(diào)查。月份里接受調(diào)查。 5. 5. 在連續(xù)的在連續(xù)的2個(gè)月內(nèi),有個(gè)月內(nèi),有3/4/的樣本點(diǎn)是相同的;在連續(xù)的的樣本點(diǎn)是相同的;在連續(xù)的2年內(nèi),有年內(nèi),有1/2的樣本點(diǎn)是相同的。的樣本點(diǎn)是相同的。 第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx 我們可以先從總體中抽取一個(gè)大的初始樣本,從我們可以先從總體中抽取一個(gè)大的初始樣本,從而獲得總體的輔助信息,然后再?gòu)某跏紭?/p>
19、本或從總體而獲得總體的輔助信息,然后再?gòu)某跏紭颖净驈目傮w中再抽一個(gè)子樣本,這種方法就是中再抽一個(gè)子樣本,這種方法就是雙重抽樣雙重抽樣。 第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx一、定義一、定義 雙重抽樣,也稱(chēng)二相抽樣或二重抽樣雙重抽樣,也稱(chēng)二相抽樣或二重抽樣(two-phase (two-phase sampling)sampling),是指在抽樣時(shí)分兩步抽取樣本。一般情況下,先從,是指在抽樣時(shí)分兩步抽取樣本。一般情況下,先從總體總體N N中抽取一個(gè)較大的樣本,稱(chēng)為第一重中抽取一個(gè)較大的樣本,稱(chēng)為第一重( (相相) )樣本樣本(the first (the first phase sample)
20、phase sample),對(duì)之進(jìn)行調(diào)查以獲取總體的某些輔助信息,為,對(duì)之進(jìn)行調(diào)查以獲取總體的某些輔助信息,為下一步的抽樣估計(jì)提供條件;然后進(jìn)行第二重抽樣下一步的抽樣估計(jì)提供條件;然后進(jìn)行第二重抽樣(the second (the second phase sampling)phase sampling)。第二重抽樣所抽的樣本。第二重抽樣所抽的樣本n n相對(duì)較小,但是第相對(duì)較小,但是第二重抽樣調(diào)查才是主調(diào)查。二重抽樣調(diào)查才是主調(diào)查。 第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx 二、雙重抽樣與兩階段抽樣的區(qū)別二、雙重抽樣與兩階段抽樣的區(qū)別(一)兩階段抽樣(一)兩階段抽樣(two-stage samp
21、lingtwo-stage sampling)是先從總體)是先從總體N N個(gè)單個(gè)單元元( (初級(jí)單元初級(jí)單元) )中抽出中抽出n n個(gè)樣本單元,卻并不對(duì)這個(gè)樣本單元,卻并不對(duì)這n n個(gè)樣本單元中個(gè)樣本單元中的所有小單元的所有小單元( (二級(jí)單元二級(jí)單元) )都進(jìn)行調(diào)查,而是在其中再抽出若干都進(jìn)行調(diào)查,而是在其中再抽出若干個(gè)二級(jí)單元進(jìn)行調(diào)查;雙重抽樣則不同,要對(duì)第一重個(gè)二級(jí)單元進(jìn)行調(diào)查;雙重抽樣則不同,要對(duì)第一重( (相相) )樣本樣本進(jìn)行調(diào)查以獲取總體的某些輔助信息,并且要利用這些輔助信進(jìn)行調(diào)查以獲取總體的某些輔助信息,并且要利用這些輔助信息進(jìn)行排序、分層、抽樣或估計(jì)等。息進(jìn)行排序、分層、抽樣
22、或估計(jì)等。 第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx (二)兩階段抽樣的第二階段抽樣單元和第一階段抽(二)兩階段抽樣的第二階段抽樣單元和第一階段抽樣單元往往是不同的;雙重抽樣要有一份最終單元的樣單元往往是不同的;雙重抽樣要有一份最終單元的完整名冊(cè)完整名冊(cè)( (總體所有單元的抽樣框總體所有單元的抽樣框) ),而兩階段抽樣只,而兩階段抽樣只是需要第一階段單元是需要第一階段單元( (初級(jí)單元初級(jí)單元) )名冊(cè),然后在中選的名冊(cè),然后在中選的初級(jí)單元中構(gòu)造第二階段抽樣的抽樣框初級(jí)單元中構(gòu)造第二階段抽樣的抽樣框。 第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx三、雙重抽樣的作用三、雙重抽樣的作用(一)有助于篩選主
23、調(diào)查對(duì)象(一)有助于篩選主調(diào)查對(duì)象 (二)節(jié)約調(diào)查費(fèi)用二)節(jié)約調(diào)查費(fèi)用(三)提高抽樣效率(三)提高抽樣效率 (四)可用于研究樣本輪換中的某些問(wèn)題(四)可用于研究樣本輪換中的某些問(wèn)題 (五)降低無(wú)回答偏倚(五)降低無(wú)回答偏倚 第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx四、雙重抽樣的應(yīng)用四、雙重抽樣的應(yīng)用 (一)為分層的雙重抽樣(一)為分層的雙重抽樣 分層抽樣如果事先無(wú)法知道總體的層權(quán),可以采用雙重抽分層抽樣如果事先無(wú)法知道總體的層權(quán),可以采用雙重抽樣。具體實(shí)施過(guò)程如下:樣。具體實(shí)施過(guò)程如下:第一步:利用簡(jiǎn)單隨機(jī)抽樣,從總體的第一步:利用簡(jiǎn)單隨機(jī)抽樣,從總體的N N個(gè)單元中隨機(jī)抽取第一個(gè)單元中隨機(jī)抽取
24、第一重樣本,樣本單元數(shù)為重樣本,樣本單元數(shù)為 ;根據(jù)已知的分層標(biāo)志將第一重樣本;根據(jù)已知的分層標(biāo)志將第一重樣本分層,令分層,令 ,則,則 是總體層權(quán)是總體層權(quán) 的無(wú)偏估的無(wú)偏估計(jì)。計(jì)。 n(1,2, )hhnwhLnhwhW第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx 第二步:利用分層隨機(jī)抽樣,從第一重樣本中抽取出第二重樣第二步:利用分層隨機(jī)抽樣,從第一重樣本中抽取出第二重樣本,樣本單元數(shù)為本,樣本單元數(shù)為n n,第,第h h層樣本單元數(shù)為層樣本單元數(shù)為 , 。 hn1lhhnn采用雙重分層抽樣,對(duì)總體均值采用雙重分層抽樣,對(duì)總體均值 的估計(jì)量為:的估計(jì)量為: Y1LstDhhhywy 的方差為:的
25、方差為: stDy21)111()()(1)LhhstDhhDW SV ySnNnf第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx上式可簡(jiǎn)化為上式可簡(jiǎn)化為 : 的樣本估計(jì)量為:的樣本估計(jì)量為: ()stDV y222111111()()()()LLstDhhhhstDhhhhv yw sw yynnnN222111()()LLhhstDhhstDhhhw sv yw yynn第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx 第一步:從總體的第一步:從總體的N N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為元數(shù)為 ;對(duì)于第一重樣本,僅觀測(cè)輔助變量信息,用輔助;對(duì)于第一重樣本,僅觀測(cè)輔
26、助變量信息,用輔助變量的樣本均值變量的樣本均值 估計(jì)總體均值估計(jì)總體均值 。 (二)為比率估計(jì)的雙重抽樣(二)為比率估計(jì)的雙重抽樣 在實(shí)際工作中,如果輔助變量的信息未知,可以利用雙重抽在實(shí)際工作中,如果輔助變量的信息未知,可以利用雙重抽樣進(jìn)行比例估計(jì)。具體實(shí)施過(guò)程如下:樣進(jìn)行比例估計(jì)。具體實(shí)施過(guò)程如下: n11niixxn X第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx雙重抽樣對(duì)總體均值雙重抽樣對(duì)總體均值 的比率估計(jì):的比率估計(jì): 第二步:從第一重樣本中隨機(jī)抽取出第二重樣本,樣本單元第二步:從第一重樣本中隨機(jī)抽取出第二重樣本,樣本單元數(shù)為數(shù)為n n;對(duì)于第二重樣本,觀測(cè)目標(biāo)變量與輔助變量,并用獲;對(duì)
27、于第二重樣本,觀測(cè)目標(biāo)變量與輔助變量,并用獲得的得的 和和 ,計(jì)算,計(jì)算 ,構(gòu)造比率估計(jì)。,構(gòu)造比率估計(jì)。XYyRxYRDyyxx雙重抽樣比率估計(jì)的方差為:雙重抽樣比率估計(jì)的方差為: 222111()(2)RDyxyxVySR SRSnnn)第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx雙重抽樣比率估計(jì)方差的樣本估計(jì):雙重抽樣比率估計(jì)方差的樣本估計(jì): 22 2111()()(2)RDyxyxv ysR sRsnn n第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx(三)為回歸估計(jì)的二重抽樣(三)為回歸估計(jì)的二重抽樣 與比率估計(jì)相似,在輔助信息未知時(shí)可以采用二重抽樣進(jìn)與比率估計(jì)相似,在輔助信息未知時(shí)可以采用二重抽
28、樣進(jìn)行回歸估計(jì)。具體實(shí)施過(guò)程如下:行回歸估計(jì)。具體實(shí)施過(guò)程如下: 第一步:從總體的第一步:從總體的N N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為數(shù)為 ;對(duì)于第一重樣本,僅觀測(cè)輔助變量信息;對(duì)于第一重樣本,僅觀測(cè)輔助變量信息 ,用輔助,用輔助變量的樣本均值變量的樣本均值 估計(jì)其總體均值估計(jì)其總體均值 。 nix11niixxnX第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx 第二步:從第一重樣本中隨機(jī)抽取出第二重樣本,樣本單元第二步:從第一重樣本中隨機(jī)抽取出第二重樣本,樣本單元數(shù)為數(shù)為n n;對(duì)于第二重樣本,觀測(cè)目標(biāo)變量;對(duì)于第二重樣本,觀測(cè)目標(biāo)變量 與輔助變量與輔助
29、變量 ,并,并計(jì)算計(jì)算 、 和回歸系數(shù)和回歸系數(shù)b b,構(gòu)造回歸估計(jì)。,構(gòu)造回歸估計(jì)。 iyixXY雙重抽樣對(duì)總體均值的回歸估計(jì):雙重抽樣對(duì)總體均值的回歸估計(jì): ()lrDyy b xx 雙重抽樣回歸估計(jì)的方差為:雙重抽樣回歸估計(jì)的方差為: 1212()()lrDlrDlrDVyVEyE Vy)第二節(jié)第二節(jié) 雙重抽樣雙重抽樣 xxx式中式中 :為第一重樣本殘差方差,其均值近似等于總體殘差方差為第一重樣本殘差方差,其均值近似等于總體殘差方差 :因此雙重抽樣回歸估計(jì)因此雙重抽樣回歸估計(jì)方差的樣本估計(jì):方差的樣本估計(jì):22222221 11 1()()(1) ,(1)lrDeyeyV yss ssn
30、 nn n )222(1)eySS22211()ylrDySv yr snnn)=第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置 xxx一、敏感性問(wèn)題調(diào)查一、敏感性問(wèn)題調(diào)查 所謂敏感性問(wèn)題所謂敏感性問(wèn)題(sensitive question)(sensitive question)是指所調(diào)查的內(nèi)容是指所調(diào)查的內(nèi)容涉及私人機(jī)密,受訪者不愿或不便于向外界透露的問(wèn)題。涉及私人機(jī)密,受訪者不愿或不便于向外界透露的問(wèn)題。 對(duì)于這類(lèi)敏感性問(wèn)題,必須采取經(jīng)過(guò)特別設(shè)計(jì)的裝置與方對(duì)于這類(lèi)敏感性問(wèn)題,必須采取經(jīng)過(guò)特別設(shè)計(jì)的裝置與方法,以消除受訪者的顧慮,能夠如實(shí)回答問(wèn)題,避免調(diào)查出現(xiàn)法,以消除受訪者的顧慮,能夠如實(shí)回答問(wèn)題,
31、避免調(diào)查出現(xiàn)嚴(yán)重偏誤。這種為敏感性問(wèn)題調(diào)查特別設(shè)計(jì)的技術(shù),稱(chēng)隨機(jī)化嚴(yán)重偏誤。這種為敏感性問(wèn)題調(diào)查特別設(shè)計(jì)的技術(shù),稱(chēng)隨機(jī)化回答技術(shù)回答技術(shù)(Randomized Response Technique)(Randomized Response Technique)。 第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置 xxx 敏感性問(wèn)題按總體的特征可分為屬性特征和數(shù)量敏感性問(wèn)題按總體的特征可分為屬性特征和數(shù)量特征問(wèn)題兩類(lèi)。屬性特征的敏感性問(wèn)題是指受訪者是特征問(wèn)題兩類(lèi)。屬性特征的敏感性問(wèn)題是指受訪者是否具有敏感性問(wèn)題的特征,一般是估計(jì)具有敏感性特否具有敏感性問(wèn)題的特征,一般是估計(jì)具有敏感性特征的單位在總體中所占的比
32、例,因此又可稱(chēng)作敏感性征的單位在總體中所占的比例,因此又可稱(chēng)作敏感性比例問(wèn)題。數(shù)量特征的敏感性問(wèn)題是指受訪者具有敏比例問(wèn)題。數(shù)量特征的敏感性問(wèn)題是指受訪者具有敏感性問(wèn)題數(shù)額的多少的特征,一般是估計(jì)敏感性數(shù)額感性問(wèn)題數(shù)額的多少的特征,一般是估計(jì)敏感性數(shù)額的均值或總和,也可稱(chēng)作敏感性均值問(wèn)題。的均值或總和,也可稱(chēng)作敏感性均值問(wèn)題。二、沃納隨機(jī)化回答模型二、沃納隨機(jī)化回答模型 使用隨機(jī)化回答技術(shù)的第一個(gè)模型是由沃納使用隨機(jī)化回答技術(shù)的第一個(gè)模型是由沃納(S.L. Warner)(S.L. Warner)首先提出的首先提出的 。 例如,某大學(xué)欲調(diào)查學(xué)生考試的作弊問(wèn)題,隨機(jī)抽取例如,某大學(xué)欲調(diào)查學(xué)生考試
33、的作弊問(wèn)題,隨機(jī)抽取n n個(gè)個(gè)學(xué)生進(jìn)行調(diào)查,對(duì)每位學(xué)生顯示兩個(gè)相反的問(wèn)題,問(wèn)題可以寫(xiě)學(xué)生進(jìn)行調(diào)查,對(duì)每位學(xué)生顯示兩個(gè)相反的問(wèn)題,問(wèn)題可以寫(xiě)在外形完全相同的在外形完全相同的m m張卡片上,其中張卡片上,其中m m1 1個(gè)卡片寫(xiě)上個(gè)卡片寫(xiě)上“我曾在考我曾在考試中作過(guò)弊試中作過(guò)弊”,另外,另外m-mm-m1 1個(gè)卡片寫(xiě)上個(gè)卡片寫(xiě)上“我不曾在考試中作過(guò)我不曾在考試中作過(guò)弊弊”。然后把這。然后把這m m個(gè)卡片折疊好,放在一個(gè)盒子里。其中:個(gè)卡片折疊好,放在一個(gè)盒子里。其中: A問(wèn)題:我曾在考試中作過(guò)弊。問(wèn)題:我曾在考試中作過(guò)弊。 B B問(wèn)題:我不曾在考試中作過(guò)弊。問(wèn)題:我不曾在考試中作過(guò)弊。 第三節(jié)第三
34、節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy y 調(diào)查時(shí)將調(diào)查時(shí)將m m種外形完全一致的卡片像洗牌一樣充分混合后,種外形完全一致的卡片像洗牌一樣充分混合后,由受訪者依簡(jiǎn)單隨機(jī)抽樣中的抽簽方式隨機(jī)抽取一張卡片,對(duì)由受訪者依簡(jiǎn)單隨機(jī)抽樣中的抽簽方式隨機(jī)抽取一張卡片,對(duì)照自己的情況回答照自己的情況回答“是是”或或“否否”,然后放回盒子中。,然后放回盒子中。 設(shè)卡片設(shè)卡片A A的比例是的比例是P P,則卡片,則卡片B B的比例就是的比例就是1-P1-P。由古典概率。由古典概率可知,在大規(guī)模的調(diào)查中,抽中卡片的概率為可知,在大規(guī)模的調(diào)查中,抽中卡片的概率為P P(A A)=P=P,抽中,抽中卡片的概率為卡片
35、的概率為P P(B B)=1-P=1-P 。若樣本量為。若樣本量為n n,回答,回答“是是”的人數(shù)的人數(shù)為為m m,則,則( (是是) )的估計(jì)值為的估計(jì)值為m/nm/n。我們知道,回答。我們知道,回答“是是”的人有兩的人有兩種情況:一種是抽中了卡片種情況:一種是抽中了卡片A,A,而這些人作過(guò)弊;另一種是抽中而這些人作過(guò)弊;另一種是抽中了卡片了卡片B B,而這些人沒(méi)有作過(guò)弊。利用全概公式,得:,而這些人沒(méi)有作過(guò)弊。利用全概公式,得: ( (是是)=P(A) ()=P(A) (是是|A)+P(B) (|A)+P(B) (是是|B) |B) 第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy yr
36、PrPrP 不管是抽到卡片不管是抽到卡片A A還是抽到卡片還是抽到卡片B B,作過(guò)弊的概率是相等的,作過(guò)弊的概率是相等的,假設(shè)這一比例為假設(shè)這一比例為 ,即,即 ( (是是|A)= ,|A)= ,則抽到卡片則抽到卡片B B,回答,回答“是是”的概率為的概率為1- 1- ,即,即P(P(是是|B)=1- |B)=1- 。代入上述公式,得代入上述公式,得 的一個(gè)估計(jì)的一個(gè)估計(jì) 滿足滿足 :第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy yrP(1)(1)mPPn因此當(dāng)因此當(dāng) 時(shí),有時(shí),有 :12P 1(1)21mPPn其方差為:其方差為: 2(1)(1)()(21)PPVnnP 的一個(gè)無(wú)偏估計(jì)
37、為:的一個(gè)無(wú)偏估計(jì)為: 第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy y當(dāng)當(dāng)n n很大時(shí),很大時(shí), ( )V2(1)(1)(1)( )11(1)(21)mmPPnnvnnnP32(1)(1)(1)( )(21)mmPPvnnnP三、西蒙斯三、西蒙斯(Simmons)(Simmons)隨機(jī)化回答模型隨機(jī)化回答模型 西蒙斯在沃納模型基礎(chǔ)上作了改進(jìn),他將其中一張卡片上西蒙斯在沃納模型基礎(chǔ)上作了改進(jìn),他將其中一張卡片上的問(wèn)題改為與所調(diào)查的敏感性問(wèn)題完全無(wú)關(guān)的另一個(gè)非敏感性的問(wèn)題改為與所調(diào)查的敏感性問(wèn)題完全無(wú)關(guān)的另一個(gè)非敏感性問(wèn)題。因此西蒙斯模型也稱(chēng)為無(wú)關(guān)問(wèn)題的隨機(jī)化回答模型。問(wèn)題。因此西蒙斯模型
38、也稱(chēng)為無(wú)關(guān)問(wèn)題的隨機(jī)化回答模型。 仍假設(shè)敏感性問(wèn)題的卡片比例為仍假設(shè)敏感性問(wèn)題的卡片比例為P P,無(wú)關(guān)問(wèn)題的卡片比例為,無(wú)關(guān)問(wèn)題的卡片比例為1-P1-P。對(duì)于敏感性問(wèn)題回答。對(duì)于敏感性問(wèn)題回答“是是”的比例為的比例為 ,是我們所要調(diào),是我們所要調(diào)查的比例,對(duì)無(wú)關(guān)問(wèn)題回答查的比例,對(duì)無(wú)關(guān)問(wèn)題回答“是是”的比例的比例 要求是已知的,要求是已知的,則根據(jù)全概率公式,得則根據(jù)全概率公式,得 : ( (是是)=P +(1)=P +(1-P-P) ) 第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy yABrPAB 當(dāng)樣本量為當(dāng)樣本量為n n,回答,回答“是是”的人數(shù)為的人數(shù)為m m,則,則 ( (是是
39、) )的估計(jì)值為的估計(jì)值為m/nm/n,因此,因此 的估計(jì)值的估計(jì)值 滿足:滿足:第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy y解此方程得解此方程得 :它的方差為(若忽略它的方差為(若忽略fpcfpc):): rPAA(1)ABmPPn1(1)ABmPPn222(1)(1)(1)(1)(2)()(10.27)AABBABABAPPPVnnPnP V V( )的一個(gè)無(wú)偏估計(jì)為:的一個(gè)無(wú)偏估計(jì)為: A21()()(1)(1)Ammvnpnn 【例【例10.110.1】 某大學(xué)對(duì)本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用某大學(xué)對(duì)本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用西蒙斯模型,對(duì)每個(gè)受訪者準(zhǔn)備了一套同樣的西
40、蒙斯模型,對(duì)每個(gè)受訪者準(zhǔn)備了一套同樣的(40(40張張) )卡片,卡卡片,卡片片A A和卡片和卡片B B各各2020張,比例各占張,比例各占1/21/2。卡片上卡片上A A的問(wèn)題是:最近學(xué)期期末考試你有過(guò)作弊行為嗎?的問(wèn)題是:最近學(xué)期期末考試你有過(guò)作弊行為嗎?卡片上卡片上B B的問(wèn)題是:你的陽(yáng)歷生日日期為奇數(shù)嗎的問(wèn)題是:你的陽(yáng)歷生日日期為奇數(shù)嗎? ?第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy y 【例【例10.110.1】 某大學(xué)對(duì)本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用某大學(xué)對(duì)本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用西蒙斯模型,對(duì)每個(gè)受訪者準(zhǔn)備了一套同樣的西蒙斯模型,對(duì)每個(gè)受訪者準(zhǔn)備了一套同樣的(4
41、0(40張張) )卡片,卡卡片,卡片片A A和卡片和卡片B B各各2020張,比例各占張,比例各占1/21/2。卡片上卡片上A A的問(wèn)題是:最近學(xué)期期末考試你有過(guò)作弊行為嗎?的問(wèn)題是:最近學(xué)期期末考試你有過(guò)作弊行為嗎?卡片上卡片上B B的問(wèn)題是:你的陽(yáng)歷生日日期為奇數(shù)嗎的問(wèn)題是:你的陽(yáng)歷生日日期為奇數(shù)嗎? ? 假如對(duì)依簡(jiǎn)單隨機(jī)抽樣方式抽出的假如對(duì)依簡(jiǎn)單隨機(jī)抽樣方式抽出的400400個(gè)人進(jìn)行調(diào)查,在個(gè)人進(jìn)行調(diào)查,在n=400n=400人中總共有人中總共有m=115m=115人的答案為人的答案為“是是”,試估計(jì)該校大學(xué)生,試估計(jì)該校大學(xué)生考試作弊的比例考試作弊的比例 并給出并給出90%90%的置信
42、區(qū)間。的置信區(qū)間。 第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy yA 解:解:n=800n=800,m=135m=135,P=0.5P=0.5, 為生日日期為奇數(shù)的人數(shù)比為生日日期為奇數(shù)的人數(shù)比例。在大規(guī)模調(diào)查的情況下,可以看作生日為奇數(shù)和偶數(shù)的各例。在大規(guī)模調(diào)查的情況下,可以看作生日為奇數(shù)和偶數(shù)的各占一半,因此占一半,因此 =0.5=0.5。根據(jù)公式得:。根據(jù)公式得: 第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy y = = BB1(1)ABmPPn11520.5 0.50.07540021()()(1)(1)Ammvnpnn()0.0453Av故故 的的90%90%置信區(qū)間約
43、為:(置信區(qū)間約為:(0.0751.640.0751.640.04530.0453),即),即 : A0.07%,14.93%= =0.0020540.002054 四、隨機(jī)截尾模型四、隨機(jī)截尾模型 現(xiàn)實(shí)中我們也經(jīng)常需要調(diào)查定量的敏感性問(wèn)題,例如調(diào)查現(xiàn)實(shí)中我們也經(jīng)常需要調(diào)查定量的敏感性問(wèn)題,例如調(diào)查銀行存款數(shù)額,學(xué)生考試作弊的平均次數(shù),在職人員的工資外銀行存款數(shù)額,學(xué)生考試作弊的平均次數(shù),在職人員的工資外收入等。收入等。GreenbergGreenberg等人針對(duì)這類(lèi)問(wèn)題提出了幾種隨機(jī)化調(diào)查等人針對(duì)這類(lèi)問(wèn)題提出了幾種隨機(jī)化調(diào)查方法,但是,這些方法都要求受訪者根據(jù)自己的實(shí)際情況回答方法,但是,這
44、些方法都要求受訪者根據(jù)自己的實(shí)際情況回答敏感性問(wèn)題或非敏感性問(wèn)題的具體數(shù)值,給受訪者敏感性問(wèn)題或非敏感性問(wèn)題的具體數(shù)值,給受訪者/ /受查者造受查者造成了一定的困擾。成了一定的困擾。 近年來(lái)提出了所謂隨機(jī)截尾模型,把對(duì)于具體數(shù)值的調(diào)查近年來(lái)提出了所謂隨機(jī)截尾模型,把對(duì)于具體數(shù)值的調(diào)查轉(zhuǎn)化為對(duì)于屬性的調(diào)查,避免了直接回答,使得受訪者心理上轉(zhuǎn)化為對(duì)于屬性的調(diào)查,避免了直接回答,使得受訪者心理上比較容易接受。比較容易接受。 第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy y 設(shè)反映敏感性問(wèn)題的特征量為設(shè)反映敏感性問(wèn)題的特征量為X X,取值范圍是,取值范圍是 ,密度,密度函數(shù)為函數(shù)為 ,X X的數(shù)
45、學(xué)期望為的數(shù)學(xué)期望為 ,即我們所要估計(jì)的值。又設(shè),即我們所要估計(jì)的值。又設(shè)Y Y是一個(gè)服從是一個(gè)服從 上的均勻分布的隨機(jī)變量。上的均勻分布的隨機(jī)變量。 第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy y 設(shè)樣本容量為設(shè)樣本容量為n n,得到的調(diào)查數(shù)據(jù)是,得到的調(diào)查數(shù)據(jù)是 ,I=1I=1,2 2, n n,即:,即: = = , a at( )f xx, a ati1,0,iiiiXYXYi,因此,因此( )( )(1)()a t a txiiiiayaf xEPP XYdxdytt 以樣本均值以樣本均值 = = 代替代替 ,得到,得到 的一個(gè)無(wú)偏估計(jì)的一個(gè)無(wú)偏估計(jì)為:為: 第三節(jié)第三節(jié) 隨
46、機(jī)化裝隨機(jī)化裝置置wywyx xy y估計(jì)量的方差為:估計(jì)量的方差為: 的一個(gè)估計(jì)為:的一個(gè)估計(jì)為: 11niin()iExXta2()()()( )xxxa taVt Vn()xV2()()(1) ( )11xxxa tatvnn五、采用隨機(jī)化回答技術(shù)應(yīng)注意的問(wèn)題五、采用隨機(jī)化回答技術(shù)應(yīng)注意的問(wèn)題第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy y( (一一) ) 注意在受訪者正式抽取并回答問(wèn)題前,清楚介紹這種做法注意在受訪者正式抽取并回答問(wèn)題前,清楚介紹這種做法的原理,讓受訪者充分理解這種方法的特點(diǎn),以徹底消除受訪的原理,讓受訪者充分理解這種方法的特點(diǎn),以徹底消除受訪者的顧慮,明白自己究
47、竟回答哪個(gè)問(wèn)題別人是不知道的,使其者的顧慮,明白自己究竟回答哪個(gè)問(wèn)題別人是不知道的,使其相信這種設(shè)計(jì)是建立在科學(xué)的基礎(chǔ)上,不是哄騙人的。相信這種設(shè)計(jì)是建立在科學(xué)的基礎(chǔ)上,不是哄騙人的。( (二二) ) 所提問(wèn)題必須簡(jiǎn)單明了,防止因有歧義而出現(xiàn)理解不同。所提問(wèn)題必須簡(jiǎn)單明了,防止因有歧義而出現(xiàn)理解不同。對(duì)涉及問(wèn)題的解釋必須在抽卡片以前進(jìn)行,否則就暴露了抽到對(duì)涉及問(wèn)題的解釋必須在抽卡片以前進(jìn)行,否則就暴露了抽到的是哪類(lèi)卡片,也就失去了隨機(jī)化回答的意義。的是哪類(lèi)卡片,也就失去了隨機(jī)化回答的意義。第三節(jié)第三節(jié) 隨機(jī)化裝隨機(jī)化裝置置wywyx xy y ( (三三) ) 在應(yīng)用西蒙斯模型時(shí),無(wú)關(guān)問(wèn)題的選
48、擇特別重要,一定在應(yīng)用西蒙斯模型時(shí),無(wú)關(guān)問(wèn)題的選擇特別重要,一定要隱蔽性強(qiáng)的,使受訪者在回答無(wú)關(guān)問(wèn)題時(shí)不會(huì)暴露正在回答要隱蔽性強(qiáng)的,使受訪者在回答無(wú)關(guān)問(wèn)題時(shí)不會(huì)暴露正在回答哪個(gè)問(wèn)題。例如哪個(gè)問(wèn)題。例如“你是男生嗎你是男生嗎? ?”這類(lèi)問(wèn)題就很不妥,因?yàn)椴捎眠@類(lèi)問(wèn)題就很不妥,因?yàn)椴捎秒S機(jī)化回答技術(shù)需要當(dāng)面解釋?zhuān)茉L者的性別不可能保密,這隨機(jī)化回答技術(shù)需要當(dāng)面解釋?zhuān)茉L者的性別不可能保密,這樣也就失去了無(wú)關(guān)問(wèn)題本來(lái)應(yīng)具有的保護(hù)作用。樣也就失去了無(wú)關(guān)問(wèn)題本來(lái)應(yīng)具有的保護(hù)作用。 ( (四四) ) 做好調(diào)查者的培訓(xùn)工作,使他們能夠正確理解隨機(jī)化回做好調(diào)查者的培訓(xùn)工作,使他們能夠正確理解隨機(jī)化回答技術(shù)的實(shí)
49、質(zhì)并加以運(yùn)用,這樣才能更好地向受訪者解釋清楚答技術(shù)的實(shí)質(zhì)并加以運(yùn)用,這樣才能更好地向受訪者解釋清楚,消除受訪者的顧慮,以對(duì)調(diào)查的問(wèn)題給予正確回答。,消除受訪者的顧慮,以對(duì)調(diào)查的問(wèn)題給予正確回答。 第四節(jié)第四節(jié) 交叉子樣交叉子樣本本 wywyx xy y 交叉子樣本(交叉子樣本(Interpenetrating sub-samplesInterpenetrating sub-samples)方法最初)方法最初是由印度著名統(tǒng)計(jì)學(xué)家馬哈拉諾比斯于是由印度著名統(tǒng)計(jì)學(xué)家馬哈拉諾比斯于3030年代提出來(lái)的用于大年代提出來(lái)的用于大規(guī)模的抽樣調(diào)查,后來(lái)由美國(guó)統(tǒng)計(jì)學(xué)家戴明推廣和發(fā)展,他稱(chēng)規(guī)模的抽樣調(diào)查,后來(lái)由美
50、國(guó)統(tǒng)計(jì)學(xué)家戴明推廣和發(fā)展,他稱(chēng)之謂重復(fù)抽樣。它的主要優(yōu)點(diǎn)是便于計(jì)算抽樣標(biāo)準(zhǔn)誤差,即使之謂重復(fù)抽樣。它的主要優(yōu)點(diǎn)是便于計(jì)算抽樣標(biāo)準(zhǔn)誤差,即使是復(fù)雜的抽樣設(shè)計(jì)和復(fù)雜的估計(jì)量,也可以很快得到方差的估是復(fù)雜的抽樣設(shè)計(jì)和復(fù)雜的估計(jì)量,也可以很快得到方差的估計(jì)量。它還可以用于發(fā)現(xiàn)偏差,核對(duì)調(diào)查員的調(diào)查質(zhì)量等。計(jì)量。它還可以用于發(fā)現(xiàn)偏差,核對(duì)調(diào)查員的調(diào)查質(zhì)量等。 第四節(jié)第四節(jié) 交叉子樣交叉子樣本本 wy一、獨(dú)立的交叉子樣本一、獨(dú)立的交叉子樣本 設(shè)總體為設(shè)總體為N N,現(xiàn)欲抽取樣本容量為,現(xiàn)欲抽取樣本容量為n n的樣本。那么可以利用的樣本。那么可以利用交叉子樣本的方法,交叉子樣本的方法, 假設(shè)抽取假設(shè)抽取K
51、K個(gè)子樣本,使每個(gè)樣本的容量個(gè)子樣本,使每個(gè)樣本的容量為為m(n=Km)m(n=Km),每個(gè)交叉子樣本可以得到總體參數(shù),每個(gè)交叉子樣本可以得到總體參數(shù)的一個(gè)無(wú)偏估的一個(gè)無(wú)偏估計(jì)量計(jì)量 那么交叉子樣本的估計(jì)量及其方差為:那么交叉子樣本的估計(jì)量及其方差為:1 2,ky yy11kiiyyk2211()()(1)kiiSyyyk k2211( )()(1)kiifSyyyk k(不重復(fù)抽樣(不重復(fù)抽樣 ) 【例【例10.210.2】假設(shè)有一小城鎮(zhèn),現(xiàn)欲估計(jì)這一城鎮(zhèn)的房屋數(shù)。假設(shè)有一小城鎮(zhèn),現(xiàn)欲估計(jì)這一城鎮(zhèn)的房屋數(shù)。該城鎮(zhèn)共有該城鎮(zhèn)共有5050個(gè)居委會(huì),由于居委會(huì)作為抽樣單位太大,將每個(gè)居委會(huì),由于居
52、委會(huì)作為抽樣單位太大,將每個(gè)居委會(huì)劃分為個(gè)居委會(huì)劃分為8 8個(gè)地段,這樣共有個(gè)地段,這樣共有400400個(gè)地段,擬抽取個(gè)地段,擬抽取20%20%的的地段做樣本,所以地段做樣本,所以n=80n=80,現(xiàn)采用,現(xiàn)采用K=5K=5獨(dú)立交叉子樣本,每個(gè)交獨(dú)立交叉子樣本,每個(gè)交叉子樣本的容量為叉子樣本的容量為1616。抽樣的方法可用系統(tǒng)抽樣的方法,將總。抽樣的方法可用系統(tǒng)抽樣的方法,將總體分成體分成1616段(層),每段有段(層),每段有2525個(gè)地段。抽選時(shí)先在個(gè)地段。抽選時(shí)先在125125之間之間用不重復(fù)抽樣方法抽取用不重復(fù)抽樣方法抽取5 5個(gè)隨機(jī)數(shù)作為隨機(jī)起點(diǎn)。如表(個(gè)隨機(jī)數(shù)作為隨機(jī)起點(diǎn)。如表(10. 210. 2)中的第一行,它們分別是:中的第一行,它們分別是:1818,1 1,8 8,2323,1111。 第四節(jié)第四節(jié) 交叉子樣交叉子樣本本wywyx xy y第四節(jié)第四節(jié) 交叉子樣交叉子樣本本wywyx xy y第四節(jié)第四節(jié) 交叉子樣交叉子樣本本wywyx xy
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡(luò)信息安全保密與使用協(xié)議
- 小螞蟻的童話故事15篇范文
- 怎么辦綠色怎么回來(lái)(8篇)
- 戀愛(ài)之季新的愛(ài)情1200字(7篇)
- 可愛(ài)的四季600字9篇范文
- 日記我家的小貓400字(13篇)
- 寫(xiě)景作文起霧400字(11篇)
- 歡樂(lè)的童年我的暑假趣事作文14篇范文
- 七年級(jí)英語(yǔ)動(dòng)詞辨析與用法教學(xué)
- 換魚(yú)水的學(xué)問(wèn)550字(15篇)
- 溝通與演講2023學(xué)習(xí)通超星課后章節(jié)答案期末考試題庫(kù)2023年
- 《數(shù)據(jù)采集與預(yù)處理》教學(xué)教案(全)
- 2022年《內(nèi)蒙古自治區(qū)建設(shè)工程費(fèi)用定額》取費(fèi)說(shuō)明
- DVD在線租賃的分配問(wèn)題
- Q∕GDW 10799.6-2018 國(guó)家電網(wǎng)有限公司電力安全工作規(guī)程 第6部分:光伏電站部分
- 暴雨產(chǎn)流計(jì)算(推理公式_四川省)
- 焊接技能訓(xùn)練教案.
- 斷路器的控制回路和信號(hào)回路
- 中考數(shù)學(xué)復(fù)習(xí)經(jīng)驗(yàn)交流PPT課件
- 內(nèi)部控制專(zhuān)項(xiàng)審計(jì)實(shí)施方案
- 硅膠管檢驗(yàn)管理規(guī)定
評(píng)論
0/150
提交評(píng)論