




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
§3.1引言一、定義先將總體N個單元劃分成L個互不重復的子總體,每個子總體稱為層,它們的大小分別為
然后,在每個層中獨立地進行抽樣,稱為分層抽樣.二、作用分層抽樣在實際工作中應用的非常廣泛,主要是因為它具有其它抽樣方法所沒有的特點:1.分層抽樣的抽樣效率較高,也就是說,分層抽樣的估計精度較高。2.分層抽樣不僅能對總體指標進行推算,而且能對各層指標進行推算。3.層內抽樣方法可以不同,而且便于抽樣工作的組織。三、使用場合在對分層進行具體劃分時,通常考慮如下原則:1.層內單元具有相同性質,通常按調查對象的不同類型進行劃分。2.盡可能使層內單元的標志值相近,層間單元的差異盡可能大。3.既按類型又按層內單元標志值相近的原則進行多重分層,同時達到實現估計類值以及提高估計精度的目的。4.抽樣組織實施的方便,通常按行政管理機構設置進行分層。四、符號說明我們用下標h表示層號(h=1,2,……,L)。關于第h層的記號如下:單元總數:樣本單元數:第i個單元標志值(觀察值):單元權數:總體均值:第L層總體方差:抽樣比:樣本均值:第L層樣本方差:§3.2簡單估計量及其性質一、總體均值的估計1.估計量的定義總體均值的估計:=如果得到的是分層隨機樣本,則總體均值的簡單估計為:2.估計量的性質性質一
對于一般的分層抽樣,如果是的無偏估計(h=1,2,……,L),則是的無偏估計。的方差為:V()=值得注意的是:只要對各層估計是無偏的,則對總體的估計也是無偏的。
因此,各層可以采用不同的抽樣方法,只要相應的估計量是無偏的,則對整體的推算也是無偏的。性質一的證明:由于對每一層有因此性質二
對于分層簡單隨機抽樣,是的無偏估計,的方差為:性質二二的證證明:若各層獨立立進行簡單單隨機抽樣樣,對每一層有有由第二章性性質二得因此性質三對于分層隨隨機抽樣,的無偏估計為:性質三的證證明:對于分層隨隨機抽樣,各層獨立進進行簡單隨機抽抽樣,由第二章性性質三,得因此,的一個無偏偏估計為:二、總體總總量的估計計1.估計量的定定義總體總量Y的估計為:如果得到的的是分層隨隨機樣本,則總體總量量Y的簡單估計計為:2.估計量的性性質由于與只差一個常數,因此,與具有相同的性質質。性質一
對于一般的分層隨機抽樣,如果是的無偏估計,則是的無偏估計,的方差為:性質二
對于分層隨機抽樣,的方差為:==性質三
對于分層隨機抽樣,的無偏估計為:【例3.1】
調查某地區的居民奶制品年消費支出,以居民戶為調查單元,根據經濟及收入水平將居民戶劃分為4層,每層按簡單隨機抽樣抽出10戶,調查獲得如下數據(單位:元)估計該地區居民奶制品年消費總支出及估計的標準差。(數據見下下表)樣本戶奶制制品年消費費支出層居民戶總數樣本戶奶制品年消費支出(元)1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025由上表,N=2850,各層的層權及抽樣比為:),4,3,2,1(,10==hnh各層樣本均均值及樣本本方差為:同理有因此,估計奶制品品年消費總總支出為::估計量方差差及標準差差的樣本估估計三、總體比比例的估計計1.估計量的定定義總體比例P的估計為::2.估計量的性性質如果定義第i個單元具有所考慮的特征;其他。(i=1,2,…,N)則對總體比比例的估計計類似對總總體均值的的估計,這這時,與具有同樣的性質。的無偏估計((h=1,2,…,L),則性質一
對于一般的分層隨機抽樣,如果是P的無偏估計。的方差為::性質二
對于分層隨機抽樣,是P的無偏估計。證明:注意到及因而的方差為:性質三
對于分層隨機抽樣,的無偏估計為V()【例3.2】在例3.1的調查中,,同時調查查了居民擁擁有家庭電電腦的情況況,獲得如如下數據((單位:臺臺),如表表3.2。估計該地地區居民擁擁有家庭電電腦的比例例及估計的的標準差。。(數據見下下表)樣本戶擁有有家庭電腦腦情況層居民戶總數樣本戶擁有家庭電腦情況12345678910120000010001002400010000001037501100001010415001000000000表3.2解:由上表可得得該地區居民民擁有家庭庭電腦比例例的估計為為:估計量的方方差為:§3.3比率估計量量及其性質質將比率估計計的思想和和技術用于于分層隨機機樣本時,,對總體參數的的估計有兩兩種途徑::一種是對每每層樣本分分別考慮比比估計量,,然后對各各層的比估估計量進行行加權平均均,此時所得的的估計量稱稱為分別估計(separateratioestimator);另一種是對對比率的分分子、分母母分別加權權計算出分分層估計量量,然后用用對應的估估計量來構構造比估計計,這樣所所得的估計計量稱為聯合比估計計(combinedratioestimator).1.分別比率估估計總體均值總體總量的分層比率估計為:總體均值:總體總量:層權L:層數為的比率估計,為比率估計比率估計量量的方差:式中,分別為第i層指標Y,X的方差及相關系數.分別比率估估計量要求求每一層的的樣本量都比較大,否則,偏倚可能比比較大.2.聯合比率估估計(combinedratioestimator)總體體均均值值::總體體總總量量::式中:表示的無偏估計;表示的無偏估計.均方誤差為:3.分別別比比率率估估計計量量與與聯聯合合比比率率估估計計量量的的比比較較一般般而而言言,,分分別別比比率率估估計計量量的的方方差差小小于于聯聯合合比比率率估估計計量量的的方方差差。。但但當當每每層層的的樣樣本本量量不不太太大大時時,,還還是是采采用用聯聯合合比比率率估估計計量量更更可可靠靠些些,,因因為為這這時時分分別別比比率率估估計計量量的的偏偏倚倚很很大大,,從從而而使使總總的的均均方方誤誤差差增增大大。。實際使用時,,如果各層的的樣本量都較較大,且有理理由認為各層層的比率Rh差異較大,則則分別比率估估計優于聯合合比率估計。。當各層的樣樣本量不大,,或各層比率率Rh差異很小,則則聯合比率估估計更好些。。【例4.4】某市1996年對950家港口生產單單位完成的吞吐量進行了了調查,1997年欲對全市港港口生產單位位完成的吞吐吐量進行調查查。對港口生生產單位按非非國有(h=1)和國有(h=2)分為兩層,單單位數分別為為800家和150家,分別在兩兩層中調查了了10家和15家港口生產單單位,調查數據如下下表,試計算算1997年全市港口生生產單位完成成的吞吐量。。1997年國有和非國有企業調調查數據如下頁頁ixiyiixiyi19580149553022202102210320335938433604964120117423040051771805600651625325861000880730234977005608332286811001230927221597208231013797103103901147846512817650139191160141160107015735698(將上述數據計計算的中間結結果列于P77的表中)1.按分別比率估估計量估計2.按聯合比率估估計量估計按聯合比率估估計量估計比按分別別比率估計量估計要好一一些!三、分別比率率估計與聯合合比率估計的的比較具體情況分析析參看教材P87§3.4回歸估計量及及其性質與比估計相似似,將回歸估估計的思想和和技術用于分分層隨機抽樣樣時,同樣有有兩種方法::一種是對每層層樣本分別求求取回歸估計計量,然后對對各層的回歸歸估計量進行行加權平均,,此時所得的的估計量稱為分別回歸估計計(separateregressionestimator);另一種是對兩兩個變量先分分別計算出分分層簡單估計計量然后再對對它們的分層層簡單估計量量來構造回歸歸估計,這時時所得的估計計量稱為聯合回歸估計計(combinedregressionestimator).1.分別回歸估計計(separateregressionestimator)總體均值的估計:總體總量的估計:當各層的回歸歸系數為事先先給定的常數數時,分別回歸估計計量是無偏的的。其方差為:其中是第h層的回歸系數并且當時,達到最小,即通常未知,可用回歸系數作為的估計:注意(1)分別回歸估計量是有偏的,但當每一層的樣本量都很大時,估計的偏倚可以忽略,其方差近似為:(2)這里是子總體的回歸系數,是子總體樣本的回歸系數,前者是未知的,后者是可知的。方差的樣本估計值為:式中,分別回歸估計計量要求每一一層的樣本量量都較大,如果這個條件得得不到滿足,則分別回歸估估計量的偏倚倚可能很大,這時,采用聯合回歸歸估計量更好好些。2.聯合回歸估計計(combinedregressionestimator)總體均值的估計:總體總量的估計:式中,分別為的分層估計。是無偏的,其方差為:并且,只要β取時,達到最小。當回歸系數未知時,取β為的樣本估計:這時,聯合回歸估計量是有偏的,但當樣本量n較大時,估計的偏倚可以忽略,其方差近似為:方差的樣本估計為:分別回歸估計計與聯合回歸歸估計的比較較當回歸系數設設定時,分別回歸估計計優于聯合回歸估計計;當回歸系數由由樣本估計時時,如果各層的樣樣本量不太小,采用分別回歸估計計為宜.否則,采用聯合回歸歸估計為好!!【例4.6】(續例4.4)利用回歸估計量估計該市港口生產單位1997年完成的吞吐量。解:樣本回歸系數數:h=1,非國有h=2,國有1.070170.856402則按分別回歸估計計量估計:(見P85)按聯合回歸估計量估估計:(見教材P86)從本題看,聯合回歸估計計量比分別回回歸估計量要要優一些!分別比率估計計、聯合比率率估計、分別別回歸估計和聯合回回歸估計的比比較(參看教材P96.【【例3.3】)比率估計與回回歸估計總結結:在分層隨機抽抽樣中,當有有輔助變量信信息可以利用時,我們可可以采用分別別比率估計、、聯合比率估估計、分別回歸估計計以及聯合回回歸估計方法法。在選用這這些估計量時,要要注意以下幾幾個問題:1、比估計是有有偏估計量,,當各層樣本本量都較大時時兩種比估計都都近似無偏;;當某些層的的樣本量不夠夠大,而總樣樣本量量較大大時,,聯合合比率率估計計近似似無偏偏。2、在回回歸估估計中中,若若事先先設定定回歸歸系數數,其其估計計量無偏;;若用用樣本本回歸歸系數數作為為回歸歸估計計系數數,其其估計計量有偏偏,但但在大大樣本本情況況下近近似無無偏。。3、當主主要變變量Y和輔助助變量量X高度相相關時時,比比率估估計和回回歸估估計都都是有有效的的,且且能大大幅度度地提提高估估計精精度。。§3.3樣本量量在各各層的的分配配對于分分層抽抽樣,,當總總的樣樣本量量一定定時,,還需需研究究各層層應該該分配配多少少樣本本量的的問題題,因因為對對總體體推算算時,,估計計量的的方差差與各各層的的方差差有關關,還還與各各層所所分配配的樣樣本量量有關關。一、比例分分配這里的的比例例分配配指的的是按按各層層單元元數占占總體體單元元數的的比例例,也也就是是按各各層的的層權權進行行分配配,這這時對于分層抽樣,這時總體均值的估計是:總體比比例P的估計計是::這是因因為總總體中中的人人一單單元,,不管管它在在哪一一層,,以同同樣的的概率率入樣樣,因因此按比例例分配配的分分層隨隨機樣樣本,,估計計量的的形式式特別別簡單單。這這種樣樣本也也稱為為自加加權的的樣本本。二、最優分分配1.最優分分配如果我我們考考慮簡簡單線線性費費用函函數,總費用用則最優分分配是是:證明:作拉格格朗日日函數數,求條件件極值值:解得:由此得得出下下面的的準則則:如果某某一層層單元元數較較多,,內部部差異異較大大,費費用比比較省,則對這這一層層的樣樣本量量要多多分配配些,,2.Neyman(內曼)分配對于分分層隨隨機樣樣本,作為特特例,如果每每一層層的費用相同,即時,最優分配可簡化為:這種分配稱為Neyman分配.這時,達到最小。【例3.3】續例3.1如果樣本量仍為n=40,則按比例分配和Neyman分配時,各層的樣本量應為多少?(見#17)解:按比例例分配配時,各層的的樣本本量為為:即各層層的樣樣本量量分別別為3,6,11,20.對于Neyman分配,根據前前面計計算所所得的的各層層權數和和方差差,得到:因此,按Neyman分配時時,各各層應應分配配的樣樣本量量為::即各層層的樣樣本量量分別別為3,7,23,,7.【例3.5】某市有甲、乙兩個地區,現進行家庭收入的調查。令n=500,已知甲地區共有20000戶居民,乙地區共有50000戶居民;甲地區居民和乙地區居民年收入標準差估計分別為;同時對甲地和乙地每戶的平均抽樣費用之比為2:3,請分別計算出甲地和乙地進行比例分配、一般最優分配(考慮費用因素)以及內曼分配(不考慮費用因素)的樣本量。【解】根據已已知的的數據據,通通過計計算整整理可可得下表表:h1200000.285725002713.2857505.07632500000.7143200031428.5714823.7861總計700001.0000---------2141.85711328.8624關于樣樣本量量分配配的計計算(1)比例分配。(2)一般般最優優分配配(3)內曼曼分配配結果比比較,,對比上上面三三組結結果可可以發發現:●一般最最優分分配在在乙地地所抽抽取的的樣本本量是是最小小的。。這是因因為一一般最最優分分配考考慮了了費用用問題題,在在乙地地抽樣樣的單單位平平均費費用較較高,,所以以最優優的原原則應應是適適當增增加甲甲地的的樣本本量,,減少少乙地地的樣樣本量量。●一般般最優優分配配和內內曼分分配在在甲地地的樣樣本量量都比比比例例分配配大,,這是是因為為甲地地總體體的方方差較較大。。為了了保證證估計計量方方差小小,子子總體體方差差大的的就要要多抽抽些樣樣本,,否則則就要要少抽抽樣本本。3.某些層層要求求大于于100%抽樣時時的修修正又比較大,則可能按最優分配計算的這個層的樣按最優分配時,可能抽樣比較大,某個層的本量超過的情況.若出現現這種種情況況,則對該該層進進行不不100%的抽樣樣,即§3.4樣本量量的確確定(1)一般般公式式令其中已經選定,于是當方差V給定時時,有有得到確定樣本量的一般公式為:令則(2)若按比例分配:將代入上式可得(3))內曼曼分配配:將代代入上上面兩兩式可可得::(4)最優分配:將代入上式可得:即d:絕對誤誤差;;r:相對對誤差差;t:標準正正態分分布的的雙側側α分位數數;這時,,樣本本量的的一般般形式式可以以表示示為::如果估估計精精度是是以誤誤差限限的形形式給給出下面將將分別別給出出比例例分配配、內內曼分分配和和最優分配配時的的樣本本量分分配形形式::(1)若按比例分配:將代入上式可得(2)當按按Neyman分配時時,(3)最優分配時:將代入上式可得:[例3.4](續例例3.1)如果果要求求在95%置信度度下,,相對對誤差差不超超過10%,則按按比例例分配配和Neyman分配時時,總總樣本本量分分別為為多少少?解:當當按比比例分分配時時:由前面面的計計算結結果,,可以以得到到各層層的Whs2h。在95%置信度度時,,對應應的t=1.96,又因此得得到由此可以得到對進行修正,得到修正后的n2.最優分配需需要考慮費費用時的情情形在最優分配時時,如果考慮費用為為簡單線性性函數則由式(3.21)有:當方差V給定時,代入式(3.24)得到樣本量量為:§3.5分層時的若若干問題1.抽樣效果分分析對于固定樣本量的情況,如果相對于1可以忽略,則式中,分別為分層隨機抽樣最優分配、分層隨機抽抽樣按比例例分配以及簡單隨機抽樣簡單估計的的方差。二、層的劃劃分既然分層抽抽樣比簡單單隨機抽樣樣效率高,,那么如何何構造層,構構造多少層層,才能使使分層抽樣樣發揮其效效率高的特點呢??這就涉及最最優分層和和確定層數數的問題。。(一)最優優分層為了提高抽樣效率,按調查目標量進行分層當然是最好的,但我們在調查前并不知道的值,因此分層只能通過與高度相關的輔助指標來進行.(見P56)(二)層的確定當分層是按按自然層或或單元類型型劃分時,層數是自然然的,但當遇到上上述運用累累積平方根根法進行分分層時,就存在層數數問題。在實際工作作中,層數數一般不超超過六層。。雖然增加加層數可以以提高估計計精度,但但在總費用用一定的條條件下增加加層數必然然導致降低低樣本量,,這時就要要考慮增加加層數而降降低樣本量量在精度上上是否合算算。三、事后分分層我們一般在在抽樣之前前將總體中的的所有單元元分好層,但在實際工工作中,有時沒有層的抽抽樣框,或總體特別別大來不及及事先分層層等原因.這時我們又又想采用分分層抽樣,就可以采用用事后分層層.事后分層要要注意的問問題(1)要求我們可可以通過某某種途徑知知道各層的層大小小或層權;(2)層權與實際際情況不能能相差太大大,否則不可能提高高精度;(3)事后分層的的層數不宜宜太多.
事后分層的具體實施辦法先采用簡單隨機抽樣的方法從總體中抽取一個樣本量為n的樣本,然后對樣本中的單元按某種特征進行分層。假設在容量為n的樣本中,落入第h層的樣本單元數為,有,則此時對總體均值的事后分層估計為:這里,下標“pst”表示事后分層;代表落入第h層的第i個樣本單元的指標值。理論上,只要n充分大,事事后分層估估計量是無無偏的。且且它的方差差有如下性性質:由上式可以以看出,第第一項就是是按比例分分配分層抽抽樣估計量量的方差,,第二項表表示因事后后分層而非非事先按比比例分配分分層引起的的方差增加加量。由此此看出,只只要樣本量量足夠大,,事后分層層的精度與與比例分配配事先分層層的精度相相當。
事后分層均值估計量的方差,可以用下面的式子來估計:其中例3.7某高校欲了了解在校學學生用于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年低碳經濟發展考試試題及答案動態分析
- 校園運動會的一天記事文章(5篇)
- 難忘的班級集體活動事件作文11篇
- 高中英語語法復習課教案:時態辨析與實踐運用
- 2025年泡騰劑項目立項申請報告模板
- 我們一起游泳難忘的夏日時光作文(12篇)
- 2025年成人高考《語文》古詩詞文學性與藝術性試題庫
- 2025年春季小學五年級數學期末沖刺卷:數學思維拓展與訓練
- 2025年電子商務師(中級)職業技能鑒定試卷:電商短視頻電商數據分析
- 2025年專升本藝術概論考試模擬卷(藝術審美心理與藝術史研究前沿課題)
- 大規模網絡流量分析技術-全面剖析
- 2024年陜西省中考地理試卷【含答案】
- 學校實驗室廢液中和處理操作規范
- 新版人教版七年級英語下1-6單元復習教案
- 地鐵事件面試試題及答案
- 2025年社區工作者考試題目及答案
- 跨國知識產權爭議的司法解決途徑
- DIP支付下的病案首頁填寫
- 2025年浙江杭州市西湖區專職社區招聘85人歷年高頻重點提升(共500題)附帶答案詳解
- 圍手術期管理制度及流程
- 應急管理部門職工招聘合同
評論
0/150
提交評論