




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第第2頁頁SSI本講主要內容本講主要內容 如何計算簡單隨機抽樣的樣本量確定如何計算簡單隨機抽樣的樣本量確定 如何實現分層抽樣中各層樣本單位數的分配如何實現分層抽樣中各層樣本單位數的分配第第3頁頁SSI樣本容量的確定樣本容量的確定樣本量樣本量= =費用費用+ +精度精度 (函數)(函數) 確定樣本容量,需要處理好預定的精度與現有經確定樣本容量,需要處理好預定的精度與現有經費,同時也要考慮資源和時間等限制條件,最終的樣費,同時也要考慮資源和時間等限制條件,最終的樣本量確定是在上述因素之間的權衡關系。本量確定是在上述因素之間的權衡關系。 第第4頁頁SSI分層抽樣分配樣本的標準分層抽樣分配樣本的標準1
2、. 總的樣本容量事先確定總的樣本容量事先確定2. 估計值要求達到的精度預先給定估計值要求達到的精度預先給定第第5頁頁SSI影響調查樣本容量的因素影響調查樣本容量的因素 調查估計值所希望達到的精度調查估計值所希望達到的精度 調查估計值所能允許的誤差。調查估計值所能允許的誤差。 估計量的抽樣方差較小,估計值是精確的估計量的抽樣方差較小,估計值是精確的 估計值的精度越高,所需的樣本容量就越大估計值的精度越高,所需的樣本容量就越大 影響精度的因素也同樣影響著樣本容量的大小影響精度的因素也同樣影響著樣本容量的大小 所研究指標在總體中的變異程度所研究指標在總體中的變異程度 總體的大小總體的大小 樣本設計和
3、所使用的估計量樣本設計和所使用的估計量 無回答率無回答率第第6頁頁SSI 客戶提供的經費能支持多大容量的樣本客戶提供的經費能支持多大容量的樣本 整個調查持續的時間有多長整個調查持續的時間有多長 調查需要多少訪員調查需要多少訪員 能招聘到的訪員有多少能招聘到的訪員有多少 除了估計值的精度以外,調查實際操作的限制條件除了估計值的精度以外,調查實際操作的限制條件也許是影響樣本容量的最大因素。也許是影響樣本容量的最大因素。第第7頁頁SSI 1 1給定精度水平下樣本容量的確定給定精度水平下樣本容量的確定 樣本容量的大小與調查估計值所要求的精度緊密相關樣本容量的大小與調查估計值所要求的精度緊密相關 數據是
4、通過抽樣而不是普查收集的,就會產生抽樣誤差。數據是通過抽樣而不是普查收集的,就會產生抽樣誤差。 精度是由抽樣方差來測量的。精度是由抽樣方差來測量的。 隨著樣本容量的增加,調查估計值的精度也會不斷提高。隨著樣本容量的增加,調查估計值的精度也會不斷提高。 第第8頁頁SSI標準誤差標準誤差誤差界限誤差界限變異系數變異系數抽樣方差的幾種計量方法抽樣方差的幾種計量方法 抽樣調查中樣本容量的確定,也經常會使抽樣調查中樣本容量的確定,也經常會使用一種或多種這樣的計量方法來對精度進行說用一種或多種這樣的計量方法來對精度進行說明。明。第第9頁頁SSI非抽樣誤差非抽樣誤差 非抽樣誤差會對調查估計值的精度產生顯著的
5、影響非抽樣誤差會對調查估計值的精度產生顯著的影響 非抽樣誤差的大小與樣本容量的大小卻沒有很大的關系非抽樣誤差的大小與樣本容量的大小卻沒有很大的關系 確定樣本容量,就不必將這些誤差作為影響因素加以考慮確定樣本容量,就不必將這些誤差作為影響因素加以考慮 為確保調查結果的準確性,應該消除非抽樣誤差,至少應盡為確保調查結果的準確性,應該消除非抽樣誤差,至少應盡可能使之最小化可能使之最小化第第10頁頁SSI 由于我們將在某一給定誤差界限下,闡述樣本容由于我們將在某一給定誤差界限下,闡述樣本容量確定的過程,所以有必要復習一下置信區間的概念。量確定的過程,所以有必要復習一下置信區間的概念。 對于具有正態分布
6、的估計量來說,對于具有正態分布的估計量來說,95%的置信區的置信區間意味著在同樣的條件下,反復抽樣間意味著在同樣的條件下,反復抽樣100次所得的次所得的100個樣本中,有個樣本中,有95個樣本的估計值所確定的區間包含總個樣本的估計值所確定的區間包含總體真值,這個區間以樣本的估計值為中心,半徑為體真值,這個區間以樣本的估計值為中心,半徑為1.96倍的標準誤差倍的標準誤差。置信區間置信區間第第11頁頁SSI2 2誤差界限誤差界限 誤差界限是標準誤差的倍數誤差界限是標準誤差的倍數 標準誤差是估計量抽樣方差的平方根標準誤差是估計量抽樣方差的平方根 乘數因子取決于在調查估計中所希望乘數因子取決于在調查估
7、計中所希望 達到的置信水平(或稱置信度)達到的置信水平(或稱置信度)第第12頁頁SSI對于估計值對于估計值 t, 在給定其標準誤差在給定其標準誤差 t的情況下的情況下, 置信區間的公式可以表示為:置信區間的公式可以表示為:(t-z t t+z t) 這里這里 z t是誤差界限,是誤差界限, z是對應于某一置是對應于某一置 信水平的標準正態分布的分位點值信水平的標準正態分布的分位點值 該該z值可從標準正態分布表中查得,大多值可從標準正態分布表中查得,大多 數統計學教材中都附有這樣的統計表數統計學教材中都附有這樣的統計表第第13頁頁SSI常用的z值包括v 對于對于 90% 的置信度,對應的的置信度
8、,對應的z z值為值為 1.64v 對于對于 95% 的置信度,對應的的置信度,對應的z z值為值為 1.96v 對于對于 99% 的置信度,對應的的置信度,對應的z z值為值為 2.56第第14頁頁SSI 3 3多大的抽樣方差是可接受的多大的抽樣方差是可接受的 調查估計值能容忍多大的不確定性?。調查估計值能容忍多大的不確定性?。 常用的常用的95%的置信度、的置信度、5%的誤差界限對我們的的誤差界限對我們的 調查目標是否適宜調查目標是否適宜 估計值是否需要更高(或更低)精度估計值是否需要更高(或更低)精度 如果調查結果將用于進行一項有重大意義或有較大風險的決策,如果調查結果將用于進行一項有重
9、大意義或有較大風險的決策, 那么,估計值可能需要較高的精度;那么,估計值可能需要較高的精度; 如果我們只是簡單地希望取得所研究總體某個特征的感性認識,如果我們只是簡單地希望取得所研究總體某個特征的感性認識, 那么,稍低一點的精度就可以滿足要求了那么,稍低一點的精度就可以滿足要求了第第15頁頁SSI多大抽樣方差是可以接受多大抽樣方差是可以接受 是否需要對調查的子總體(或稱作域)進行估計?是否需要對調查的子總體(或稱作域)進行估計? 調查結果可能需要包括一些細分的數據調查結果可能需要包括一些細分的數據 這些數據稱為子總體估計值(或域估計值)這些數據稱為子總體估計值(或域估計值) 為使數據滿足調查要
10、求,應該確定合適的精度為使數據滿足調查要求,應該確定合適的精度 與調查估計值有關的抽樣方差有多大?與調查估計值有關的抽樣方差有多大?第第16頁頁SSI 對于不同的子總體,對精度的要求可能有所不同對于不同的子總體,對精度的要求可能有所不同 例如,在一次全國范圍的抽樣調查中,對國家層次的數據,例如,在一次全國范圍的抽樣調查中,對國家層次的數據,調查主辦者可能需要調查主辦者可能需要3%的誤差界限;但對于省級層次的估計的誤差界限;但對于省級層次的估計值,值,5%的誤差界限可能就可以滿足要求;的誤差界限可能就可以滿足要求; 而對于省級以下層次的估計值,而對于省級以下層次的估計值,10%的誤差界限可能就的
11、誤差界限可能就足夠了。足夠了。第第17頁頁SSI 在這種情況下,通常對每個研究域都進行分層,在這種情況下,通常對每個研究域都進行分層, 并單獨計算各層的樣本容量并單獨計算各層的樣本容量 將各個研究域中所有層的樣本容量相加,便得到將各個研究域中所有層的樣本容量相加,便得到 了調查所需的總樣本容量了調查所需的總樣本容量第第18頁頁SSI調查估計值有關的抽樣方差有多大調查估計值有關的抽樣方差有多大v 為達到調查結果要求的精度,最小的調查估計值是什為達到調查結果要求的精度,最小的調查估計值是什 么?假設我們進行比例估計。其中,一些指標的比例么?假設我們進行比例估計。其中,一些指標的比例 可能是可能是P
12、=50%或更高,但是其它指標的比例則可能較或更高,但是其它指標的比例則可能較 低,如低,如P=5% 或者或者 P=10% v 事實上,事實上,P可以是可以是P=0 到到 P=1.0之間的任一數值。在確之間的任一數值。在確 定調查估計值所需的精度時,應該考慮當某個既定精定調查估計值所需的精度時,應該考慮當某個既定精 度達到時所得的最小估計值。如果最小的估計值是度達到時所得的最小估計值。如果最小的估計值是 P=5%,那么誤差界限就應該小于那么誤差界限就應該小于5%。第第19頁頁SSI例如:例如: 某公司決定,如果公司所在的地區中,至少有某公司決定,如果公司所在的地區中,至少有P=4%的人的人群對某
13、一種產品存在需求,那么該公司就決定生產這種產品。群對某一種產品存在需求,那么該公司就決定生產這種產品。因此,該公司的市場調研部準備對當地的居民一項調查,以便因此,該公司的市場調研部準備對當地的居民一項調查,以便估計他們在這種產品上的消費需求。估計他們在這種產品上的消費需求。 對于對于P=4%5%水平左右的調查估計值就不太合適,應水平左右的調查估計值就不太合適,應規定更小的誤差界限,如小于或等于規定更小的誤差界限,如小于或等于0.01、 0.02等,等,這時這時候候置信區間應該是(置信區間應該是( 0.05 0.01) 或(或( 0.05 0 .02)。)。第第20頁頁SSITable 1樣本容
14、量和在樣本容量和在P=0.5時運用簡單隨機抽樣估計時運用簡單隨機抽樣估計P值得到的誤差界限值得到的誤差界限樣本容量誤差界限500.141000.105000.04510000.032第第21頁頁SSI最佳的解決辦法最佳的解決辦法 不應為追求最小的誤差界限而選擇最大可能的樣本不應為追求最小的誤差界限而選擇最大可能的樣本 可以接受一個較大的誤差界限,同時有效地利用現有資源可以接受一個較大的誤差界限,同時有效地利用現有資源 在此基礎上,獲得具有相對較高精度的估計結果在此基礎上,獲得具有相對較高精度的估計結果 采用一個較小的樣本而不是大樣本而節省下來的費用,采用一個較小的樣本而不是大樣本而節省下來的費
15、用, 可以用來修正其它影響調查結果精度的因素可以用來修正其它影響調查結果精度的因素 例如減少無回答率(如回訪拒答者、實施小型的試點調查、例如減少無回答率(如回訪拒答者、實施小型的試點調查、 培訓訪員,等等),這樣做可能更有效率培訓訪員,等等),這樣做可能更有效率第第22頁頁SSI4 4總體的變異程度總體的變異程度 調查總體中,我們所研究的項目或指標,對于不調查總體中,我們所研究的項目或指標,對于不同的個人、住戶或企業,得到的估計結果可能會有很同的個人、住戶或企業,得到的估計結果可能會有很大的不同。雖然我們不能控制這種變異性,但它的大大的不同。雖然我們不能控制這種變異性,但它的大小卻影響到了給定
16、精度水平下,研究項目所必需的樣小卻影響到了給定精度水平下,研究項目所必需的樣本容量。本容量。 第第23頁頁SSI 我們來看假設有一個首次開展的調查,試圖估我們來看假設有一個首次開展的調查,試圖估計對某企業提供的服務持滿意態度的顧客比例。對計對某企業提供的服務持滿意態度的顧客比例。對“顧客滿意顧客滿意”這一指標,設置兩個可能的值:滿意這一指標,設置兩個可能的值:滿意或者不滿意。或者不滿意。 第第24頁頁SSI表表2列出了持滿意和不滿意態度的顧客可能占的比例的組合列出了持滿意和不滿意態度的顧客可能占的比例的組合 1100% 滿意0% 滿意290% 滿意10% 滿意380% 滿意20% 滿意470%
17、 滿意30% 滿意560% 滿意40% 滿意650% 滿意50% 滿意740% 滿意60% 滿意830% 滿意70% 滿意920% 滿意80% 滿意1010% 滿意90% 滿意110% 滿意10% 滿意第第25頁頁SSI 要精確地測量總體中具有高度變異性或不要精確地測量總體中具有高度變異性或不 經常出現的特征是很困難的。經常出現的特征是很困難的。 要對這樣的變量提供精確的估計值,需要要對這樣的變量提供精確的估計值,需要 較大的樣本容量。較大的樣本容量。 當研究的特征具有最大的變異程度時,調當研究的特征具有最大的變異程度時,調 查需要的樣本容量也最大。查需要的樣本容量也最大。 對于只取兩個值的特
18、征,則當這兩個值在對于只取兩個值的特征,則當這兩個值在 總體中以總體中以5050的比例出現時,特征的變的比例出現時,特征的變 異程度最大。異程度最大。總體的變異程度總體的變異程度 第第26頁頁SSI 如果所研究特征的真實變異程度大于確定如果所研究特征的真實變異程度大于確定 樣本容量時我們估計的變異程度,那么,樣本容量時我們估計的變異程度,那么, 調查估計值的精度就會低于期望的精度。調查估計值的精度就會低于期望的精度。 相反,如果所研究特征的真實變異程度與相反,如果所研究特征的真實變異程度與 我們所估計的變異程度相比要小,那么,我們所估計的變異程度相比要小,那么, 與調查目標所要求的估計值相比,
19、抽樣調與調查目標所要求的估計值相比,抽樣調 查得到的估計值會更加精確。查得到的估計值會更加精確。第第27頁頁SSI確保達到調查要求的精度確保達到調查要求的精度 對某一特征的總體變異程度進行保守估計對某一特征的總體變異程度進行保守估計 如果事先不知道調查中要測量特征變異程度的如果事先不知道調查中要測量特征變異程度的 數據,假定研究特征具有最大的變異程度數據,假定研究特征具有最大的變異程度 對于只有兩個可能取值的變量,應該假設總體對于只有兩個可能取值的變量,應該假設總體 中該變量的變異程度為兩個取值中該變量的變異程度為兩個取值5050平分。平分。建議在計算所需樣本容量建議在計算所需樣本容量第第28
20、頁頁SSI多個測量的指標多個測量的指標 抽樣調查時,測量指標(或稱項目,特征)抽樣調查時,測量指標(或稱項目,特征) 通常不止一個,有時數目是很大的通常不止一個,有時數目是很大的 每個指標的變異程度可能都不相同每個指標的變異程度可能都不相同 對某一指標來說足夠大的樣本,對變異程度對某一指標來說足夠大的樣本,對變異程度 較大的另一個指標來說可能就有些偏小較大的另一個指標來說可能就有些偏小 為確保樣本容量對所有的研究指標都足夠大,為確保樣本容量對所有的研究指標都足夠大, 應該根據具有最大變異程度或被認為最重要應該根據具有最大變異程度或被認為最重要 的那個指標,確定樣本容量。的那個指標,確定樣本容量
21、。第第29頁頁SSI 5. 5.總體的大小總體的大小 總體所起的作用視它規模的大小而有所差異總體所起的作用視它規模的大小而有所差異 小規模總體的大小將起重要作用小規模總體的大小將起重要作用 對于中等規模的總體,其作用中等重要對于中等規模的總體,其作用中等重要 大總體的規模對樣本容量確定則不起作用大總體的規模對樣本容量確定則不起作用在樣本容量確定的過程中在樣本容量確定的過程中第第30頁頁SSI表表3: 顯示了不同規模的總體在顯示了不同規模的總體在P=0.5時,使用簡單隨機時,使用簡單隨機抽樣,且以誤差界限為抽樣,且以誤差界限為0.05、置信度為、置信度為95%的標準估計的標準估計P 所需的樣本容
22、量所需的樣本容量總體規模所需的樣本量5044100805002221,0002865,00037010,000385100,0003981,000,00040010,000,000400第第31頁頁SSI 對于小規模總體,通常必須調查較大比對于小規模總體,通常必須調查較大比例的樣本,以取得所期望的精度。因此,實例的樣本,以取得所期望的精度。因此,實際操作中,對小規模總體經常采用普查而不際操作中,對小規模總體經常采用普查而不是抽樣調查。是抽樣調查。第第32頁頁SSI 計算樣本容量時,通常假定采用的抽樣方式為簡單隨計算樣本容量時,通常假定采用的抽樣方式為簡單隨機抽樣機抽樣(SRS)。所以,如果樣本
23、容量計算公式假定為簡單隨所以,如果樣本容量計算公式假定為簡單隨機抽樣。機抽樣。 6 6樣本設計和估計量樣本設計和估計量v 分層抽樣得到的估計值通常比相同規模的簡單隨機抽分層抽樣得到的估計值通常比相同規模的簡單隨機抽樣更精確,或者至少樣更精確,或者至少 一樣精確。一樣精確。v 整群抽樣得到的估計值,其精度通常低于使用同一估整群抽樣得到的估計值,其精度通常低于使用同一估計量進行估計時的簡單隨機抽樣的估計值的精度計量進行估計時的簡單隨機抽樣的估計值的精度第第33頁頁SSI設計效果因子設計效果因子 一般來說,當樣本容量的計算公式假定為簡單隨機抽樣一般來說,當樣本容量的計算公式假定為簡單隨機抽樣SRS,
24、但使用的是更復雜的選樣方式時,達到既定精度所需的樣本容量應但使用的是更復雜的選樣方式時,達到既定精度所需的樣本容量應該乘以該乘以設計效果設計效果因子因子。設計效果設計效果=對于同樣規模的樣本容量,給定樣本設計下對于同樣規模的樣本容量,給定樣本設計下 估計量的抽樣方差對簡單隨機抽樣估計量的估計量的抽樣方差對簡單隨機抽樣估計量的 抽樣方差的比率。抽樣方差的比率。q 對于簡單隨機抽樣設計,設計效果對于簡單隨機抽樣設計,設計效果 = 1 q 對于分層抽樣設計,設計效果對于分層抽樣設計,設計效果 1 q 對于整群抽樣設計,設計效果對于整群抽樣設計,設計效果 1 第第34頁頁SSI 7 7回答率回答率 所
25、有的調查都會遇到無回答的困擾即:所有的調查都會遇到無回答的困擾即: 由于某些原因,不能獲得被抽中樣本單位的信息由于某些原因,不能獲得被抽中樣本單位的信息 當一個被調查單位的所有或幾乎所有的數據都缺當一個被調查單位的所有或幾乎所有的數據都缺 失時,我們就稱之為完全無回答(或稱單位無回答)失時,我們就稱之為完全無回答(或稱單位無回答) 某次調查的回答率是用調查得到的有效問卷數占某次調查的回答率是用調查得到的有效問卷數占 預期樣本容量的一個百分比來表示的預期樣本容量的一個百分比來表示的 完全無回答會減少有效樣本的數量,從而會增加完全無回答會減少有效樣本的數量,從而會增加 抽樣誤差,并進而降低估計值的
26、精度抽樣誤差,并進而降低估計值的精度第第35頁頁SSI53375. 0400n例如,如果初始樣本容量是例如,如果初始樣本容量是400,而通過,而通過上述途徑估計的回答率為上述途徑估計的回答率為75%,那么選,那么選擇的樣本容量就應該為:擇的樣本容量就應該為:根據預計的回答率調整樣本容量根據預計的回答率調整樣本容量第第36頁頁SSI一個最簡單的例子一個最簡單的例子沒有無回答的簡單隨機抽樣樣本容量的計算公式沒有無回答的簡單隨機抽樣樣本容量的計算公式簡單隨機抽樣下,通常使用誤差界限和簡單隨機抽樣下,通常使用誤差界限和估計量的標準誤來確定所需的樣本容量。估計量的標準誤來確定所需的樣本容量。 第第37頁
27、頁SSInSNny)1 ( 在無放回簡單隨機抽樣情況下在無放回簡單隨機抽樣情況下總體均值估計量的標準誤差的表達式總體均值估計量的標準誤差的表達式其中,其中,S 是總體的標準差是總體的標準差第第38頁頁SSInSNnze)1(NSzeSzn22222如果誤差界限設為如果誤差界限設為e,那么:那么:解解n,得:得:這里這里Z是對應于某一置信水平的標準正態分布的分位點值是對應于某一置信水平的標準正態分布的分位點值。第第39頁頁SSI 其中,總體方差其中,總體方差S2是最不容易得到的,通常需要根是最不容易得到的,通常需要根據過去對類似總體所做的研究作近似計算。據過去對類似總體所做的研究作近似計算。為確
28、定為確定n n,需要知道需要知道 期望的誤差界限期望的誤差界限e 置信水平置信水平 對應的標準正態分布的分位點值對應的標準正態分布的分位點值 Z 總體規模總體規模 N 總體方差總體方差 S2第第40頁頁SSI求比例樣本容量的確定求比例樣本容量的確定下面用一個例子,說明估計比例問題時樣本容量的確定過程。下面用一個例子,說明估計比例問題時樣本容量的確定過程。在這一例子中,所需的精度是根據誤差界限確定的,所研究的指標在這一例子中,所需的精度是根據誤差界限確定的,所研究的指標取兩個值取兩個值,即即P和和1-P。 )1 (2PPSNPPzePPzn)1 ()1 (222在這種情況下,對于大總體,且估計量
29、服從正態分布時,在這種情況下,對于大總體,且估計量服從正態分布時,P的總體方差為:的總體方差為:第第41頁頁SSI 若總體真值已知,那么直接將它代入上面的等式若總體真值已知,那么直接將它代入上面的等式 就可以得到樣本容量就可以得到樣本容量 若總體真值未知,而且也沒有以前的信息可以利若總體真值未知,而且也沒有以前的信息可以利 用,那么可以用,那么可以P=0.5 用,因為這時的方差最大,用,因為這時的方差最大, 可以求得一個比較保守的樣本容量可以求得一個比較保守的樣本容量第第42頁頁SSI計算比例估計樣本容量的詳細步驟計算比例估計樣本容量的詳細步驟 先計算初始樣本容量,然后根據總體的大小、設計先計
30、算初始樣本容量,然后根據總體的大小、設計效果和回答率分別對它進行調整,最后求得最終的樣本效果和回答率分別對它進行調整,最后求得最終的樣本容量。容量。第第43頁頁SSI221)1 (ePPzn第第1 1步:計算初始樣本容量步:計算初始樣本容量注意,公式(注意,公式(1)使用了有限總體校正因子)使用了有限總體校正因子n/N,對總體規模進行校對總體規模進行校正。如果忽略這個因子,初始樣本容量正。如果忽略這個因子,初始樣本容量n1就可以按下列公式計算:就可以按下列公式計算:如果如果e 和和 P都不用比例表示,而用百分數表示,都不用比例表示,而用百分數表示, n1 的計算公式同樣成立。的計算公式同樣成立
31、。第第44頁頁SSI112nNNnn第第2 2步:使用下列等式對總體的大小進行調整步:使用下列等式對總體的大小進行調整第第45頁頁SSI23Bnn 第第3 3步:設計效果調整樣本容量步:設計效果調整樣本容量如果樣本設計不是采用簡單隨機抽樣,那么可以使用下列公式,如果樣本設計不是采用簡單隨機抽樣,那么可以使用下列公式,即用抽樣設計效果對樣本容量進行調整即用抽樣設計效果對樣本容量進行調整 :其中,是設計效果,并且有:其中,是設計效果,并且有: 在簡單隨機抽樣設計下,在簡單隨機抽樣設計下,B = 1, 在分層抽樣設計下,在分層抽樣設計下, B 1, 在整群抽樣設計下,在整群抽樣設計下, B 1。第第
32、46頁頁SSIrnn3根據無回答再次進行調整,以確定最終的樣本容量根據無回答再次進行調整,以確定最終的樣本容量n n其中,其中, r = 估計的回答率。估計的回答率。 第第4 4步:無回答調整樣本容量步:無回答調整樣本容量第第47頁頁SSI樣本容量確定的例子樣本容量確定的例子下面用實例說明樣本容量的計算過程下面用實例說明樣本容量的計算過程 。 例例 1. 某雜志出版商希望得到讀者對該雜志綜合滿意某雜志出版商希望得到讀者對該雜志綜合滿意程度的估計值。通過郵寄調查,出版商可以聯系到程度的估計值。通過郵寄調查,出版商可以聯系到所有的所有的2500個訂戶。但是,由于時間的限制,出版個訂戶。但是,由于時
33、間的限制,出版商決定使用簡單隨機抽樣進行電話調查。請問應訪商決定使用簡單隨機抽樣進行電話調查。請問應訪問多少個讀者問多少個讀者 ?第第48頁頁SSIv如果真實的總體比例落在總體比例的樣本估計值的如果真實的總體比例落在總體比例的樣本估計值的 0.10范圍范圍內,則該出版商將感到滿意。內,則該出版商將感到滿意。 換句話說,誤差界限換句話說,誤差界限e為為0.10 。v出版商希望調查估計值的置信度為出版商希望調查估計值的置信度為95%,這就意味著,這就意味著20次抽次抽樣中只有樣中只有1次,所得的樣本估計值確定的置信區間不包含總體次,所得的樣本估計值確定的置信區間不包含總體真值真值P,而且,而且,Z
34、=1.96。v使用簡單隨機抽樣使用簡單隨機抽樣SRS。v估計回答率為估計回答率為65% ,即,即r =0.65。v由于事先沒有關于顧客滿意度真實比例由于事先沒有關于顧客滿意度真實比例P 的可利用的信息,的可利用的信息,因此,我們假定方差取最大的情況,即假設因此,我們假定方差取最大的情況,即假設 P=0.5。假假 設設第第49頁頁SSI100)10. 0()50. 0)(50. 0()96. 1 ()1 (22221ePPzn樣本容量的計算步驟樣本容量的計算步驟 第第 1 1步:計算初始樣本容量步:計算初始樣本容量n n1 1 注意,隨著注意,隨著P 趨向趨向0.50,P(1-P) 的值將達到最
35、大值,因此的值將達到最大值,因此選擇選擇P=0.5,可得到最保守的可得到最保守的n1的估計值。的估計值。第第50頁頁SSI96)1002500(2500100112nNNnn第第 2 2步:調整初始樣本容量步:調整初始樣本容量將總體的大小這一影響樣本容量確定的因素也考慮將總體的大小這一影響樣本容量確定的因素也考慮進來進來 。(記住,這一步只適于小規模總體以及中等規模的總體記住,這一步只適于小規模總體以及中等規模的總體)第第51頁頁SSI96223nBnn第第3 3步:步: 根據抽樣設計效果來調整樣本容量根據抽樣設計效果來調整樣本容量對這個例子來說,由于假設使用簡單隨機抽樣設計,所以取對這個例子
36、來說,由于假設使用簡單隨機抽樣設計,所以取 B= 1。第第52頁頁SSI14865. 0963rnn第第4 4步:根據無回答情況進行調整步:根據無回答情況進行調整 確定最終的樣本容量確定最終的樣本容量n n第第53頁頁SSI例例 2. 2. 現準備實施一項民意調查,以決定贊成建立一現準備實施一項民意調查,以決定贊成建立一個公園的居民的比例。總體由所有在兩個城市和一個公園的居民的比例。總體由所有在兩個城市和一個農村地區居住的、年齡在個農村地區居住的、年齡在1818歲及以上的居民組成歲及以上的居民組成。通過從每個城市或農村中各抽取一個簡單隨機樣。通過從每個城市或農村中各抽取一個簡單隨機樣本,可以得
37、到一個分層隨機樣本。本,可以得到一個分層隨機樣本。問問 每一層需要多大的樣本容量?每一層需要多大的樣本容量?第第54頁頁SSI總體的單位數為總體的單位數為 657,500 657,500 總體在各層的分布情況如下:總體在各層的分布情況如下:H層總體(Nh)1城市1400,0002城市2250,0003農村地區7,500合計657,500所需要的樣本容量取決于調查對數據的具體要求,所需要的樣本容量取決于調查對數據的具體要求,為此,可以考慮以下兩個方案。為此,可以考慮以下兩個方案。 第第55頁頁SSI方案一方案一 假設不需要得到各個層估計值的精度,而且假設不需要得到各個層估計值的精度,而且如果整個
38、地區的估計值達到如果整個地區的估計值達到95%的置信度、的置信度、5%的誤差界限,就認為估計值足夠可靠了。由于沒的誤差界限,就認為估計值足夠可靠了。由于沒有整個地區贊成建立省級公園居民比例的真值,有整個地區贊成建立省級公園居民比例的真值,所以我們假設所以我們假設P=0.5,預計回答率為預計回答率為50%。第第56頁頁SSI384)05. 0()50. 0)(50. 0()96. 1 ()1 (22221ePPzn計算過程如下:計算過程如下: 第第 1 1步:計算初始樣本容量步:計算初始樣本容量n n第第57頁頁SSI384384500,657500,657384112nNNnn第第 2 2步:
39、計算初步修正的樣本容量步:計算初步修正的樣本容量n n2 2(注意:如果注意:如果 n1 /N 可以忽略不計可以忽略不計, 則可取則可取 n2=n1)第第58頁頁SSI384223nBnn第第 3 3步:根據設計效果,再次進行調整步:根據設計效果,再次進行調整n n3 3對于分層隨機抽樣,通常對于分層隨機抽樣,通常 B 1。但這里,由于沒有可利用的但這里,由于沒有可利用的B的估計值,因此,取的估計值,因此,取B= 1得到保守(即更大)的樣本容量。得到保守(即更大)的樣本容量。第第59頁頁SSI76850. 03843rnn第第4 4步:根據無回答情況步:根據無回答情況 確定最終的樣本容量確定最
40、終的樣本容量n n即根據該方案,調查所需的樣本容量為即根據該方案,調查所需的樣本容量為 768 768。第第60頁頁SSI方案方案 二二 假設對每一層,都要求得到誤差界限為假設對每一層,都要求得到誤差界限為0.05、置信度為置信度為95%的估計結果,那么就需要單獨計算各的估計結果,那么就需要單獨計算各層的樣本容量(即將每一層作為一個總體,估計調層的樣本容量(即將每一層作為一個總體,估計調查所需的樣本容量)。查所需的樣本容量)。第第61頁頁SSI 計算之前,考慮到城市計算之前,考慮到城市1和城市和城市2是大總體,是大總體,因而可以認為,對它們來說,總體的大小對樣本因而可以認為,對它們來說,總體的
41、大小對樣本容量的確定沒有影響。由此,如果第容量的確定沒有影響。由此,如果第1、2層中的層中的取值與案例取值與案例1相同,就可以認為這兩層需要的樣本相同,就可以認為這兩層需要的樣本容量都是容量都是768。然而,對于農村地區,由于總體是。然而,對于農村地區,由于總體是小規模的,因此總體的大小對該層樣本容量的確小規模的,因此總體的大小對該層樣本容量的確定會產生一定的影響。定會產生一定的影響。第第62頁頁SSI384)05. 0()50. 0)(50. 0()96. 1 ()1 (22221ePPzn001.0000,4003841Nn12nn 76850. 03841rnn 計算步驟如下:計算步驟如
42、下:城市城市 1 1由于由于可以認為可以認為所以所以第第63頁頁SSI384)05. 0()50. 0)(50. 0()96. 1 ()1 (22221ePPzn76850. 03841rnn城市城市 2 2 因為城市因為城市2也是一個大城市,所以,同樣可也是一個大城市,所以,同樣可以忽略有限總體校正因子對樣本容量的影響:以忽略有限總體校正因子對樣本容量的影響:第第64頁頁SSI384)05. 0()50. 0)(50. 0()96. 1 ()1 (22221ePPzn366384500, 7500, 7384112nNNnn73250. 03663rnn農村地區農村地區因此,因此, 方案方案
43、2 2所需的總樣本容量為所需的總樣本容量為 768 + 768 + 732 = 2,268 768 + 768 + 732 = 2,268。第第65頁頁SSI 比較方案比較方案2的總樣本容量的總樣本容量2,268和方案和方案1的樣本的樣本容量容量768,可以發現方案,可以發現方案2的樣本容量幾乎是方案的樣本容量幾乎是方案1樣本容量的樣本容量的3倍之大。倍之大。 換句話說,如果僅僅需要得到包含所有層的換句話說,如果僅僅需要得到包含所有層的整個總體的估計值,那么要求的樣本容量將大大整個總體的估計值,那么要求的樣本容量將大大小于需要分別對各層進行估計時所需的樣本容量。小于需要分別對各層進行估計時所需
44、的樣本容量。 因為對各層分別進行估計時,需要確保使每因為對各層分別進行估計時,需要確保使每一層的樣本容量都足夠大。一層的樣本容量都足夠大。兩種方案比較兩種方案比較第第66頁頁SSI 例例2 清楚地說明了要求對各研究域分別進行估計時,審查清楚地說明了要求對各研究域分別進行估計時,審查每一層精度要求的重要性。每一層精度要求的重要性。 但如果調查涉及到許多研究域,這一要求可能會使總的樣但如果調查涉及到許多研究域,這一要求可能會使總的樣本容量顯著增大,并可能導致樣本容量超出調查研究者的預算本容量顯著增大,并可能導致樣本容量超出調查研究者的預算和現有資源的承受能力。和現有資源的承受能力。 一般來說,要求
45、估計的研究域越多,所需要的樣本容量也一般來說,要求估計的研究域越多,所需要的樣本容量也就越大。就越大。 因此,可能需要在精度與費用之間進行折衷,以保證估計因此,可能需要在精度與費用之間進行折衷,以保證估計的誤差在可接受的范圍之內。的誤差在可接受的范圍之內。 通過增大每一層估計值的允許誤差,或合并其中兩個或多通過增大每一層估計值的允許誤差,或合并其中兩個或多個域,就可以使精度和費用達成權衡。個域,就可以使精度和費用達成權衡。 第第67頁頁SSI分層抽樣的樣本分配分層抽樣的樣本分配 決定分層抽樣效率的一個重要因素決定分層抽樣效率的一個重要因素是樣本單位在層間的分配方式。是樣本單位在層間的分配方式。
46、第第68頁頁SSI分層抽樣設計分層抽樣設計主要理由:主要理由: 使抽樣方案的效率高于簡單隨機抽樣或系統抽樣。使抽樣方案的效率高于簡單隨機抽樣或系統抽樣。 確保對要進行分析的特定研究域有足夠的樣本量,確保對要進行分析的特定研究域有足夠的樣本量, 以便進行分析。以便進行分析。 避免抽到一個避免抽到一個“差的差的”樣本。樣本。 第第69頁頁SSI 采用分層抽樣時,總體被分為同質的、互采用分層抽樣時,總體被分為同質的、互不重疊的幾個子總體(層)。然后,在每一個不重疊的幾個子總體(層)。然后,在每一個層中獨立地抽取樣本。可以使用任何一種抽樣層中獨立地抽取樣本。可以使用任何一種抽樣方法來對每個層進行抽樣,
47、從比較簡單的方法方法來對每個層進行抽樣,從比較簡單的方法如簡單隨機抽樣、系統抽樣,到較復雜的方法如簡單隨機抽樣、系統抽樣,到較復雜的方法如概率與大小成比例的抽樣(如概率與大小成比例的抽樣(PPS)、)、整群抽整群抽樣、多階段抽樣或多相抽樣。樣、多階段抽樣或多相抽樣。 第第70頁頁SSI 包含包含N個單位的總體,被分成大小分別為:個單位的總體,被分成大小分別為: N1,N2,NL的的L個互不重疊的子總體(層)。個互不重疊的子總體(層)。 其中:其中:N=N1+N2+NL。 從每層中分別獨立抽取一個樣本,各層內樣本容量從每層中分別獨立抽取一個樣本,各層內樣本容量 分別為分別為nh(h=1,2,L)
48、。 其中:其中: n=n1+n2+nL。第第71頁頁SSI分層抽樣分配樣本的標準分層抽樣分配樣本的標準 固定樣本容量固定樣本容量:先確定總的樣本容量,然后:先確定總的樣本容量,然后 再在層間分配樣本。再在層間分配樣本。 固定變異系數:先根據預定的精度,確定每固定變異系數:先根據預定的精度,確定每 層所需樣本容量,然后將各層的樣本容量加層所需樣本容量,然后將各層的樣本容量加 總得到總的樣本容量。總得到總的樣本容量。第第72頁頁SSI固定樣本容量固定樣本容量第一步:確定總的樣本容量第一步:確定總的樣本容量n第二步:計算分配給第第二步:計算分配給第h層的樣本比例層的樣本比例ahah=nh/n 0ah
49、1 且且 第三步:計算第第三步:計算第h層的樣本容量層的樣本容量 nh=nahLhha11第第73頁頁SSILhhhLhhhhSNYCaSNn1222122給定變異系數給定變異系數C C下總樣本容量下總樣本容量n n的計算的計算LhhhLhhhhhhSNYCaSNan1222122Nh 是第是第h層單位總數層單位總數Sh2是第是第h層單位層單位yi的真實方差的真實方差C 是是Y的總體變異系數的總體變異系數Y 是總體總值的真值是總體總值的真值ah 是分配給第是分配給第h層的樣本比例層的樣本比例第第74頁頁SSI分配方法分配方法1. 按比例分配按比例分配2. 不按比例分配不按比例分配第第75頁頁S
50、SI按比例分配按比例分配 每一層的樣本容量每一層的樣本容量nh與該層的總體規模與該層的總體規模Nh的的 比例相同,即各層的抽樣比比例相同,即各層的抽樣比fh=nh/Nh是相同的是相同的 ,并等于總的抽樣比,并等于總的抽樣比n/N。 層的規模越大,分配的樣本容量越就越多。層的規模越大,分配的樣本容量越就越多。第第76頁頁SSI例例2方案方案1中,計算總樣本容量中,計算總樣本容量=768,按比例,按比例分配方法的各層樣本容量確定如下:分配方法的各層樣本容量確定如下:第一步:計算各層的分配因子第一步:計算各層的分配因子ah城市城市1城市城市2農村農村6084. 0500,657000,40011NN
51、a3802. 0500,657000,25022NNa0114. 0500,657500, 733NNa第第77頁頁SSI第二步:計算各層樣本容量第二步:計算各層樣本容量nh城市城市1城市城市2農村農村4676084. 076811 nan2923802. 076822 nan90114. 076833 nan第第78頁頁SSIh層層規模(Nh)ahnhfh1城市1400,0000.60844670.00122城市2250,0000.38022920.00123農村地區7,5000.011490.0012合計657,50017680.0012各層抽樣比相等,均為各層抽樣比相等,均為0.0012
52、,得到一個自加權的樣本設計。,得到一個自加權的樣本設計。第第79頁頁SSI不按比例分配不按比例分配采用不按比例分配方案時,各層之間的抽樣比不相同。采用不按比例分配方案時,各層之間的抽樣比不相同。 Y-比例分配比例分配 平方根平方根N-比例分配比例分配 平方根平方根Y-比例分配比例分配 最優分配最優分配 內曼最優分配內曼最優分配 層方差相等最優分配層方差相等最優分配第第80頁頁SSIY-Y-比例分配比例分配 每層的分配因子每層的分配因子ah等于該層規模度量與總體等于該層規模度量與總體規模度量的比率。在總體估計值規模度量的比率。在總體估計值Y是規模度量時是規模度量時使用。使用。YYahh/第第81頁頁SSI
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 乙型肝炎考試題庫及答案
- 期末監測模擬試卷-2024-2025學年三年級下冊語文( 統編版)
- 《溝通禮儀辦公室禮儀》任務書-接待禮儀
- 濕地水文過程模擬-第2篇-洞察及研究
- 高純人造硅灰石項目投資風險評估報告
- 人工智能賦能中學化學教學的探索
- 廣東江門中醫藥職業學院《混凝土連續梁橋》2023-2024學年第二學期期末試卷
- 湖北工業職業技術學院《人文經典閱讀實踐(五)》2023-2024學年第二學期期末試卷
- 湖北交通職業技術學院《安全類專業寫作》2023-2024學年第二學期期末試卷
- 隱私計算與免安裝結合-洞察闡釋
- 智聯銀行筆試題庫及答案
- 高校學生資助誠信教育主題班會
- 2025年入團考試評委提問的常見問題及答案
- 貿易咨詢服務合同協議
- 施工現場常見的安全隱患排查及試題與答案
- GA/T 2161-2024法庭科學非法集資類案件資金數據分析規程
- 食管癌病例分析 手術、化療與放療方案優化
- 銀行安全培訓課件
- 2025年我國工程機械出口東南亞市場現狀分析
- 濟鋼人文考試試題及答案
- 安裝費合同協議
評論
0/150
提交評論