抽樣樣本容量的確定_第1頁
抽樣樣本容量的確定_第2頁
抽樣樣本容量的確定_第3頁
抽樣樣本容量的確定_第4頁
抽樣樣本容量的確定_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

抽樣樣本容量的確定

0抽樣方法分類抽樣應遵循隨機原則,從整體中提取部分實際數據,并使用概率估算方法,根據樣本信息確定樣本的屬性,樣本信息是隨機的。根據抽選樣本的方法,抽樣調查可以分為等概率抽樣和非概率抽樣兩類。等概率抽樣又稱為隨機抽樣,是按照概率論和數理統計的原理,從調查研究的總體中,根據隨機原則來抽選樣本,并從數量上對總體的某些特征做出估計推斷,對推斷出可能出現的誤差可以從概率意義上加以控制。樣本是從總體中抽出的部分單位的集合,樣本中所包含的單位數被稱為樣本容量,一般用n表示。確定樣本容量是制定抽樣調查方案中的一個非常重要的環節。1確定樣本量的必要性1.1樣本容量的影響抽樣估計的精確度是指樣本的統計量與其所代表的總體值的接近程度。調查結果相對于總體真實值的精確度與樣本容量直接相關。樣本容量越大,抽樣誤差相對就會減少,估計精度就會提高;若樣本容量太小,抽樣誤差就會增大,從而影響抽樣估計的精確度。1.2樣本容量大小導致調查行為助力檢驗,不利于抽樣調查的發展樣本量的設計通常受到研究經費及調查時間的限制。根據數理統計規律,樣本量增加呈直線遞增的情況下(樣本量增加一倍,成本也增加一倍),而抽樣誤差只是樣本量相對增長速度的平方根遞減。若樣本容量過大,調查單位增多,不僅增加人力、財力和物力的耗費,增加調查費用,而且還影響到抽樣調查的時效性,從而不能充分發揮抽樣調查的優越性。因此,為節省調查費用,體現出抽樣調查的優越性,在確定樣本容量時,應在滿足抽樣調查對估計數據的精確度的前提下,盡量減少調查單位數,確保必要的抽樣數目。2影響所需樣品體積的主要因素2.1總體單位標志的變異程度小,總樣本容量大,總單位標志變異程度一般用方差σ2或成數方差P(1-P)的大小來表示。在其他條件不變的情況下,為了達到同樣的研究目的,總體單位標志的變異程度大,樣本容量應越大;反之,總體單位標志的變異程度越小,則樣本容量就應越少。二者成正比關系。2.2抽樣概率估計的精確控制在一定范圍內抽樣極限誤差又叫允許誤差,是指在一定的把握程度下保證樣本指標與總體指標之間的抽樣誤差不超過某一給定的最大可能范圍。在抽樣推斷中,需要把這個誤差控制在一定的范圍之內。抽樣平均數極限誤差一般用Δxˉ表示,抽樣成數極限誤差用ΔP表示。在其他條件不變的前提下,所允許的抽樣極限誤差越小,即抽樣估計的精確度要求越高,樣本容量應越大;所允許的抽樣極限誤差越大,所需的樣本容量就越小。二者成反比關系。2.3樣品概率度的計算抽樣推斷的可靠度是指總體所有可能樣本的指標落在一定區間的概率度,即允許誤差范圍的概率保證程度。概率度用Zα2表示,即置信水平1-α的統計量,一般簡寫為t。在其他條件不變的情況下,抽樣估計所要求的可靠程度越高,即概率保證程度越高,要求樣本含有的總體信息就越多,只有增加樣本容量才能滿足高精確度的要求;反之,概率保證程度越低,所需的樣本容量就越小。二者成正比關系。2.3抽樣方法的選擇概率抽樣的主要類型有簡單隨機抽樣、系統隨機抽樣、分層隨機抽樣、整群隨機抽樣、多階段隨機抽樣等。在簡單隨機抽樣中,根據同一單位是否允許重復抽取方式的不同,抽樣方法可分為重復抽樣和不重復抽樣。由于在同樣的條件下,不同的抽樣方式會產生不同的抽樣誤差,因此,樣本容量也應有所不同。一般來說,分層隨機抽樣和系統隨機抽樣的樣本容量可定得小些,若用簡單隨機抽樣和整群隨機抽樣方式,抽樣的樣本容量就要定得大些。至于抽樣方法,由于不重復抽樣的誤差小于重復抽樣的誤差,因此,不重復抽樣的樣本容量可比重復抽樣的樣本容量小些。3不同抽樣方法下樣本量的確定3.1單位組成樣本簡單隨機抽樣是指按照隨機原則從總體單位中直接抽取若干單位組成樣本。簡單隨機抽樣中分為重復簡單抽樣和簡單不重復抽樣,因此,簡單隨機抽樣的樣本容量計算公式包括兩種。3.1.1模型a:成數方差在重復抽樣條件下,樣本容量的計算公式為:其中,n代表樣本容量,t代表概率度,Δ代表極限誤差,σ2代表總體方差,P(1-P)表示成數方差。3.1.2在不重復樣本時,樣本量在不重復抽樣條件下,樣本容量的計算公式為:上式中,N代表樣本總數。3.2抽樣數量的抽取和統計分層隨機抽樣,也稱類型隨機抽樣,是指首先將調查對象的總體單位按照一定的標準分成各種不同的類別(或組),然后根據各類別(或組)的單位數與總體單位數的比例確定從各類別(或組)中抽取樣本的數量,最后按照隨機原則從各類(或組)中抽取樣本。對于分層抽樣,在總的樣本量一定時,一個重要的問題是各層應該分配多少樣本量。實際工作中有不同的分配方法,可以按對各層進行常數分配,也可以按各層單位數占總體單位數的比例分配,還可以采用在總費用一定條件下使估計量方差達到最小的最優分配等,其中等比例分配是較為常用的方法。分層抽樣是對每一組抽樣,不存在樣本組間誤差,抽樣平均誤差取決于各組內方差的平均水平,即以各組樣本單位數為權數,計算各組內方差的平均數。因此可用組內方差平均數計算出抽樣平均誤差。3.2.1平均方差在重復抽樣條件下,樣本容量的計算公式為:其中,σ2是組內平均方差,代表成數的平均組內方差。,其中ni代表各組樣本單位數,σi2代表各組的組內方差,n代表樣本總數。3.2.2在不重復樣本時,樣本量在不重復抽樣條件下,樣本容量的計算公式為:3.2.3模型主要參數ni當樣本容量n確定之后,各層應抽取的樣本單位數可采用等比例法進行分配,計算公式為:其中,ni為第i層應抽取的樣本數,n為樣本容量,Ni為第i層樣本數,N為總體單位數。3.3抽樣平均誤差計算整群隨機抽樣又稱聚類抽樣,是把總體先分為若干個子群,然后抽取若干群作為樣本單位的一種抽樣方式。整群抽樣是對選中的群進行全面調查,所以只存在群間抽樣誤差,不存在群內抽樣誤差,因此抽樣平均誤差可根據群間方差推算出來。由于整群抽樣一般是不重復抽樣,故應按不重復抽樣計算必要的抽樣群數。由整群抽樣的極限誤差和抽樣標準誤差公式導出樣本容量計算公式為:其中Pr代表成數的群間方差,σr2代表群間方差,,其中是第i群樣本平均數,是全樣本平均數,r是抽取的群數。3.4抽選間隔的確定等距抽樣也稱為系統抽樣、機械抽樣,是將總體中各單位按一定順序排列,根據樣本容量要求確定抽選間隔,然后隨機確定起點,每隔一定的間隔抽取一個單位的一種抽樣方式。根據總體單位排列方法,等距抽樣的單位排列可分為三類:按有關標志排隊、按無關標志排隊以及介于按有關標志排隊和按無關標志排隊之間的按自然狀態排列。3.4.1樣本容量的確定若對總體采用按無關標志排隊的等距抽樣時,可采用簡單隨機抽樣的公式確定等距抽樣的樣本容量。由于等距抽樣一般都是不重復抽樣,應采用在不重復抽樣條件下的樣本容量的計算公式。3.4.1樣本容量的確定若對總體采用按有關標志排隊的等距抽樣,則樣本容量的確定,可采用分層抽樣的樣本容量公式確定樣本容量。但應注意有序系統抽樣的樣本容量計算所需的平均組內方差應根據以往的資料作出估計。4確定樣本體積的相關問題4.1利用外部資料代替調查樣本容量的確定是在調查之前進行的,這樣總體方差(或樣本方差)一般是未知的。在實際工作中往往利用有關資料代替。如果在本次調查之前,曾組織過同類問題的全面調查,可用全面調查的有關資料代替;在進行正式調查之前,組織兩次或兩次以上試驗性抽樣,用試驗樣本的方差來代替;成數方差在完全缺乏資料的情況下,可用成數方差的極大值0.25(P=0.5)來代替。4.2抽樣時的調查應用公式計算的樣本容量是最低的,也是最必要的樣本容量。有時在進行抽樣調查時,一次調查要同時滿足平均數和成數兩個方面需要,這樣根據樣本容量計算公式得出的必要樣本容量可能不相等。為了同時滿足兩個推斷的要求,一般應選用其中較大的樣本單位數作為樣本容量。4.3總體大小的精確性在抽樣調查中,除上述利用公式來計算樣本容量,還有一種常用的方法,即采用經驗法則。經驗法則建立在過去抽取滿足統計方法要求的樣本量所累積下來的經驗上。使用這個方法時很少需要統計方法知識,但是得出的樣本大小很接近統計方法計算出的結果。在采用經驗法則時,有關樣本量大小的一項原則是:總體越小,要得到精確樣本,即有較高概率得出與總體相同結果的樣本,抽樣比率就要越大;較大的總體能夠使較小的抽樣比得出同樣好的樣本。這是因為隨著總體人數的增長,樣本大小的精確性會隨之增加。對于規模較小的總體(1000以下),研究者需要比較大的抽樣比率(大約30%)為要有較高的精確性,這時需要大約300個樣本;對于中等規模的總體(如10000),要達到同樣的精確度,抽樣比率為10%或大約1000個樣本量就可以了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論