




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第七章抽樣推斷第七章抽樣推斷主要內容抽樣推斷的基本概念區間估計必要樣本容量的確定抽樣誤差的計算抽樣組織方式的特點2主要內容抽樣推斷的基本概念2引例
“2017年高校畢業生滿意度”、“37個城市平均月薪出爐”、“大學生平均月消費”等等,相信大部分同學都或多或少看過這類的新聞,那么這些新聞所公布的數據可信度到底是多少呢?例如大學生平均月消費為1080元,有人就笑了,說他明明才800元左右,也有人說他一個月2000多元。為什么會出現這種情況呢?相信大家都知道,“2017年高校畢業生滿意度”、“37個城市平均月薪出爐”、“大學生平均月消費”中所研究的都是總體,例如高校畢業生、37個城市和大學生,即是針對所有高校畢業生、37個城市所有的勞動力、所有大學生,但是所描述的指標如滿意度、平均月薪和平均月消費的計算卻是來自于樣本。這是出現了矛盾嗎?3引例“2017年高校畢業生滿意度”、“37個第一節抽樣推斷概述一、抽樣推斷
1.統計抽樣法抽樣調査:按照隨機原則從全部研究對象中抽取部分單位進行觀察,獲得各項數據的調查方法;抽樣推斷:運用數理統計的原理,根據抽樣調查所得的非全面調查資料來推算總體情況的一種統計研究方法。2.抽樣推斷的特點①由部分推算整體;②遵循隨機原則;③運用概率估計法;④抽樣推斷的誤差可以事先計算并加以控制。4第一節抽樣推斷概述一、抽樣推斷4第一節抽樣推斷概述一、抽樣推斷
3.抽樣推斷的作用:①在無法或很難進行全面調查的場合下,可以運用抽樣法來了解全面情況;②運用抽樣法可以對全面調查的結果加以補充或訂正;③運用抽樣法可以對生產過程中產品質量進行檢查和控制;④運用抽樣法可以對總體的某種假設進行檢查,來判斷這種假設的真偽,決定行動的取舍。
5第一節抽樣推斷概述一、抽樣推斷5第一節抽樣推斷概述二、有關抽樣的基本范疇
1.總體全及總體N:研究對象,全及總體即統計總體,又稱母體,N總是很大的數;
品質標志→屬性總體;數量標志→變量總體。樣本總體n:觀察對象,又稱子樣,簡稱樣本,是指從全及總體中隨機抽取出來,用來代表全及總體的那部分單位構成的總體,n相對于N則是很小的數。
注:對于一個確定的問題,全及總體是唯一的,樣本總體不是唯一確定的。6第一節抽樣推斷概述二、有關抽樣的基本范疇6第一節抽樣推斷概述二、有關抽樣的基本范疇
2.指標全及指標:根據全及總體各個單位的標志值或標志特征計算的,用來反映全及總體某種屬性的綜合指標;樣本指標:由樣本總體各單位標志值或標志特征計算出的綜合指標。
注:對于一個確定的問題,全及指標是唯一的,樣本指標不是唯一確定的,即樣本指標的隨機變量。7第一節抽樣推斷概述二、有關抽樣的基本范疇7統計推斷全及總體指標:參數(未知量)樣本總體指標:統計量(已知量)抽樣推斷統計推斷全及總體指標:參數(未知量)樣本總體指標:統計量(已第一節抽樣推斷概述二、有關抽樣的基本范疇
2.指標9全及指標樣本指標單位數Nn類別未加權加權未加權加權平均數標準差方差成數第一節抽樣推斷概述二、有關抽樣的基本范疇9全及指標樣本指抽樣方法的分類重復抽樣從總體N個單位中隨機抽取一個樣本容量為n的樣本,每次從總體中抽取一個,并把結果登記下來,又放回總體中重新參加下一次的抽選。又稱放回抽樣不重復抽樣每次從總體中抽選一個單位后就不再將其放回參加下一次的抽選。又稱不放回抽樣.總體單位數N不變,同一單位可能多次被抽中??傮w單位數減少n,同一單位只可能被抽中一次。根據取樣方式不同,可分為:抽樣方法的分類重復抽樣從總體N個單位中隨機抽取一個樣本容量為第二節抽樣分布一、抽樣分布
1.概念:樣本是隨機變量,樣本估計量即統計量是樣本的已知函數,也是隨機變量,因而有其概率分布。統計量的概率分布稱為抽樣分布,也稱統計量分布或隨機變量函數分布。
2.分布種類:樣本均值的分布;分布;t分布;F分布。11第二節抽樣分布一、抽樣分布11第二節抽樣分布二、樣本均值的分布
由總體中全部樣本平均數的可能取值和與之相應的概率組成。
設總體變量為X,其平均數為。在重復抽樣條件下,從總體中抽出的樣本為,并互相獨立,而且每個(i=1,2,…,n)都是從總體中隨機抽出的,所以變量與總體X是同分布的隨機變量。因此,樣本平均數的期望值與方差分別為:12第二節抽樣分布二、樣本均值的分布12第二節抽樣分布二、樣本均值的分布
可以看出,樣本平均數的分布中心與總體X的分布中心完全相同,樣本平均數的方差是總體分布方差的1/n。因此,樣本平均數分布的集中趨勢優于總體分布自身的集中趨勢。由于樣本平均數能“集中”分布于總體平均數附近,我們可以考慮用樣本平均數來估計總體的平均數。
13第二節抽樣分布二、樣本均值的分布13第二節抽樣分布三、分布
定義:設是來自總體N(0,1)的樣本,則稱統計量:服從自由度為n的分布,記為。分布的概率密度為:式中的是函數在n/2上的函數值。特別地,當n=2時,分布為指數分布。14第二節抽樣分布三、分布14第二節抽樣分布四、t分布
定義:設,
,且X,Y相互獨立,則稱隨機變量:服從自由度為n的t分布,記為。t分布的概率密度為:t分布又稱為學生氏(Student)分布。15第二節抽樣分布四、t分布15第二節抽樣分布五、F分布
定義:設,
,且U,V相互獨立,則稱隨機變量:服從自由度為的F分布,記為。t分布的概率密度為:注:上述分布都是在總體為正態分布這一基本假定下得到的。16第二節抽樣分布五、F分布16第三節抽樣誤差一、抽樣誤差的含義
1.定義:由于隨機抽樣的偶然因素使樣本各單位的結構不足以代表總體各單位的結構,而引起樣本指標和全及指標之間的絕對離差。
如:樣本平均數與總體平均數之間的絕對離差,樣本成數與總體成數之間的絕對離差,等等。
2.種類:登記性誤差:在統計工作過程中由于觀察測量、登記、計算上的差錯所引起的誤差,又稱為工作誤差,它是所有統計工作都可能發生的;代表性誤差:樣本指標值與總體指標值之間的離差。
17第三節抽樣誤差一、抽樣誤差的含義17第三節抽樣誤差一、抽樣誤差的含義
3.代表性誤差系統性誤差:由于調查人員違反隨機抽樣的原則,有意地抽選較好的單位或較差的單位進行調查,造成樣本指標值偏高或偏低。隨機誤差:由抽取樣本的隨機性引起的誤差,又分為:①抽樣實際誤差:每次抽樣調查所得的樣本指標與總指標之間的實際差數;②抽樣平均誤差:所有可能出現的抽樣實際誤差的標準差
注:系統性誤差和工作誤差都屬于思想、作風、技術問題,可以防止和避免;隨機誤差不可避免,但可以控制。18第三節抽樣誤差一、抽樣誤差的含義18第三節抽樣誤差二、抽樣平均誤差
1.作用:抽樣平均誤差是反映抽樣誤差一般水平的指標。2.衡量尺度:抽樣平均數的標準差。抽樣平均數的平均數等于總體平均數;抽樣成數的標準差。抽樣成數的平均數等于總體成數。
故:抽樣標準差恰好反映了抽樣指標和總體指標的平均離差程度。
19第三節抽樣誤差二、抽樣平均誤差19第三節抽樣誤差二、抽樣平均誤差
3.影響因素總體標準差或方差的大小:抽樣平均誤差與總體標準差或方差成正比;樣本單位數的多少:抽樣平均誤差與樣本單位數的平方根成反比;抽樣方法及抽樣組織形式的差異。4.替代法(因總體標準差或方差未知)樣本方差或代替;用估計標準差代替;用歷史資料代替,若有幾個方差,應選方差值最大的。20第三節抽樣誤差二、抽樣平均誤差20第三節抽樣誤差二、抽樣平均誤差
(一)抽樣平均數的平均誤差:重復抽樣條件下:不重復抽樣條件下:
注:由于修正因子總是小于1,因而不重復抽樣誤差總是小于重復抽樣誤差,但當總體單位數N很大的情況下,這個因子就十分接近1,因而兩種抽樣誤差就相差很小,抽樣平均誤差的公式可以表達為如下近似式:21第三節抽樣誤差二、抽樣平均誤差21第三節抽樣誤差二、抽樣平均誤差
(二)抽樣成數的平均誤差:重復抽樣條件下:不重復抽樣條件下:
同理:在總體單位數N很大的情況下,抽樣成數的平均誤差的公式可以表達為如下近似式:22第三節抽樣誤差二、抽樣平均誤差22第三節抽樣誤差三、抽樣極限誤差
1.定義:在抽樣推斷中可允許的誤差范圍,等于樣本指標可允許變動的上限或下限與總體指標之差的絕對值。2.計算公式:抽樣平均數極限誤差:或以總體平均數為中心,在到之間變動,區間稱為平均數的估計區間,區間的總長度為;抽樣平均數極限誤差或以總體平均成數P為中心,在到之間變動,抽樣成數在區間內,且與總體成數絕對離差不超過。
23第三節抽樣誤差三、抽樣極限誤差23第三節抽樣誤差四、抽樣誤差的概率度
1.定義:把極限誤差或,分別除以或得相對數t,表示誤差范圍為抽樣平均誤差的若干倍,t是測量估計可靠程度的一個參數,稱為抽樣誤差的概率度。2.計算公式:抽樣平均數:或抽樣成數:
或
24第三節抽樣誤差四、抽樣誤差的概率度24第三節抽樣誤差五、抽樣估計置信概率
1.定義:表明抽樣指標和總體指標的誤差不超過一定范圍的概率保證程度。
2.特點:以總體平均數為中心,兩邊完全對稱分布,即抽樣平均數大于或小于總體平均數的概率完全相等;抽樣平均數愈接近總體平均數,誤差出現的可能性愈大,概率愈大;注:抽樣誤差范圍和估計置信度是密不可分的,而且抽樣誤差范圍愈小,則估計置信概率也愈小。
25第三節抽樣誤差五、抽樣估計置信概率25第四節抽樣估計一、抽樣估計
1.定義:利用實際調查的抽樣資料來估計相應總體全及指標的數值,也稱參數估計。2.種類:點估計:根據抽樣資料計算樣本指標,并以此直接作為相應全及指標的估計值;區間估計:根據給定的概率保證程度的要求,利用實際抽樣資料,求出總體被估計值的上限和下限,即給出總體參數可能存在的區間范圍,而不是直接給出總體參數的估計值。
26第四節抽樣估計一、抽樣估計26第四節抽樣估計二、總體參數的點估計
1.特點:根據抽樣資料計算樣本指標,并以此直接作為相應全及指標的估計值。2.定義:設表示總體平均數的估計值,表示總體成數P的估計值,則有:
或
27第四節抽樣估計二、總體參數的點估計27第四節抽樣估計二、總體參數的點估計
3.性質:無偏性:用抽樣指標估計總體指標時,要求抽樣指標的平均數等于被估計的總體指標;一致性:用抽樣指標估計總體指標時,要求當樣本容量n充分大時抽樣指標充分靠近總體指標;有效性:抽樣指標估計總體指標時,要求作為優良估計量的方差應該比其他估計量的方差小。28第四節抽樣估計二、總體參數的點估計28第四節抽樣估計三、總體參數的區間估計
1.特點:根據給定的概率保證程度的要求,利用實際抽樣資料,求出總體被估計值的上限和下限,即給出總體參數可能存在的區間范圍,而不是直接給出總體參數的估計值。對于總體的被估計指標,找出樣本的兩個估計量和,使被估計指標落在區間內的概率為,是已知的,即,則稱區間是總體指標的置信區間,其置信概率為。稱為顯著性水平,是置信下限,為置信上限。29第四節抽樣估計三、總體參數的區間估計29第四節抽樣估計三、總體參數的區間估計
2.估計步驟根據已經給定的抽樣極限誤差范圍要求推算概率保證程度:①抽取樣本,計算樣本指標,即計算樣本平均數或樣本成數,作為總體指標的估計值,并計算樣本標準差以推算抽樣平均誤差;②根據給定的抽樣極限誤差范圍,估計總體指標的下限和上限;③將抽樣極限誤差除以抽樣平均誤差求出概率度t值,再根據t值查《正態分布概率表》,求出相應的置信概率F(t)。30第四節抽樣估計三、總體參數的區間估計30第四節抽樣估計三、總體參數的區間估計
2.估計步驟根據給定置信概率要求推算抽樣極限誤差的可能范圍:①抽取樣本,計算樣本指標,即計算樣本平均數或樣本成數作為總體指標的估計值,并計算樣本標準差以推算抽樣平均誤差;②根據給定的置信概率F(t)的要求,查概率表求得概率度t值;③根據概率度和抽樣平均誤差推算抽樣極限誤差的可能范圍,并根據抽樣極限誤差求岀被估計總體指標的上、下限。31第四節抽樣估計三、總體參數的區間估計31第四節抽樣估計四、必要樣本容量
1.定義:在一定置信概率下,為滿足抽樣極限誤差所需要的最小樣本容量n,就是必要樣本容量。
2.目的:①估計的精確度確定越大越好,即要有較小的或;②估計的可靠性越大越好,即要有較大的置信概率。①和②雖然比較矛盾,但從理論上說,不管提出多高的置信概率和多小的極限誤差,都能計算出在這樣的要求條件下所需要的必要樣本容量n。32第四節抽樣估計四、必要樣本容量32第四節抽樣估計四、必要樣本容量3.確定適當樣本容量的意義若n過大,調查工作量增大,體現不出抽樣調查的優越性;若n過小,抽樣誤差會增大,抽樣推斷就會失去價值。33n≥30,為大樣本;n<30,為小樣本第四節抽樣估計四、必要樣本容量33n≥30,為大樣本;n第五節抽樣方案設計及抽樣組織形式一、抽樣方案設計的基本原則
1.原則:①保證實現抽樣的隨機性原則;②保證實現最大的抽樣效果原則。2.抽樣組織形式:純隨機抽樣類型抽樣等距抽樣整群抽樣34第五節抽樣方案設計及抽樣組織形式一、抽樣方案設計的基本原第五節抽樣方案設計及抽樣組織形式二、純隨機抽樣(簡單隨機抽樣)
定義:直接從總體N個單位中隨機逐個地抽取樣本單位,又稱。主要有抽簽法和隨機數表法。
35應用僅適用于規模不大、內部各單位標志值差異較小的總體是最簡單、最基本、最符合隨機原則,但同時也是抽樣誤差最大的抽樣組織形式第五節抽樣方案設計及抽樣組織形式二、純隨機抽樣(簡單隨機第五節抽樣方案設計及抽樣組織形式三、類型抽樣(分層抽樣)
1.定義:先對總體各單位按主要標志加以分組,然后再從各組中按隨機原則抽選一定單位構成樣本。
36總體N樣本n等額抽取等比例抽取······能使樣本結構更接近于總體結構,提高樣本的代表性;能同時推斷總體指標和各子總體的指標第五節抽樣方案設計及抽樣組織形式三、類型抽樣(分層抽樣)第五節抽樣方案設計及抽樣組織形式三、類型抽樣
2.類型抽樣誤差的計算37第五節抽樣方案設計及抽樣組織形式三、類型抽樣37第五節抽樣方案設計及抽樣組織形式三、類型抽樣
2.類型抽樣誤差的計算38第五節抽樣方案設計及抽樣組織形式三、類型抽樣38第五節抽樣方案設計及抽樣組織形式四、等距抽樣(機械抽樣或系統抽樣)
定義:將總體單位按某一標志排序,而后按一定的間隔抽取樣本單位。
39隨機起點半距起點對稱起點(總體單位按某一標志排序)按無關標志排隊,其抽樣效果相當于簡單隨機抽樣;按有關標志排隊,其抽樣效果相當于類型抽樣。第五節抽樣方案設計及抽樣組織形式四、等距抽樣(機械抽樣或第五節抽樣方案設計及抽樣組織形式四、等距抽樣(機械抽樣或系統抽樣)
2.等距抽樣誤差的計算①按無關標志排隊用純隨機抽樣的公式,采用不重復抽樣公式:40第五節抽樣方案設計及抽樣組織形式四、等距抽樣(機械抽樣或第五節抽樣方案設計及抽樣組織形式四、等距抽樣(機械抽樣或系統抽樣)
2.等距抽樣誤差的計算②按有關標志排隊用類型抽樣的公式41第五節抽樣方案設計及抽樣組織形式四、等距抽樣(機械抽樣或第五節抽樣方案設計及抽樣組織形式五、整群抽樣
定義:將總體全部單位分為若干“群”,然后隨機抽取一部分“群”,被抽中群體的所有單位構成樣本。
例:總體群數R=16樣本群數r=442ABCDEFGHIJKLMNOPLHPD樣本容量簡單、方便,能節省人力、物力、財力和時間,但其樣本代表性可能較差第五節抽樣方案設計及抽樣組織形式五、整群抽樣42ABCD第五節抽樣方案設計及抽樣組織形式五、整群抽樣
2.整群抽樣誤差的計算43第五節抽樣方案設計及抽樣組織形式五、整群抽樣43第五節抽樣方案設計及抽樣組織形式五、整群抽樣
2.整群抽樣誤差的計算44第五節抽樣方案設計及抽樣組織形式五、整群抽樣44第五節抽樣方案設計及抽樣組織形式六、階段抽樣
定義:指分兩個或兩個以上的階段來完成抽取樣本單位的過程。
例:在某省100多萬農戶抽取1000戶調查農戶生產性投資情況。45
第一階段:從該省所有縣中抽取5個縣第二階段:從被抽中的5個縣中各抽4個鄉
第三階段:從被抽中的20個鄉中各抽5個村
第四階段:從被抽中的100個村中各抽10戶樣本n=100×10=1000(戶)第五節抽樣方案設計及抽樣組織形式六、階段抽樣45第一第五節抽樣方案設計及抽樣組織形式六、階段抽樣
2.階段抽樣誤差的計算①第一段:②第二段:46修正后的抽樣平均誤差:第五節抽樣方案設計及抽樣組織形式六、階段抽樣46修正后的第五節抽樣方案設計及抽樣組織形式七、抽樣方案的檢查
1.目的:驗證抽樣結果能否獲得最有代表性的數據,對所設計的方案進行的檢查。
2.種類:準確性檢查:以方案所要求的允許誤差為標準,用已掌握的資料檢查其在一定概率保證下,極限誤差是否超過方案所允許的誤差范圍。代表性檢查:將方案中的樣本指標與過去已掌握的總體同一指標或P進行對比,看其比率(一般用百分數表示)是否超過所規定的要求。47如果符合準確性和代表性要求的抽樣設計方案就可以付諸實施,進行實地抽樣調查,以便取得推斷總體指標所需要的樣本資料。第五節抽樣方案設計及抽樣組織形式七、抽樣方案的檢查47如小結抽樣推斷是在抽樣調查的基礎上,利用樣本的實際資料計算樣本指標,并據以推斷總體數量特征的一種統計方法。抽樣推斷常用的概念:全及總體和樣本總體、全及指標和樣本指標、重復抽樣和不重復指樣、抽樣平均誤差和抽樣極限誤差、概率度和置信概率。其中抽樣平均誤差是最重要的概念。影響抽樣平均誤差的因素是:總體標準差和方差、樣本單位數、抽樣方法和抽樣組織方式。48小結抽樣推斷是在抽樣調查的基礎上,利用樣本的實際資料計算樣本小結抽樣極限誤差是指樣本指標與總體指標之間可能的誤差范圍,而這個可能范圍是由一定的概率保證程度來控制的。抽樣極限誤差與概率保證程度成反比關系。抽樣極限誤差除以抽樣平均誤差得到的相對數—概率度,表明了樣本指標與總體指標之間的誤差不超過允許誤差范圍的概率有多大。抽樣估計有兩種方法:點估計和區間估計。介紹了五種抽樣組織方式:純隨機抽樣、分層抽樣、等距抽樣、整群抽樣、階段抽樣。49小結抽樣極限誤差是指樣本指標與總體指標之間可能的誤差范圍,而本章完本章完第七章抽樣推斷第七章抽樣推斷主要內容抽樣推斷的基本概念區間估計必要樣本容量的確定抽樣誤差的計算抽樣組織方式的特點52主要內容抽樣推斷的基本概念2引例
“2017年高校畢業生滿意度”、“37個城市平均月薪出爐”、“大學生平均月消費”等等,相信大部分同學都或多或少看過這類的新聞,那么這些新聞所公布的數據可信度到底是多少呢?例如大學生平均月消費為1080元,有人就笑了,說他明明才800元左右,也有人說他一個月2000多元。為什么會出現這種情況呢?相信大家都知道,“2017年高校畢業生滿意度”、“37個城市平均月薪出爐”、“大學生平均月消費”中所研究的都是總體,例如高校畢業生、37個城市和大學生,即是針對所有高校畢業生、37個城市所有的勞動力、所有大學生,但是所描述的指標如滿意度、平均月薪和平均月消費的計算卻是來自于樣本。這是出現了矛盾嗎?53引例“2017年高校畢業生滿意度”、“37個第一節抽樣推斷概述一、抽樣推斷
1.統計抽樣法抽樣調査:按照隨機原則從全部研究對象中抽取部分單位進行觀察,獲得各項數據的調查方法;抽樣推斷:運用數理統計的原理,根據抽樣調查所得的非全面調查資料來推算總體情況的一種統計研究方法。2.抽樣推斷的特點①由部分推算整體;②遵循隨機原則;③運用概率估計法;④抽樣推斷的誤差可以事先計算并加以控制。54第一節抽樣推斷概述一、抽樣推斷4第一節抽樣推斷概述一、抽樣推斷
3.抽樣推斷的作用:①在無法或很難進行全面調查的場合下,可以運用抽樣法來了解全面情況;②運用抽樣法可以對全面調查的結果加以補充或訂正;③運用抽樣法可以對生產過程中產品質量進行檢查和控制;④運用抽樣法可以對總體的某種假設進行檢查,來判斷這種假設的真偽,決定行動的取舍。
55第一節抽樣推斷概述一、抽樣推斷5第一節抽樣推斷概述二、有關抽樣的基本范疇
1.總體全及總體N:研究對象,全及總體即統計總體,又稱母體,N總是很大的數;
品質標志→屬性總體;數量標志→變量總體。樣本總體n:觀察對象,又稱子樣,簡稱樣本,是指從全及總體中隨機抽取出來,用來代表全及總體的那部分單位構成的總體,n相對于N則是很小的數。
注:對于一個確定的問題,全及總體是唯一的,樣本總體不是唯一確定的。56第一節抽樣推斷概述二、有關抽樣的基本范疇6第一節抽樣推斷概述二、有關抽樣的基本范疇
2.指標全及指標:根據全及總體各個單位的標志值或標志特征計算的,用來反映全及總體某種屬性的綜合指標;樣本指標:由樣本總體各單位標志值或標志特征計算出的綜合指標。
注:對于一個確定的問題,全及指標是唯一的,樣本指標不是唯一確定的,即樣本指標的隨機變量。57第一節抽樣推斷概述二、有關抽樣的基本范疇7統計推斷全及總體指標:參數(未知量)樣本總體指標:統計量(已知量)抽樣推斷統計推斷全及總體指標:參數(未知量)樣本總體指標:統計量(已第一節抽樣推斷概述二、有關抽樣的基本范疇
2.指標59全及指標樣本指標單位數Nn類別未加權加權未加權加權平均數標準差方差成數第一節抽樣推斷概述二、有關抽樣的基本范疇9全及指標樣本指抽樣方法的分類重復抽樣從總體N個單位中隨機抽取一個樣本容量為n的樣本,每次從總體中抽取一個,并把結果登記下來,又放回總體中重新參加下一次的抽選。又稱放回抽樣不重復抽樣每次從總體中抽選一個單位后就不再將其放回參加下一次的抽選。又稱不放回抽樣.總體單位數N不變,同一單位可能多次被抽中。總體單位數減少n,同一單位只可能被抽中一次。根據取樣方式不同,可分為:抽樣方法的分類重復抽樣從總體N個單位中隨機抽取一個樣本容量為第二節抽樣分布一、抽樣分布
1.概念:樣本是隨機變量,樣本估計量即統計量是樣本的已知函數,也是隨機變量,因而有其概率分布。統計量的概率分布稱為抽樣分布,也稱統計量分布或隨機變量函數分布。
2.分布種類:樣本均值的分布;分布;t分布;F分布。61第二節抽樣分布一、抽樣分布11第二節抽樣分布二、樣本均值的分布
由總體中全部樣本平均數的可能取值和與之相應的概率組成。
設總體變量為X,其平均數為。在重復抽樣條件下,從總體中抽出的樣本為,并互相獨立,而且每個(i=1,2,…,n)都是從總體中隨機抽出的,所以變量與總體X是同分布的隨機變量。因此,樣本平均數的期望值與方差分別為:62第二節抽樣分布二、樣本均值的分布12第二節抽樣分布二、樣本均值的分布
可以看出,樣本平均數的分布中心與總體X的分布中心完全相同,樣本平均數的方差是總體分布方差的1/n。因此,樣本平均數分布的集中趨勢優于總體分布自身的集中趨勢。由于樣本平均數能“集中”分布于總體平均數附近,我們可以考慮用樣本平均數來估計總體的平均數。
63第二節抽樣分布二、樣本均值的分布13第二節抽樣分布三、分布
定義:設是來自總體N(0,1)的樣本,則稱統計量:服從自由度為n的分布,記為。分布的概率密度為:式中的是函數在n/2上的函數值。特別地,當n=2時,分布為指數分布。64第二節抽樣分布三、分布14第二節抽樣分布四、t分布
定義:設,
,且X,Y相互獨立,則稱隨機變量:服從自由度為n的t分布,記為。t分布的概率密度為:t分布又稱為學生氏(Student)分布。65第二節抽樣分布四、t分布15第二節抽樣分布五、F分布
定義:設,
,且U,V相互獨立,則稱隨機變量:服從自由度為的F分布,記為。t分布的概率密度為:注:上述分布都是在總體為正態分布這一基本假定下得到的。66第二節抽樣分布五、F分布16第三節抽樣誤差一、抽樣誤差的含義
1.定義:由于隨機抽樣的偶然因素使樣本各單位的結構不足以代表總體各單位的結構,而引起樣本指標和全及指標之間的絕對離差。
如:樣本平均數與總體平均數之間的絕對離差,樣本成數與總體成數之間的絕對離差,等等。
2.種類:登記性誤差:在統計工作過程中由于觀察測量、登記、計算上的差錯所引起的誤差,又稱為工作誤差,它是所有統計工作都可能發生的;代表性誤差:樣本指標值與總體指標值之間的離差。
67第三節抽樣誤差一、抽樣誤差的含義17第三節抽樣誤差一、抽樣誤差的含義
3.代表性誤差系統性誤差:由于調查人員違反隨機抽樣的原則,有意地抽選較好的單位或較差的單位進行調查,造成樣本指標值偏高或偏低。隨機誤差:由抽取樣本的隨機性引起的誤差,又分為:①抽樣實際誤差:每次抽樣調查所得的樣本指標與總指標之間的實際差數;②抽樣平均誤差:所有可能出現的抽樣實際誤差的標準差
注:系統性誤差和工作誤差都屬于思想、作風、技術問題,可以防止和避免;隨機誤差不可避免,但可以控制。68第三節抽樣誤差一、抽樣誤差的含義18第三節抽樣誤差二、抽樣平均誤差
1.作用:抽樣平均誤差是反映抽樣誤差一般水平的指標。2.衡量尺度:抽樣平均數的標準差。抽樣平均數的平均數等于總體平均數;抽樣成數的標準差。抽樣成數的平均數等于總體成數。
故:抽樣標準差恰好反映了抽樣指標和總體指標的平均離差程度。
69第三節抽樣誤差二、抽樣平均誤差19第三節抽樣誤差二、抽樣平均誤差
3.影響因素總體標準差或方差的大?。撼闃悠骄`差與總體標準差或方差成正比;樣本單位數的多少:抽樣平均誤差與樣本單位數的平方根成反比;抽樣方法及抽樣組織形式的差異。4.替代法(因總體標準差或方差未知)樣本方差或代替;用估計標準差代替;用歷史資料代替,若有幾個方差,應選方差值最大的。70第三節抽樣誤差二、抽樣平均誤差20第三節抽樣誤差二、抽樣平均誤差
(一)抽樣平均數的平均誤差:重復抽樣條件下:不重復抽樣條件下:
注:由于修正因子總是小于1,因而不重復抽樣誤差總是小于重復抽樣誤差,但當總體單位數N很大的情況下,這個因子就十分接近1,因而兩種抽樣誤差就相差很小,抽樣平均誤差的公式可以表達為如下近似式:71第三節抽樣誤差二、抽樣平均誤差21第三節抽樣誤差二、抽樣平均誤差
(二)抽樣成數的平均誤差:重復抽樣條件下:不重復抽樣條件下:
同理:在總體單位數N很大的情況下,抽樣成數的平均誤差的公式可以表達為如下近似式:72第三節抽樣誤差二、抽樣平均誤差22第三節抽樣誤差三、抽樣極限誤差
1.定義:在抽樣推斷中可允許的誤差范圍,等于樣本指標可允許變動的上限或下限與總體指標之差的絕對值。2.計算公式:抽樣平均數極限誤差:或以總體平均數為中心,在到之間變動,區間稱為平均數的估計區間,區間的總長度為;抽樣平均數極限誤差或以總體平均成數P為中心,在到之間變動,抽樣成數在區間內,且與總體成數絕對離差不超過。
73第三節抽樣誤差三、抽樣極限誤差23第三節抽樣誤差四、抽樣誤差的概率度
1.定義:把極限誤差或,分別除以或得相對數t,表示誤差范圍為抽樣平均誤差的若干倍,t是測量估計可靠程度的一個參數,稱為抽樣誤差的概率度。2.計算公式:抽樣平均數:或抽樣成數:
或
74第三節抽樣誤差四、抽樣誤差的概率度24第三節抽樣誤差五、抽樣估計置信概率
1.定義:表明抽樣指標和總體指標的誤差不超過一定范圍的概率保證程度。
2.特點:以總體平均數為中心,兩邊完全對稱分布,即抽樣平均數大于或小于總體平均數的概率完全相等;抽樣平均數愈接近總體平均數,誤差出現的可能性愈大,概率愈大;注:抽樣誤差范圍和估計置信度是密不可分的,而且抽樣誤差范圍愈小,則估計置信概率也愈小。
75第三節抽樣誤差五、抽樣估計置信概率25第四節抽樣估計一、抽樣估計
1.定義:利用實際調查的抽樣資料來估計相應總體全及指標的數值,也稱參數估計。2.種類:點估計:根據抽樣資料計算樣本指標,并以此直接作為相應全及指標的估計值;區間估計:根據給定的概率保證程度的要求,利用實際抽樣資料,求出總體被估計值的上限和下限,即給出總體參數可能存在的區間范圍,而不是直接給出總體參數的估計值。
76第四節抽樣估計一、抽樣估計26第四節抽樣估計二、總體參數的點估計
1.特點:根據抽樣資料計算樣本指標,并以此直接作為相應全及指標的估計值。2.定義:設表示總體平均數的估計值,表示總體成數P的估計值,則有:
或
77第四節抽樣估計二、總體參數的點估計27第四節抽樣估計二、總體參數的點估計
3.性質:無偏性:用抽樣指標估計總體指標時,要求抽樣指標的平均數等于被估計的總體指標;一致性:用抽樣指標估計總體指標時,要求當樣本容量n充分大時抽樣指標充分靠近總體指標;有效性:抽樣指標估計總體指標時,要求作為優良估計量的方差應該比其他估計量的方差小。78第四節抽樣估計二、總體參數的點估計28第四節抽樣估計三、總體參數的區間估計
1.特點:根據給定的概率保證程度的要求,利用實際抽樣資料,求出總體被估計值的上限和下限,即給出總體參數可能存在的區間范圍,而不是直接給出總體參數的估計值。對于總體的被估計指標,找出樣本的兩個估計量和,使被估計指標落在區間內的概率為,是已知的,即,則稱區間是總體指標的置信區間,其置信概率為。稱為顯著性水平,是置信下限,為置信上限。79第四節抽樣估計三、總體參數的區間估計29第四節抽樣估計三、總體參數的區間估計
2.估計步驟根據已經給定的抽樣極限誤差范圍要求推算概率保證程度:①抽取樣本,計算樣本指標,即計算樣本平均數或樣本成數,作為總體指標的估計值,并計算樣本標準差以推算抽樣平均誤差;②根據給定的抽樣極限誤差范圍,估計總體指標的下限和上限;③將抽樣極限誤差除以抽樣平均誤差求出概率度t值,再根據t值查《正態分布概率表》,求出相應的置信概率F(t)。80第四節抽樣估計三、總體參數的區間估計30第四節抽樣估計三、總體參數的區間估計
2.估計步驟根據給定置信概率要求推算抽樣極限誤差的可能范圍:①抽取樣本,計算樣本指標,即計算樣本平均數或樣本成數作為總體指標的估計值,并計算樣本標準差以推算抽樣平均誤差;②根據給定的置信概率F(t)的要求,查概率表求得概率度t值;③根據概率度和抽樣平均誤差推算抽樣極限誤差的可能范圍,并根據抽樣極限誤差求岀被估計總體指標的上、下限。81第四節抽樣估計三、總體參數的區間估計31第四節抽樣估計四、必要樣本容量
1.定義:在一定置信概率下,為滿足抽樣極限誤差所需要的最小樣本容量n,就是必要樣本容量。
2.目的:①估計的精確度確定越大越好,即要有較小的或;②估計的可靠性越大越好,即要有較大的置信概率。①和②雖然比較矛盾,但從理論上說,不管提出多高的置信概率和多小的極限誤差,都能計算出在這樣的要求條件下所需要的必要樣本容量n。82第四節抽樣估計四、必要樣本容量32第四節抽樣估計四、必要樣本容量3.確定適當樣本容量的意義若n過大,調查工作量增大,體現不出抽樣調查的優越性;若n過小,抽樣誤差會增大,抽樣推斷就會失去價值。83n≥30,為大樣本;n<30,為小樣本第四節抽樣估計四、必要樣本容量33n≥30,為大樣本;n第五節抽樣方案設計及抽樣組織形式一、抽樣方案設計的基本原則
1.原則:①保證實現抽樣的隨機性原則;②保證實現最大的抽樣效果原則。2.抽樣組織形式:純隨機抽樣類型抽樣等距抽樣整群抽樣84第五節抽樣方案設計及抽樣組織形式一、抽樣方案設計的基本原第五節抽樣方案設計及抽樣組織形式二、純隨機抽樣(簡單隨機抽樣)
定義:直接從總體N個單位中隨機逐個地抽取樣本單位,又稱。主要有抽簽法和隨機數表法。
85應用僅適用于規模不大、內部各單位標志值差異較小的總體是最簡單、最基本、最符合隨機原則,但同時也是抽樣誤差最大的抽樣組織形式第五節抽樣方案設計及抽樣組織形式二、純隨機抽樣(簡單隨機第五節抽樣方案設計及抽樣組織形式三、類型抽樣(分層抽樣)
1.定義:先對總體各單位按主要標志加以分組,然后再從各組中按隨機原則抽選一定單位構成樣本。
86總體N樣本n等額抽取等比例抽取······能使樣本結構更接近于總體結構,提高樣本的代表性;能同時推斷總體指標和各子總體的指標第五節抽樣方案設計及抽樣組織形式三、類型抽樣(分層抽樣)第五節抽樣方案設計及抽樣組織形式三、類型抽樣
2.類型抽樣誤差的計算87第五節抽樣方案設計及抽樣組織形式三、類型抽樣37第五節抽樣方案設計及抽樣組織形式三、類型抽樣
2.類型抽樣誤差的計算88第五節抽樣方案設計及抽樣組織形式三、類型抽樣38第五節抽樣方案設計及抽樣組織形式四、等距抽樣(機械抽樣或系統抽樣)
定義
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國紅王子錦帶花項目創業計劃書
- 中國家用呼吸機項目創業計劃書
- 中國空管項目創業計劃書
- 中國計算機外設項目創業計劃書
- 中國牛床墊項目創業計劃書
- 2025精簡版專利權合同
- 青海飼料項目創業計劃書
- 互聯網人工智能服務使用風險提示合同書
- 稀土資源的未來潛力研究-洞察闡釋
- 農村小區土地流轉合同協議
- 外國近現代建筑史智慧樹知到期末考試答案2024年
- 2024年貴州省糧食儲備集團有限公司招聘筆試參考題庫附帶答案詳解
- 《消費者行為學》期末試卷B(含答案與評分標準)
- 校園網絡升級改造解決方案
- 局灶性大腦挫傷伴大量出血個案護理
- 學校校區年度工作總結
- 西紅柿簡介介紹
- 2024-2025北京中考英語真題閱讀CD篇
- 2022年上海公務員考試《申論》A卷
- 車輛調度培訓課件
- 公司職工書屋借閱制度范本
評論
0/150
提交評論