課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)_第1頁(yè)
課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)_第2頁(yè)
課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)_第3頁(yè)
課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)_第4頁(yè)
課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)_第5頁(yè)
已閱讀5頁(yè),還剩87頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、你應(yīng)該知道的統(tǒng)計(jì)知識(shí)中華資料採(cǎi)礦協(xié)會(huì)1何謂統(tǒng)計(jì)學(xué) 統(tǒng)計(jì)就是從數(shù)據(jù)中獲取資訊的科學(xué)收集資料整理資料分析資料導(dǎo)出結(jié)論敘述統(tǒng)計(jì)學(xué)、推論統(tǒng)計(jì)學(xué)2統(tǒng)計(jì)詞彙 母體個(gè)體樣本抽樣底冊(cè)參數(shù)統(tǒng)計(jì)量變數(shù)眾數(shù)中位數(shù)平均數(shù)3母體與樣本間的關(guān)係母體樣本抽樣樣本統(tǒng)計(jì)量推論母體參數(shù)抽樣誤差非抽樣誤差4個(gè)體樣本觀察值變數(shù)5騙人的平均數(shù)老謝應(yīng)徵工作公司規(guī)模:老闆、經(jīng)理2位、組長(zhǎng)3位、職員5位。老闆:公司平均月薪6萬(wàn)元,受訓(xùn)期間1萬(wàn)五千元,很快會(huì)加薪。做不做?6平均數(shù):6萬(wàn)中間數(shù):4萬(wàn)眾數(shù):2萬(wàn)7平均數(shù):量測(cè)觀察值散佈情形的中間值。標(biāo)準(zhǔn)差:衡量觀察值的散佈情形偏離平均值有多遠(yuǎn)。偏度:描述一個(gè)分配偏離對(duì)稱性的情形峰度:衡量觀察值偏離

2、平均數(shù)有多快。變異係數(shù):獲得相對(duì)的變異情形。變異係數(shù)標(biāo)準(zhǔn)差平均數(shù)8某次統(tǒng)計(jì)學(xué)考試,甲班平均分?jǐn)?shù)為80分,標(biāo)準(zhǔn)差為20,乙班平均分?jǐn)?shù)為75分,標(biāo)準(zhǔn)差為5,哪一班成績(jī)較優(yōu)?甲班乙班9資料衡量尺度量化的處理工具便稱為衡量的尺度,又稱量表(Scale)。問(wèn)卷衡量尺度的設(shè)計(jì)是評(píng)估報(bào)告是否深入的關(guān)鍵。不同的量表應(yīng)用不同的統(tǒng)計(jì)分析,準(zhǔn)確性才會(huì)提高。考量的依據(jù):1.研究目的與問(wèn)題深入的程度2.事後資料整理時(shí)之便利性3.各種可能選項(xiàng)的周延性與互斥性需兼顧4.統(tǒng)計(jì)的方法10一、名目尺度(nominal scale)此種量表是根據(jù)被調(diào)查對(duì)象的性質(zhì)而分類,如根據(jù)消費(fèi)者答案可分為喜歡與不喜歡或是與否兩類。每類答案的數(shù)字

3、只作為分類之用,如果將這些答案數(shù)字(1,2,3)做運(yùn)算,根本沒有意義,因?yàn)檫@些數(shù)字在此僅屬名義而已,真正目的是在分類。 二、順序尺度(ordinal scale)較類別量表多一特性,可以表示各類別之間的順序關(guān)係。如要求消費(fèi)者根據(jù)其心中偏好,將五種飲料品牌依最喜歡到最不喜歡的順序排列,最喜歡給5分、最不喜歡給1分,這就是一種順序量表。不過(guò)代表順序的數(shù)字還是不能用來(lái)做運(yùn)算,只能看出高低次序,卻無(wú)法確定順序之間的差異大小,例如若已知ABCDE,但並不知道A與B的差距,或C與D的差距,所以也無(wú)法得知兩種差距是否相等。11三、差距尺度(interval scale)較順序量表再推進(jìn)一步,不單能表示順序關(guān)

4、係,尚能測(cè)量各順序之間的距離,可確定地指出5分與4分之差距等於4分與3分的差距。差距量表的分?jǐn)?shù)可用來(lái)做加減乘除的運(yùn)算,此為其之一大優(yōu)點(diǎn),但是不能說(shuō)明6分為3分的兩倍,因?yàn)椴罹嗔勘韥K沒有一個(gè)真正零點(diǎn)(真零)。四、比率尺度(ratio scale)比率量表除了具有差距量表的全部特色外,再加上真零這個(gè)特性。例如身高、年齡、體重等變數(shù)的測(cè)量都是用比率量表,故可說(shuō)體重180磅的人比90磅的人重兩倍。不過(guò)在態(tài)度測(cè)量方面,運(yùn)用比率量表顯然有困難,消費(fèi)者給一種飲料100分,另一種給50分,但卻不表示喜歡程度有兩倍的差距。因?yàn)閼B(tài)度測(cè)量本質(zhì)上為一順序概念,顯然不宜用比率或差距量表測(cè)量。12適用於各類量表的統(tǒng)計(jì)分析

5、方法列如下表:13資料處理與展示統(tǒng)計(jì)圖表 定性資料次數(shù)分配表相對(duì)次數(shù)分配長(zhǎng)條圖圓餅圖14資料處理與展示統(tǒng)計(jì)圖表 計(jì)量資料次數(shù)分配表相對(duì)次數(shù)分配表累加次數(shù)分配表累加相對(duì)次數(shù)分配表直方圖次數(shù)多邊圖枝葉圖散佈圖15次數(shù)分配表16交叉分析表17交叉分析表18圓餅圖19圓餅圖第一次購(gòu)屋貸款:3人勞工貸款:2人公教補(bǔ)助貸款:4人自有住屋貸款中優(yōu)惠利率20圓餅圖知道的民眾主要特徵(14.7%)支持國(guó)民黨5059歲職業(yè)為軍公教或自營(yíng)商男性不知道的民眾主要特徵(85.2%)年齡為2029歲職業(yè)為學(xué)生或家庭主婦女性21折線圖22直方圖23直方圖24直方圖25盒形圖26全班35位同學(xué)統(tǒng)計(jì)學(xué)考試分?jǐn)?shù)86,77,91,

6、60,35,76,92,47,88,67,23,59,72,75,83,77,68,8297,89,81,75,74,39,67,79,83,70,78,91,68,49,56,94,81 枝葉圖27根據(jù)統(tǒng)計(jì)顯示,多數(shù)車禍發(fā)生在車子行駛於一般車速的時(shí)候,只有少數(shù)車禍發(fā)生在車速超過(guò)時(shí)速150公里。開快車較安全。研究顯示,有個(gè)城市死於心臟病的人數(shù)與口香糖的消費(fèi)量同時(shí)遽增。嚼口香糖導(dǎo)致心臟病。多數(shù)人都以一般車速開車,自然多數(shù)車禍發(fā)生於一般車速。這兩類數(shù)字的增加是因?yàn)槿丝诳焖俪砷L(zhǎng)的結(jié)果。28現(xiàn)在我要寄一封文件給一位我不認(rèn)識(shí)的人,我先寄給最有可能認(rèn)識(shí)目標(biāo)者的人,再請(qǐng)他轉(zhuǎn)寄,如此轉(zhuǎn)寄到目標(biāo)者手中,請(qǐng)問(wèn)中間

7、經(jīng)過(guò)人數(shù)?現(xiàn)場(chǎng)有兩人是同月同日生的機(jī)率為?平均為5人23人機(jī)率略高於1/2,40人機(jī)率達(dá)到90以上。29解讀民意調(diào)查A候選人支持度31.2B候選人支持度28.5C候選人支持度24.9成功訪問(wèn)1,068位受訪者,在95的信心水準(zhǔn)下,抽樣誤差為正負(fù)3。30分配(Distribution)包括了對(duì)位置 (location)、散佈 (spread) 及形狀 (shape) 的描述。在描述 (呈現(xiàn)) 變數(shù)的分配形狀時(shí),應(yīng)了解:(1) 分配的形狀和分配的位置、散佈一樣重要(2) 在了解分配的形狀時(shí),以視覺化的方式來(lái)呈現(xiàn)比以數(shù)字來(lái) 呈現(xiàn)更令人一目了然(3) 變數(shù)的分配形式?jīng)Q定了用哪一種統(tǒng)計(jì)技術(shù)來(lái)描述比較適當(dāng)

8、。31位置的衡量(measures of location) 平均數(shù)(Mean):平均數(shù)指的是算術(shù)平均數(shù),也就是在分配中各觀察值的和除以觀察數(shù)。中位數(shù)(Median):中位數(shù)是分配的中央點(diǎn)。在分配中有一半的觀察點(diǎn)低於,有一半的觀察點(diǎn)高於中位數(shù)。如果在分配中觀察點(diǎn)的數(shù)目是偶數(shù),則中位數(shù)是兩個(gè)中間數(shù)的平均數(shù)。眾數(shù)(Mode):眾數(shù)是出現(xiàn)次數(shù)最多的那個(gè)數(shù)字。32散佈的衡量(measures of spread) 變異數(shù)(Variance):變異數(shù)是衡量以平均數(shù)為基準(zhǔn)的分配情況。如果所有的分?jǐn)?shù)都相等,則變異數(shù)為零。分?jǐn)?shù)分散的情形愈大,則變異數(shù)愈大。標(biāo)準(zhǔn)差(Standard deviation):標(biāo)準(zhǔn)差

9、是變異數(shù)的平方根,它免除了變異數(shù)的平方,因而增加了解釋力。全距(Range):全距是分配中最大與最小的分?jǐn)?shù)之差,全距只涉及到最大與最小的分?jǐn)?shù),因此在衡量散佈方面是相當(dāng)粗糙的。33散佈的衡量(measures of spread)四分位距(interquartile range, IQR):是分配中第一、第三分位之差。它也稱為中點(diǎn)分配 (midspread)。第1分位Q1是第25% 的那個(gè)數(shù)字;中位數(shù)或Q2是第50% 的那個(gè)數(shù)字;第3分位Q3是第75% 的那個(gè)數(shù)字。 IQR=Q3-Q1四分位差(quartile deviation):四分位差或稱半四分位距 (semi-interquartile

10、 range) 是Q3與Q1間距離的一半。34形狀的衡量(measures of shape) 偏度(skewness):是描述一個(gè)分配偏離對(duì)稱性的情形,在對(duì)稱性的分配中,平均數(shù)、中位數(shù)、眾數(shù)都是在同樣的位置。偏態(tài)分為左偏態(tài) (或負(fù)偏態(tài)) 與右偏態(tài) (或正偏態(tài)) 二種。峰度(kurtosis):是描述一個(gè)分配的平坦或陡直情況。峰度共有三種:常態(tài)峰 (mesokurtic)、高狹峰 (leptokurtic) 及低闊峰 (platykurtic)。 35機(jī)率論(Probability Theory)機(jī)率:衡量某一事件可能發(fā)生的程度(機(jī)會(huì)),並針對(duì)此一事件發(fā)生之可能性賦予一量化的數(shù)值。及用來(lái)衡量不

11、確定性大小的工具。機(jī)率論隨機(jī)實(shí)驗(yàn)機(jī)率理論事件機(jī)率性質(zhì)與運(yùn)算法則貝氏定理36隨機(jī)實(shí)驗(yàn)(Random Experiment)隨機(jī)實(shí)驗(yàn)(Random Experiment):觀察一可產(chǎn)生各種可能結(jié)果(Outcome)的過(guò)程,稱為實(shí)驗(yàn);而若各種可能結(jié)果的出現(xiàn)(或發(fā)生)具有不確定性,則此一過(guò)程便稱為隨機(jī)實(shí)驗(yàn)。必須滿足:1.實(shí)驗(yàn)可以在相同條件下重複進(jìn)行。2.所有結(jié)果是明確可知的,且不只一個(gè)。3.實(shí)驗(yàn)後的結(jié)果為所有可能結(jié)果之一,但實(shí)驗(yàn)前無(wú)法肯定會(huì)出現(xiàn)何種結(jié)果。37檢驗(yàn)三件產(chǎn)品之樣本空間樹狀圖樣本點(diǎn)(sample point):每個(gè)可能的結(jié)果樣本空間(sample space):各種可能結(jié)果的集合事件(eve

12、nt):樣本空間的部分集合簡(jiǎn)單事件(simple event):只包含一個(gè)樣本點(diǎn)複合事件(composite event):包含二個(gè)或以上的樣本點(diǎn)38各式樣本空間39機(jī)率測(cè)度的方法古典方法:P(E)=n(E)/n(S)限制條件:樣本空間必須是有限的樣本空間。基本假設(shè):樣本空間內(nèi)每一樣本點(diǎn)出現(xiàn)的機(jī)會(huì)皆相同。客觀方法(相對(duì)次數(shù)法):P(E)=lim(n/N) , N 重複進(jìn)行此一實(shí)驗(yàn)許多次,並觀察該事件出現(xiàn)次數(shù)的比例。主觀方法:P(E)=(個(gè)人對(duì)事件E發(fā)生的信心)40機(jī)率的公理1.2. 為互斥3. P(S)=1;P()=041事件機(jī)率聯(lián)合機(jī)率(joint probability)兩個(gè)或兩個(gè)以上事件

13、同時(shí)發(fā)生的機(jī)率。邊際機(jī)率(marginal probability)在兩個(gè)或兩個(gè)以上類別的樣本空間中,若僅考慮一類別個(gè)別發(fā)生的機(jī)率稱之。條件機(jī)率(conditional probability)已知B事件發(fā)生下,另一事件A發(fā)生的機(jī)率,稱為在B發(fā)生條件下,A的條件機(jī)率。42應(yīng)徵者的資料43事件的性質(zhì)獨(dú)立事件(Independent Event)係指一事件的發(fā)生不影響其他事件的發(fā)生,若A、B兩事件互為獨(dú)立,則:相依事件(Dependent Event)係指一事件的發(fā)生影響其他事件發(fā)生的機(jī)率。44互斥事件(Mutually Exclusive Event)事件沒有共同的樣本點(diǎn)稱之,即當(dāng)兩事件之交集為

14、空集合時(shí)。sssAAABBB45事件的運(yùn)算法則餘集合的機(jī)率加法定理乘法定理分割定理ASB46貝氏定理(Bayes Theorem)事前機(jī)率取得新資訊事後機(jī)率(條件機(jī)率的形式)應(yīng)用貝氏定理事後機(jī)率事前機(jī)率條件機(jī)率47某公司計(jì)畫推出新產(chǎn)品,並認(rèn)為經(jīng)濟(jì)景氣好壞會(huì)影響新產(chǎn)品的銷售,公司行銷經(jīng)理主觀判斷景氣好、普通、不好的機(jī)率各為0.5、0.2、0.3。今公司委託專業(yè)市調(diào)公司進(jìn)行市場(chǎng)景氣調(diào)查,但該市調(diào)公司之調(diào)查並非百分之百正確,根據(jù)過(guò)去經(jīng)驗(yàn),其正確率為0.9,不正確的誤認(rèn)為其他兩種是其他兩種狀況的機(jī)率各為0.05。若該市調(diào)公司調(diào)查結(jié)果為景氣好,而市場(chǎng)景氣真正為好的機(jī)率為多少?事前機(jī)率取得新資訊事後機(jī)率主

15、觀判斷景氣好、普通、不好的機(jī)率市調(diào)公司調(diào)查結(jié)果修正機(jī)率48機(jī)率分配49隨機(jī)變數(shù)(Random Variable)係以樣本空間為定義域的實(shí)數(shù)值函數(shù),也就是隨機(jī)實(shí)驗(yàn)中對(duì)應(yīng)樣本點(diǎn)的實(shí)數(shù)值函數(shù)。X:擲一枚銅板二次,出現(xiàn)正面的次數(shù)正正正反反正反反2101/42/41/4樣本空間S隨機(jī)變數(shù)X機(jī)率f(x)50期望值(Expected Value)與變異數(shù)間斷機(jī)率分配:期望值:變異數(shù):連續(xù)機(jī)率分配:期望值:變異數(shù):51離散型機(jī)率分配二項(xiàng)分配(Binomial Distribution)幾何分配(Geometric Distribution)超幾何分配(Hypergeometric Distribution)波

16、瓦松分配 ( Possion Distribution)52二項(xiàng)分配(Binomial Distribution)伯努利試驗(yàn)(Bernoulli Trial)每一次試驗(yàn)皆僅有兩種可能結(jié)果,不是成功(S),就是失敗(F)。成功機(jī)率固定為為P(S)=p,失敗機(jī)率固定為為P(F)=1-p。每一次試驗(yàn)之間互為獨(dú)立。進(jìn)行n次的伯努利試驗(yàn),稱為二項(xiàng)實(shí)驗(yàn),若隨機(jī)變數(shù)X為n次試行實(shí)驗(yàn)成功的次數(shù),X的機(jī)率分配稱為二項(xiàng)機(jī)率分配。53二項(xiàng)機(jī)率分配函數(shù):00.050.10.150.20.250.30.35123456n=5, p=0.5P(X=x)00.10.20.30.40.50.60.7123456n=5, p=

17、0.3P(X=x)00.10.20.30.40.50.60.7123456n=5, p=0.9P(X=x)54超幾何分配(Hypergeometric Distribution)超幾何實(shí)驗(yàn):從一含有N物的有限母體中,採(cǎi)不放回抽樣,抽取n個(gè)隨機(jī)樣本。N物中有S個(gè)屬成功類,另N-S個(gè)屬失敗類。隨機(jī)變數(shù)X為n個(gè)中,成功的次數(shù), X的機(jī)率分配稱為超幾何機(jī)率分配。S成功類S個(gè)失敗類N-S個(gè)x n-x55超幾何機(jī)率分配函數(shù):56幾何分配(Geometric Distribution)二項(xiàng)分配為進(jìn)行n次的伯努利試驗(yàn)的成功次數(shù)分配,如果未預(yù)先固定試驗(yàn)的次數(shù),而在第一次成功發(fā)生之後才停止整個(gè)伯努利試驗(yàn),成功的次

18、數(shù)固定為1,所需試驗(yàn)的次數(shù)則為一隨機(jī)變數(shù),此隨機(jī)變數(shù)的機(jī)率分配即稱為幾何分配。幾何機(jī)率分配函數(shù):57波瓦松分配 ( Possion Distribution)在一特定區(qū)間(或區(qū)域)內(nèi),觀察某特定事件發(fā)生的次數(shù)。上午10點(diǎn)至11點(diǎn)中,每10分鐘打進(jìn)公司的電話通數(shù)。1天內(nèi)停車場(chǎng)停車數(shù)。高速公路每10公里路面有窪動(dòng)的數(shù)目。秘書小姐每打一頁(yè)報(bào)告出現(xiàn)錯(cuò)誤的字?jǐn)?shù)。波瓦松實(shí)驗(yàn):在一連續(xù)區(qū)間發(fā)生事件的次數(shù),與另一區(qū)間發(fā)生的次數(shù)是獨(dú)立的。在一連續(xù)區(qū)間內(nèi)發(fā)生事件的的期望值(平均數(shù))與區(qū)間大小成比例。在一極短的區(qū)間內(nèi),僅有兩種狀況,即發(fā)生一次或不發(fā)生,而發(fā)生兩次或以上的情形不予考慮。若一事件滿足上述三個(gè)特質(zhì),隨機(jī)變

19、數(shù)X定義為連續(xù)區(qū)間內(nèi)發(fā)生事件的次數(shù),則X為一波瓦松隨機(jī)變數(shù),其機(jī)率分配為波瓦松分配。58波瓦松分配函數(shù):式中 表示在某特定區(qū)間內(nèi)某事件所發(fā)生平均次數(shù),而e=2.71828。某公司訂有消費(fèi)者7天內(nèi)不滿意免費(fèi)退貨服務(wù),根據(jù)過(guò)去記錄,每7天平均2件被要求退貨,問(wèn)在14天內(nèi)會(huì)被退5件的機(jī)率?59二項(xiàng)、超幾何與波瓦松分配之間關(guān)係超幾何分配二項(xiàng)分配波瓦松分配當(dāng)n/N20且np=7時(shí),可用波瓦松分配取代二項(xiàng)分配60連續(xù)型機(jī)率分配均等分配(Uniform Distribution)常態(tài)分配(Normal Distribution)指數(shù)分配(Exponential Distribution)61均等分配(Uni

20、form Distribution)隨機(jī)變數(shù)在某區(qū)間(a,b)內(nèi)發(fā)生機(jī)率皆相同時(shí),其機(jī)率分配稱之。機(jī)率密度函數(shù): abf(x)62某班火車抵達(dá)車站的時(shí)間在8點(diǎn)至8點(diǎn)10分之間,且在此時(shí)段中任何時(shí)點(diǎn)到站的可能性均相同。1.某乘客在8點(diǎn)3分抵達(dá)車站,可搭上火車的機(jī)率?2.某乘客在8點(diǎn)8分抵達(dá)車站,火車已開走的機(jī)率?3.計(jì)算期望值與變異數(shù),並解釋期望值的意義。X表示火車在8點(diǎn)以後到站的時(shí)間,63常態(tài)分配(Normal Distribution)又稱高斯分配(Gauss Distribution)。重要性:1.許多自然現(xiàn)象,工業(yè)生產(chǎn)、商業(yè)問(wèn)題及社會(huì)現(xiàn)象均可用常態(tài)分配加以描述。2.許多統(tǒng)計(jì)量的的抽樣分配

21、在大樣本下呈常態(tài)分配。3.常態(tài)分配可進(jìn)行許多統(tǒng)計(jì)推論,許多統(tǒng)計(jì)量的的抽樣分配如t分配、卡方分配、F分配都必須假設(shè)母體為常態(tài)分配才可獲得。4.間斷機(jī)率分配在某些條件下可利用常態(tài)分配求其近似值。64機(jī)率密度函數(shù):65常態(tài)分配特性:1.以平均數(shù) 為中心的對(duì)稱曲線。2.平均樹、眾數(shù)、中位數(shù)均相等( )。3.以 為中心,兩邊加減一個(gè)標(biāo)準(zhǔn)差之處,為常態(tài)曲線的反曲點(diǎn)(Inflection Point)。4.常態(tài)曲線左右兩尾與橫軸逐漸接近,但絕不會(huì)相交。5.以 為中心,兩邊加減一個(gè)標(biāo)準(zhǔn)差的區(qū)間,其機(jī)率(面積)為0.683,加減二個(gè)標(biāo)準(zhǔn)差的區(qū)間,其機(jī)率(面積)為0.954,加減三個(gè)標(biāo)準(zhǔn)差,其機(jī)率(面積)為0.9

22、97。66標(biāo)準(zhǔn)常態(tài)分配(Standard Normal Distribution):即平均數(shù)為0,標(biāo)準(zhǔn)差為1的常態(tài)分配。機(jī)率密度函數(shù): 標(biāo)準(zhǔn)化(Normalized):67某品牌家電用品的使用壽命為平均數(shù)4.5年,標(biāo)準(zhǔn)差為1年的常態(tài)分配。若其保證期間為二年,推算其退貨的比例。X表示該品牌家電用品使用壽命,某公司生產(chǎn)高級(jí)辦公桌,其裝配時(shí)間為常態(tài)分配,平均數(shù)56分鐘,標(biāo)準(zhǔn)差4分鐘。現(xiàn)有一客戶要求於1個(gè)鐘頭後準(zhǔn)時(shí)到達(dá)公司提貨,如從現(xiàn)在開始裝配準(zhǔn)時(shí)完成交貨的機(jī)率為?X表示裝配一張桌子所需時(shí)間,68指數(shù)分配(Exponential Distribution)與波瓦松分配相反,指數(shù)隨機(jī)變數(shù)在說(shuō)明接連兩件事

23、發(fā)生的間隔期間。69機(jī)率密度函數(shù):1.指數(shù)分配曲線為非對(duì)稱性,範(fàn)圍為(0, )。2.平均數(shù) 必大於0。x70某一型彩色電視機(jī)其壽命時(shí)間成指數(shù)分配,且平均壽命為10年。求該電視機(jī)的壽命時(shí)間之下列機(jī)率:1.壽命長(zhǎng)達(dá)15年以上。2.兩年內(nèi)即發(fā)生故障而報(bào)廢。3.壽命時(shí)間介於2年至15年。X表示該電視機(jī)之壽命時(shí)間,71標(biāo)準(zhǔn)常態(tài)分配值z(mì)P(Zz)72指數(shù)分配值x73抽樣(Sampling) 估計(jì)誤差(Error of Estimation)抽樣誤差(Sampling Error)非抽樣誤差(Nonsampling Error)樣本統(tǒng)計(jì)量母體參數(shù)估計(jì)誤差抽樣誤差非抽樣誤差1.樣本數(shù)2.推論方法3.抽樣方法資

24、料整理時(shí)的疏失74抽樣方法非機(jī)率抽樣立意抽樣法便利抽樣法滾雪球抽樣法配額抽樣 機(jī)率抽樣簡(jiǎn)單隨機(jī)抽樣分層抽樣集群抽樣系統(tǒng)抽樣 抽樣方法非機(jī)率抽樣法機(jī)率抽樣法75非機(jī)率抽樣法非機(jī)率抽樣:亦即樣本不按照其機(jī)率予以抽出,而是由抽樣者之主觀抽出或自願(yuàn)樣本。優(yōu)點(diǎn):在某些調(diào)查時(shí),有其必要性。缺點(diǎn):(1)難以評(píng)斷樣本之代表性。 (2)無(wú)法估計(jì)精確度。 (3)樣本偏差往往較大。非機(jī)率抽樣之種類:1.立意樣本(Judged Sampling):調(diào)查研究人員根據(jù)自己的專長(zhǎng)、知識(shí)、研究目的來(lái)選取代表性的樣本。如學(xué)者、專家或代表性之樣本。2.便利樣本(Convenient Sampling):事先不預(yù)定樣本,碰到即問(wèn)或

25、自動(dòng)回答者。如街頭訪問(wèn)或主動(dòng)打電話回答問(wèn)題者。缺點(diǎn):注意樣本之偏激性及兩極化。3.滾式樣本(輻射樣本):利用樣本尋找樣本,亦即利用樣本之滾雪球方式或輻射力抽取樣本。如都市中之原住民抽樣。使用時(shí)機(jī):可用於當(dāng)樣本不易取得時(shí),或針對(duì)特殊族群之調(diào)查。4.配額樣本:按母體某些特性予以配置樣本,但取樣時(shí)卻由調(diào)查員任意抽取。76機(jī)率抽樣機(jī)率抽樣:抽取之樣本是按照樣本之機(jī)率隨機(jī)抽出。優(yōu)點(diǎn):1.樣本較具代表性。2.可計(jì)算估計(jì)之精確度。3.可隨不同之抽樣設(shè)計(jì)採(cǎi)取不同之抽樣方法。4.隨之不同之抽樣方法,採(cǎi)取相互配合之估計(jì)方法。機(jī)率抽樣之種類:1.簡(jiǎn)單隨機(jī)抽樣:不對(duì)母體加以任何修飾或分割,而使每一樣本均有相同之被抽中

26、機(jī)率。2.分層隨機(jī)抽樣:將母體按照某些特性,分成數(shù)個(gè)不重疊的組群,這些組群即稱為層,而再由各層分別抽取樣本。3.系統(tǒng)抽樣:將母體之元素按順序編號(hào)後,有系統(tǒng)的每隔一定間隔抽取一個(gè)樣本之方法。4.集群抽樣:將母體中相鄰近之個(gè)體排成為一集體,而以集體為抽樣單位,即每一抽樣單位為一集體之抽樣單位。5.兩段集群抽樣:首先抽出一些樣本集體,再由樣本集體內(nèi)抽出部分基本個(gè)體。6.分層集群抽樣:將母體內(nèi)之集體予以分層後,再由各層抽取樣本。77簡(jiǎn)單隨機(jī)抽樣法(simple random sampling)簡(jiǎn)單隨機(jī)抽樣是一種最基礎(chǔ)且最簡(jiǎn)便的抽樣方法。優(yōu)點(diǎn)是(i)當(dāng)母體底冊(cè)完整時(shí),直接由母體中抽出樣本,方法簡(jiǎn)單;和(

27、ii)每一單位被抽中的機(jī)率均相等,參數(shù)的估計(jì)較簡(jiǎn)單。限制是(i)母體底冊(cè)不易取得,或取得很費(fèi)時(shí),費(fèi)力且費(fèi)錢;(ii)母體內(nèi)樣本單位太多時(shí),作業(yè)不方便;(iii)樣本分配較分散,行政作業(yè)較不易;和(iv)樣本代表性恐有不足(尤其當(dāng)樣本點(diǎn)差異大時(shí)或重要性不同時(shí))。使用最佳時(shí)機(jī),便是當(dāng)(i)母體內(nèi)樣本單位不多,且有完備名冊(cè),可茲編號(hào)時(shí);(ii)母體內(nèi)樣本單位間的差異不大時(shí)(對(duì)研究的目的而言);和(iii)對(duì)母體資訊無(wú)法充份獲得時(shí)。簡(jiǎn)單隨機(jī)抽樣法的準(zhǔn)確度會(huì)受下列二因素的影響,即(i)母體本身的變異,和(ii)樣本的大小。78分層抽樣法(stratified sampling)優(yōu)點(diǎn)是(i)可增加樣本代表

28、性;(ii)可提高估計(jì)的確度;(iii)可分別獲得各層的訊息,並做各層間的比較分析;(iv)可在各層設(shè)立行政單位,以便於執(zhí)行;和(v)可視各層情形,採(cǎi)取不同的抽樣方法。限制是(i)分層變數(shù)的選取(要與所欲估計(jì)的特徵值具有高度相關(guān));(ii)層數(shù)的釐定(要適當(dāng)並配合母體的分配狀況);(iii)分層標(biāo)準(zhǔn)的決定(各層不能有重疊現(xiàn)象);(iv)各層樣本的配置方法;和(v)分層後,樣本資料的整理及估計(jì)較複雜。使用最佳時(shí)機(jī),便是當(dāng)(i)母體內(nèi)樣本單位的差異較大時(shí);和(ii)分層後能達(dá)到層間差異大,層內(nèi)差異小的原則。原則上要使層內(nèi)變異小,而層間變異大;各層不能有重疊現(xiàn)象。 第一層第二層第K層:樣本79系統(tǒng)抽

29、樣法(systematic sampling) 優(yōu)點(diǎn)是(i)在抽取樣本的過(guò)程中,很容易完成抽樣工作;(ii)通常可使樣本普遍的散佈於母體內(nèi),使樣本更具代表性;和(iii)在某些條件下,系統(tǒng)抽樣可取代簡(jiǎn)單隨機(jī)抽樣。限制是(i)對(duì)母體狀況宜略有所瞭解;(ii)避免系統(tǒng)樣本內(nèi)的樣本單位趨於一致;(iii)不易計(jì)算估計(jì)量的變異數(shù),和(iv)避免母體內(nèi)樣本單位特徵值的週期性變動(dòng)。使用最好是當(dāng)(i)母體內(nèi)的樣本單位,按有興趣的特徵值而言是隨機(jī)的或按大小排列的;(ii)母體內(nèi)單位數(shù)過(guò)多,而抽取的樣本又較多時(shí);和(iii)母體內(nèi)的單位數(shù)不能確定時(shí)。1 2 3 4 5 6 7 8 9 10 11 12 13 1

30、4 15 16 17 18 s (s+1) (s+2) N61218樣本母體K=N/n80群集抽樣法(cluster sampling)有時(shí)母體底冊(cè)的蒐集及編造極為困難或龐大,而在調(diào)查時(shí)又希望節(jié)省成本時(shí),則可採(cǎi)用群集抽樣法。舉例來(lái)說(shuō),在森林區(qū)的材積調(diào)查中,將調(diào)查區(qū)劃分多個(gè)小塊以為群集。又如在住戶調(diào)查中,以鄰或區(qū)段作為群集以進(jìn)行訪查。優(yōu)點(diǎn)是(i)母體底冊(cè)的編造較為簡(jiǎn)單;(ii)調(diào)查行動(dòng)半徑較小,調(diào)查成本較低;(iii)行政管理較為容易;和(iv)通信調(diào)查時(shí)較易宣傳及進(jìn)行。限制是(i)群集內(nèi)樣本單位的一致性太強(qiáng),則易浪費(fèi)樣本;和(ii)群集大小的決定。使用最好時(shí)機(jī)是當(dāng)(i)母體底冊(cè)不易獲得時(shí);(i

31、i)為簡(jiǎn)省調(diào)查成本時(shí);及(iii)群集內(nèi)差異大,而群集間的變異小。採(cǎi)用群集抽樣法進(jìn)行樣本調(diào)查時(shí),要注意到以下兩個(gè)原則。亦即,(i)根據(jù)經(jīng)驗(yàn)、試查及實(shí)際狀況以決定適當(dāng)?shù)娜杭缓?ii)確定群集間變異小,而群集內(nèi)變異大。81抽樣分配母體參數(shù)(Parameter)描述母體資料特性的統(tǒng)計(jì)測(cè)量數(shù),為未知但固定的數(shù)。樣本統(tǒng)計(jì)量(Statistics)為一組隨機(jī)樣本的實(shí)數(shù)值函數(shù)。抽樣分配(Sampling Distribution)樣本統(tǒng)計(jì)量為一隨機(jī)變數(shù),其機(jī)率分配稱為抽樣分配。82樣本平均數(shù)的抽樣分配自一大小為N的母體抽出一組隨機(jī)樣本, 則樣本平均數(shù) 本身亦為隨機(jī)變數(shù), 有其機(jī)率分配。抽自無(wú)限母體:抽自有限母體:83母體常態(tài)分配非常態(tài)分配大樣本(n 30)小樣本(n 30)大樣本(n 30)小樣本(n中央極限定理=母體 已知=母體 未知=常態(tài)分配性質(zhì)t分配性質(zhì)常態(tài)分配性質(zhì)常態(tài)分配性質(zhì)視母體分配而定抽樣分配的型態(tài)84統(tǒng)計(jì)估計(jì)利用樣本統(tǒng)計(jì)量去推估母體參數(shù)的方法。點(diǎn)估計(jì)(Point Estimation)根據(jù)樣本資料求得一估計(jì)值,以推估未知的母體參數(shù)。評(píng)估估計(jì)量的好壞:不偏性(unbiasde)、有效性(efficiency)區(qū)間估計(jì)(Interval Estimation)根據(jù)樣本資料求得之點(diǎn)估計(jì)值,藉由點(diǎn)估計(jì)值

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論