課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)

上傳人：g*** IP屬地：山西上傳時(shí)間：2022-10-10 格式：PPT 頁(yè)數(shù)：92 大小：765KB 積分：40 舉報(bào) 版權(quán)申訴

課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)_第2頁(yè)

課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)_第3頁(yè)

課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)_第4頁(yè)

課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)_第5頁(yè)

已閱讀5頁(yè)，還剩87頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、你應(yīng)該知道的統(tǒng)計(jì)知識(shí)中華資料採(cǎi)礦協(xié)會(huì)1何謂統(tǒng)計(jì)學(xué) 統(tǒng)計(jì)就是從數(shù)據(jù)中獲取資訊的科學(xué)收集資料整理資料分析資料導(dǎo)出結(jié)論敘述統(tǒng)計(jì)學(xué)、推論統(tǒng)計(jì)學(xué)2統(tǒng)計(jì)詞彙母體個(gè)體樣本抽樣底冊(cè)參數(shù)統(tǒng)計(jì)量變數(shù)眾數(shù)中位數(shù)平均數(shù)3母體與樣本間的關(guān)係母體樣本抽樣樣本統(tǒng)計(jì)量推論母體參數(shù)抽樣誤差非抽樣誤差4個(gè)體樣本觀察值變數(shù)5騙人的平均數(shù)老謝應(yīng)徵工作公司規(guī)模：老闆、經(jīng)理2位、組長(zhǎng)3位、職員5位。老闆：公司平均月薪6萬(wàn)元，受訓(xùn)期間1萬(wàn)五千元，很快會(huì)加薪。做不做？6平均數(shù)：6萬(wàn)中間數(shù)：4萬(wàn)眾數(shù)：2萬(wàn)7平均數(shù)：量測(cè)觀察值散佈情形的中間值。標(biāo)準(zhǔn)差：衡量觀察值的散佈情形偏離平均值有多遠(yuǎn)。偏度：描述一個(gè)分配偏離對(duì)稱性的情形峰度：衡量觀察值偏離

2、平均數(shù)有多快。變異係數(shù)：獲得相對(duì)的變異情形。變異係數(shù)標(biāo)準(zhǔn)差平均數(shù)8某次統(tǒng)計(jì)學(xué)考試，甲班平均分?jǐn)?shù)為80分，標(biāo)準(zhǔn)差為20，乙班平均分?jǐn)?shù)為75分，標(biāo)準(zhǔn)差為5，哪一班成績(jī)較優(yōu)？甲班乙班9資料衡量尺度量化的處理工具便稱為衡量的尺度，又稱量表（Scale）。問(wèn)卷衡量尺度的設(shè)計(jì)是評(píng)估報(bào)告是否深入的關(guān)鍵。不同的量表應(yīng)用不同的統(tǒng)計(jì)分析，準(zhǔn)確性才會(huì)提高。考量的依據(jù)：1.研究目的與問(wèn)題深入的程度2.事後資料整理時(shí)之便利性3.各種可能選項(xiàng)的周延性與互斥性需兼顧4.統(tǒng)計(jì)的方法10一、名目尺度(nominal scale)此種量表是根據(jù)被調(diào)查對(duì)象的性質(zhì)而分類，如根據(jù)消費(fèi)者答案可分為喜歡與不喜歡或是與否兩類。每類答案的數(shù)字

3、只作為分類之用，如果將這些答案數(shù)字(1,2,3)做運(yùn)算，根本沒有意義，因?yàn)檫@些數(shù)字在此僅屬名義而已，真正目的是在分類。二、順序尺度(ordinal scale)較類別量表多一特性，可以表示各類別之間的順序關(guān)係。如要求消費(fèi)者根據(jù)其心中偏好，將五種飲料品牌依最喜歡到最不喜歡的順序排列，最喜歡給5分、最不喜歡給1分，這就是一種順序量表。不過(guò)代表順序的數(shù)字還是不能用來(lái)做運(yùn)算，只能看出高低次序，卻無(wú)法確定順序之間的差異大小，例如若已知ABCDE，但並不知道A與B的差距，或C與D的差距，所以也無(wú)法得知兩種差距是否相等。11三、差距尺度(interval scale)較順序量表再推進(jìn)一步，不單能表示順序關(guān)

4、係，尚能測(cè)量各順序之間的距離，可確定地指出5分與4分之差距等於4分與3分的差距。差距量表的分?jǐn)?shù)可用來(lái)做加減乘除的運(yùn)算，此為其之一大優(yōu)點(diǎn)，但是不能說(shuō)明6分為3分的兩倍，因?yàn)椴罹嗔勘韥K沒有一個(gè)真正零點(diǎn)（真零）。四、比率尺度(ratio scale)比率量表除了具有差距量表的全部特色外，再加上真零這個(gè)特性。例如身高、年齡、體重等變數(shù)的測(cè)量都是用比率量表，故可說(shuō)體重180磅的人比90磅的人重兩倍。不過(guò)在態(tài)度測(cè)量方面，運(yùn)用比率量表顯然有困難，消費(fèi)者給一種飲料100分，另一種給50分，但卻不表示喜歡程度有兩倍的差距。因?yàn)閼B(tài)度測(cè)量本質(zhì)上為一順序概念，顯然不宜用比率或差距量表測(cè)量。12適用於各類量表的統(tǒng)計(jì)分析

5、方法列如下表：13資料處理與展示統(tǒng)計(jì)圖表定性資料次數(shù)分配表相對(duì)次數(shù)分配長(zhǎng)條圖圓餅圖14資料處理與展示統(tǒng)計(jì)圖表計(jì)量資料次數(shù)分配表相對(duì)次數(shù)分配表累加次數(shù)分配表累加相對(duì)次數(shù)分配表直方圖次數(shù)多邊圖枝葉圖散佈圖15次數(shù)分配表16交叉分析表17交叉分析表18圓餅圖19圓餅圖第一次購(gòu)屋貸款：3人勞工貸款：2人公教補(bǔ)助貸款：4人自有住屋貸款中優(yōu)惠利率20圓餅圖知道的民眾主要特徵(14.7%)支持國(guó)民黨5059歲職業(yè)為軍公教或自營(yíng)商男性不知道的民眾主要特徵(85.2%)年齡為2029歲職業(yè)為學(xué)生或家庭主婦女性21折線圖22直方圖23直方圖24直方圖25盒形圖26全班35位同學(xué)統(tǒng)計(jì)學(xué)考試分?jǐn)?shù)86,77,91,

6、60,35,76,92,47,88,67,23,59,72,75,83,77,68,8297,89,81,75,74,39,67,79,83,70,78,91,68,49,56,94,81 枝葉圖27根據(jù)統(tǒng)計(jì)顯示，多數(shù)車禍發(fā)生在車子行駛於一般車速的時(shí)候，只有少數(shù)車禍發(fā)生在車速超過(guò)時(shí)速150公里。開快車較安全。研究顯示，有個(gè)城市死於心臟病的人數(shù)與口香糖的消費(fèi)量同時(shí)遽增。嚼口香糖導(dǎo)致心臟病。多數(shù)人都以一般車速開車，自然多數(shù)車禍發(fā)生於一般車速。這兩類數(shù)字的增加是因?yàn)槿丝诳焖俪砷L(zhǎng)的結(jié)果。28現(xiàn)在我要寄一封文件給一位我不認(rèn)識(shí)的人，我先寄給最有可能認(rèn)識(shí)目標(biāo)者的人，再請(qǐng)他轉(zhuǎn)寄，如此轉(zhuǎn)寄到目標(biāo)者手中，請(qǐng)問(wèn)中間

7、經(jīng)過(guò)人數(shù)？現(xiàn)場(chǎng)有兩人是同月同日生的機(jī)率為？平均為5人23人機(jī)率略高於1/2，40人機(jī)率達(dá)到90以上。29解讀民意調(diào)查A候選人支持度31.2B候選人支持度28.5C候選人支持度24.9成功訪問(wèn)1,068位受訪者，在95的信心水準(zhǔn)下，抽樣誤差為正負(fù)3。30分配（Distribution）包括了對(duì)位置 (location)、散佈 (spread) 及形狀 (shape) 的描述。在描述 (呈現(xiàn)) 變數(shù)的分配形狀時(shí)，應(yīng)了解：(1) 分配的形狀和分配的位置、散佈一樣重要(2) 在了解分配的形狀時(shí)，以視覺化的方式來(lái)呈現(xiàn)比以數(shù)字來(lái) 呈現(xiàn)更令人一目了然(3) 變數(shù)的分配形式?jīng)Q定了用哪一種統(tǒng)計(jì)技術(shù)來(lái)描述比較適當(dāng)

8、。31位置的衡量(measures of location) 平均數(shù)(Mean)：平均數(shù)指的是算術(shù)平均數(shù)，也就是在分配中各觀察值的和除以觀察數(shù)。中位數(shù)(Median)：中位數(shù)是分配的中央點(diǎn)。在分配中有一半的觀察點(diǎn)低於，有一半的觀察點(diǎn)高於中位數(shù)。如果在分配中觀察點(diǎn)的數(shù)目是偶數(shù)，則中位數(shù)是兩個(gè)中間數(shù)的平均數(shù)。眾數(shù)(Mode)：眾數(shù)是出現(xiàn)次數(shù)最多的那個(gè)數(shù)字。32散佈的衡量(measures of spread) 變異數(shù)(Variance)：變異數(shù)是衡量以平均數(shù)為基準(zhǔn)的分配情況。如果所有的分?jǐn)?shù)都相等，則變異數(shù)為零。分?jǐn)?shù)分散的情形愈大，則變異數(shù)愈大。標(biāo)準(zhǔn)差(Standard deviation)：標(biāo)準(zhǔn)差

9、是變異數(shù)的平方根，它免除了變異數(shù)的平方，因而增加了解釋力。全距(Range)：全距是分配中最大與最小的分?jǐn)?shù)之差，全距只涉及到最大與最小的分?jǐn)?shù)，因此在衡量散佈方面是相當(dāng)粗糙的。33散佈的衡量(measures of spread)四分位距(interquartile range, IQR):是分配中第一、第三分位之差。它也稱為中點(diǎn)分配 (midspread)。第1分位Q1是第25% 的那個(gè)數(shù)字；中位數(shù)或Q2是第50% 的那個(gè)數(shù)字；第3分位Q3是第75% 的那個(gè)數(shù)字。 IQR=Q3-Q1四分位差(quartile deviation)：四分位差或稱半四分位距 (semi-interquartile

10、 range) 是Q3與Q1間距離的一半。34形狀的衡量(measures of shape) 偏度(skewness)：是描述一個(gè)分配偏離對(duì)稱性的情形，在對(duì)稱性的分配中，平均數(shù)、中位數(shù)、眾數(shù)都是在同樣的位置。偏態(tài)分為左偏態(tài) (或負(fù)偏態(tài)) 與右偏態(tài) (或正偏態(tài)) 二種。峰度(kurtosis)：是描述一個(gè)分配的平坦或陡直情況。峰度共有三種：常態(tài)峰 (mesokurtic)、高狹峰 (leptokurtic) 及低闊峰 (platykurtic)。 35機(jī)率論(Probability Theory)機(jī)率：衡量某一事件可能發(fā)生的程度（機(jī)會(huì)），並針對(duì)此一事件發(fā)生之可能性賦予一量化的數(shù)值。及用來(lái)衡量不

11、確定性大小的工具。機(jī)率論隨機(jī)實(shí)驗(yàn)機(jī)率理論事件機(jī)率性質(zhì)與運(yùn)算法則貝氏定理36隨機(jī)實(shí)驗(yàn)(Random Experiment)隨機(jī)實(shí)驗(yàn)(Random Experiment)：觀察一可產(chǎn)生各種可能結(jié)果(Outcome)的過(guò)程，稱為實(shí)驗(yàn)；而若各種可能結(jié)果的出現(xiàn)（或發(fā)生）具有不確定性，則此一過(guò)程便稱為隨機(jī)實(shí)驗(yàn)。必須滿足：1.實(shí)驗(yàn)可以在相同條件下重複進(jìn)行。2.所有結(jié)果是明確可知的，且不只一個(gè)。3.實(shí)驗(yàn)後的結(jié)果為所有可能結(jié)果之一，但實(shí)驗(yàn)前無(wú)法肯定會(huì)出現(xiàn)何種結(jié)果。37檢驗(yàn)三件產(chǎn)品之樣本空間樹狀圖樣本點(diǎn)(sample point)：每個(gè)可能的結(jié)果樣本空間(sample space)：各種可能結(jié)果的集合事件(eve

12、nt)：樣本空間的部分集合簡(jiǎn)單事件(simple event)：只包含一個(gè)樣本點(diǎn)複合事件(composite event)：包含二個(gè)或以上的樣本點(diǎn)38各式樣本空間39機(jī)率測(cè)度的方法古典方法：P(E)=n(E)/n(S)限制條件：樣本空間必須是有限的樣本空間。基本假設(shè)：樣本空間內(nèi)每一樣本點(diǎn)出現(xiàn)的機(jī)會(huì)皆相同。客觀方法（相對(duì)次數(shù)法）：P(E)=lim(n/N) , N 重複進(jìn)行此一實(shí)驗(yàn)許多次，並觀察該事件出現(xiàn)次數(shù)的比例。主觀方法：P(E)=（個(gè)人對(duì)事件E發(fā)生的信心）40機(jī)率的公理1.2. 為互斥3. P(S)=1；P()=041事件機(jī)率聯(lián)合機(jī)率(joint probability)兩個(gè)或兩個(gè)以上事件

13、同時(shí)發(fā)生的機(jī)率。邊際機(jī)率(marginal probability)在兩個(gè)或兩個(gè)以上類別的樣本空間中，若僅考慮一類別個(gè)別發(fā)生的機(jī)率稱之。條件機(jī)率(conditional probability)已知B事件發(fā)生下，另一事件A發(fā)生的機(jī)率，稱為在B發(fā)生條件下，A的條件機(jī)率。42應(yīng)徵者的資料43事件的性質(zhì)獨(dú)立事件(Independent Event)係指一事件的發(fā)生不影響其他事件的發(fā)生，若A、B兩事件互為獨(dú)立，則：相依事件(Dependent Event)係指一事件的發(fā)生影響其他事件發(fā)生的機(jī)率。44互斥事件(Mutually Exclusive Event)事件沒有共同的樣本點(diǎn)稱之，即當(dāng)兩事件之交集為

14、空集合時(shí)。sssAAABBB45事件的運(yùn)算法則餘集合的機(jī)率加法定理乘法定理分割定理ASB46貝氏定理(Bayes Theorem)事前機(jī)率取得新資訊事後機(jī)率（條件機(jī)率的形式）應(yīng)用貝氏定理事後機(jī)率事前機(jī)率條件機(jī)率47某公司計(jì)畫推出新產(chǎn)品，並認(rèn)為經(jīng)濟(jì)景氣好壞會(huì)影響新產(chǎn)品的銷售，公司行銷經(jīng)理主觀判斷景氣好、普通、不好的機(jī)率各為0.5、0.2、0.3。今公司委託專業(yè)市調(diào)公司進(jìn)行市場(chǎng)景氣調(diào)查，但該市調(diào)公司之調(diào)查並非百分之百正確，根據(jù)過(guò)去經(jīng)驗(yàn)，其正確率為0.9，不正確的誤認(rèn)為其他兩種是其他兩種狀況的機(jī)率各為0.05。若該市調(diào)公司調(diào)查結(jié)果為景氣好，而市場(chǎng)景氣真正為好的機(jī)率為多少？事前機(jī)率取得新資訊事後機(jī)率主

15、觀判斷景氣好、普通、不好的機(jī)率市調(diào)公司調(diào)查結(jié)果修正機(jī)率48機(jī)率分配49隨機(jī)變數(shù)(Random Variable)係以樣本空間為定義域的實(shí)數(shù)值函數(shù)，也就是隨機(jī)實(shí)驗(yàn)中對(duì)應(yīng)樣本點(diǎn)的實(shí)數(shù)值函數(shù)。X：擲一枚銅板二次，出現(xiàn)正面的次數(shù)正正正反反正反反2101/42/41/4樣本空間S隨機(jī)變數(shù)X機(jī)率f(x)50期望值(Expected Value)與變異數(shù)間斷機(jī)率分配：期望值：變異數(shù)：連續(xù)機(jī)率分配：期望值：變異數(shù)：51離散型機(jī)率分配二項(xiàng)分配(Binomial Distribution)幾何分配(Geometric Distribution)超幾何分配(Hypergeometric Distribution)波

16、瓦松分配 ( Possion Distribution)52二項(xiàng)分配(Binomial Distribution)伯努利試驗(yàn)(Bernoulli Trial)每一次試驗(yàn)皆僅有兩種可能結(jié)果，不是成功(S)，就是失敗(F)。成功機(jī)率固定為為P(S)=p，失敗機(jī)率固定為為P(F)=1-p。每一次試驗(yàn)之間互為獨(dú)立。進(jìn)行n次的伯努利試驗(yàn)，稱為二項(xiàng)實(shí)驗(yàn)，若隨機(jī)變數(shù)X為n次試行實(shí)驗(yàn)成功的次數(shù)，X的機(jī)率分配稱為二項(xiàng)機(jī)率分配。53二項(xiàng)機(jī)率分配函數(shù)：00.050.10.150.20.250.30.35123456n=5, p=0.5P(X=x)00.10.20.30.40.50.60.7123456n=5, p=

17、0.3P(X=x)00.10.20.30.40.50.60.7123456n=5, p=0.9P(X=x)54超幾何分配(Hypergeometric Distribution)超幾何實(shí)驗(yàn)：從一含有N物的有限母體中，採(cǎi)不放回抽樣，抽取n個(gè)隨機(jī)樣本。N物中有S個(gè)屬成功類，另N-S個(gè)屬失敗類。隨機(jī)變數(shù)X為n個(gè)中，成功的次數(shù)， X的機(jī)率分配稱為超幾何機(jī)率分配。S成功類S個(gè)失敗類N-S個(gè)x n-x55超幾何機(jī)率分配函數(shù)：56幾何分配(Geometric Distribution)二項(xiàng)分配為進(jìn)行n次的伯努利試驗(yàn)的成功次數(shù)分配，如果未預(yù)先固定試驗(yàn)的次數(shù)，而在第一次成功發(fā)生之後才停止整個(gè)伯努利試驗(yàn)，成功的次

18、數(shù)固定為1，所需試驗(yàn)的次數(shù)則為一隨機(jī)變數(shù)，此隨機(jī)變數(shù)的機(jī)率分配即稱為幾何分配。幾何機(jī)率分配函數(shù)：57波瓦松分配 ( Possion Distribution)在一特定區(qū)間（或區(qū)域）內(nèi)，觀察某特定事件發(fā)生的次數(shù)。上午10點(diǎn)至11點(diǎn)中，每10分鐘打進(jìn)公司的電話通數(shù)。1天內(nèi)停車場(chǎng)停車數(shù)。高速公路每10公里路面有窪動(dòng)的數(shù)目。秘書小姐每打一頁(yè)報(bào)告出現(xiàn)錯(cuò)誤的字?jǐn)?shù)。波瓦松實(shí)驗(yàn)：在一連續(xù)區(qū)間發(fā)生事件的次數(shù)，與另一區(qū)間發(fā)生的次數(shù)是獨(dú)立的。在一連續(xù)區(qū)間內(nèi)發(fā)生事件的的期望值（平均數(shù)）與區(qū)間大小成比例。在一極短的區(qū)間內(nèi)，僅有兩種狀況，即發(fā)生一次或不發(fā)生，而發(fā)生兩次或以上的情形不予考慮。若一事件滿足上述三個(gè)特質(zhì)，隨機(jī)變

19、數(shù)X定義為連續(xù)區(qū)間內(nèi)發(fā)生事件的次數(shù)，則X為一波瓦松隨機(jī)變數(shù)，其機(jī)率分配為波瓦松分配。58波瓦松分配函數(shù)：式中表示在某特定區(qū)間內(nèi)某事件所發(fā)生平均次數(shù)，而e=2.71828。某公司訂有消費(fèi)者7天內(nèi)不滿意免費(fèi)退貨服務(wù)，根據(jù)過(guò)去記錄，每7天平均2件被要求退貨，問(wèn)在14天內(nèi)會(huì)被退5件的機(jī)率？59二項(xiàng)、超幾何與波瓦松分配之間關(guān)係超幾何分配二項(xiàng)分配波瓦松分配當(dāng)n/N20且np=7時(shí)，可用波瓦松分配取代二項(xiàng)分配60連續(xù)型機(jī)率分配均等分配(Uniform Distribution)常態(tài)分配(Normal Distribution)指數(shù)分配(Exponential Distribution)61均等分配(Uni

20、form Distribution)隨機(jī)變數(shù)在某區(qū)間（a,b）內(nèi)發(fā)生機(jī)率皆相同時(shí)，其機(jī)率分配稱之。機(jī)率密度函數(shù)： abf(x)62某班火車抵達(dá)車站的時(shí)間在8點(diǎn)至8點(diǎn)10分之間，且在此時(shí)段中任何時(shí)點(diǎn)到站的可能性均相同。1.某乘客在8點(diǎn)3分抵達(dá)車站，可搭上火車的機(jī)率？2.某乘客在8點(diǎn)8分抵達(dá)車站，火車已開走的機(jī)率？3.計(jì)算期望值與變異數(shù)，並解釋期望值的意義。X表示火車在8點(diǎn)以後到站的時(shí)間，63常態(tài)分配(Normal Distribution)又稱高斯分配（Gauss Distribution）。重要性：1.許多自然現(xiàn)象，工業(yè)生產(chǎn)、商業(yè)問(wèn)題及社會(huì)現(xiàn)象均可用常態(tài)分配加以描述。2.許多統(tǒng)計(jì)量的的抽樣分配

21、在大樣本下呈常態(tài)分配。3.常態(tài)分配可進(jìn)行許多統(tǒng)計(jì)推論，許多統(tǒng)計(jì)量的的抽樣分配如t分配、卡方分配、F分配都必須假設(shè)母體為常態(tài)分配才可獲得。4.間斷機(jī)率分配在某些條件下可利用常態(tài)分配求其近似值。64機(jī)率密度函數(shù)：65常態(tài)分配特性：1.以平均數(shù) 為中心的對(duì)稱曲線。2.平均樹、眾數(shù)、中位數(shù)均相等（）。3.以為中心，兩邊加減一個(gè)標(biāo)準(zhǔn)差之處，為常態(tài)曲線的反曲點(diǎn)（Inflection Point）。4.常態(tài)曲線左右兩尾與橫軸逐漸接近，但絕不會(huì)相交。5.以為中心，兩邊加減一個(gè)標(biāo)準(zhǔn)差的區(qū)間，其機(jī)率（面積）為0.683，加減二個(gè)標(biāo)準(zhǔn)差的區(qū)間，其機(jī)率（面積）為0.954，加減三個(gè)標(biāo)準(zhǔn)差，其機(jī)率（面積）為0.9

22、97。66標(biāo)準(zhǔn)常態(tài)分配（Standard Normal Distribution）：即平均數(shù)為0，標(biāo)準(zhǔn)差為1的常態(tài)分配。機(jī)率密度函數(shù)：標(biāo)準(zhǔn)化（Normalized）：67某品牌家電用品的使用壽命為平均數(shù)4.5年，標(biāo)準(zhǔn)差為1年的常態(tài)分配。若其保證期間為二年，推算其退貨的比例。X表示該品牌家電用品使用壽命，某公司生產(chǎn)高級(jí)辦公桌，其裝配時(shí)間為常態(tài)分配，平均數(shù)56分鐘，標(biāo)準(zhǔn)差4分鐘。現(xiàn)有一客戶要求於1個(gè)鐘頭後準(zhǔn)時(shí)到達(dá)公司提貨，如從現(xiàn)在開始裝配準(zhǔn)時(shí)完成交貨的機(jī)率為？X表示裝配一張桌子所需時(shí)間，68指數(shù)分配(Exponential Distribution)與波瓦松分配相反，指數(shù)隨機(jī)變數(shù)在說(shuō)明接連兩件事

23、發(fā)生的間隔期間。69機(jī)率密度函數(shù)：1.指數(shù)分配曲線為非對(duì)稱性，範(fàn)圍為（0，）。2.平均數(shù) 必大於0。x70某一型彩色電視機(jī)其壽命時(shí)間成指數(shù)分配，且平均壽命為10年。求該電視機(jī)的壽命時(shí)間之下列機(jī)率：1.壽命長(zhǎng)達(dá)15年以上。2.兩年內(nèi)即發(fā)生故障而報(bào)廢。3.壽命時(shí)間介於2年至15年。X表示該電視機(jī)之壽命時(shí)間，71標(biāo)準(zhǔn)常態(tài)分配值z(mì)P(Zz)72指數(shù)分配值x73抽樣(Sampling) 估計(jì)誤差(Error of Estimation)抽樣誤差(Sampling Error)非抽樣誤差(Nonsampling Error)樣本統(tǒng)計(jì)量母體參數(shù)估計(jì)誤差抽樣誤差非抽樣誤差1.樣本數(shù)2.推論方法3.抽樣方法資

24、料整理時(shí)的疏失74抽樣方法非機(jī)率抽樣立意抽樣法便利抽樣法滾雪球抽樣法配額抽樣機(jī)率抽樣簡(jiǎn)單隨機(jī)抽樣分層抽樣集群抽樣系統(tǒng)抽樣抽樣方法非機(jī)率抽樣法機(jī)率抽樣法75非機(jī)率抽樣法非機(jī)率抽樣：亦即樣本不按照其機(jī)率予以抽出，而是由抽樣者之主觀抽出或自願(yuàn)樣本。優(yōu)點(diǎn)：在某些調(diào)查時(shí)，有其必要性。缺點(diǎn)：(1)難以評(píng)斷樣本之代表性。 (2)無(wú)法估計(jì)精確度。 (3)樣本偏差往往較大。非機(jī)率抽樣之種類：1.立意樣本(Judged Sampling)：調(diào)查研究人員根據(jù)自己的專長(zhǎng)、知識(shí)、研究目的來(lái)選取代表性的樣本。如學(xué)者、專家或代表性之樣本。2.便利樣本(Convenient Sampling)：事先不預(yù)定樣本，碰到即問(wèn)或

25、自動(dòng)回答者。如街頭訪問(wèn)或主動(dòng)打電話回答問(wèn)題者。缺點(diǎn)：注意樣本之偏激性及兩極化。3.滾式樣本(輻射樣本)：利用樣本尋找樣本，亦即利用樣本之滾雪球方式或輻射力抽取樣本。如都市中之原住民抽樣。使用時(shí)機(jī)：可用於當(dāng)樣本不易取得時(shí)，或針對(duì)特殊族群之調(diào)查。4.配額樣本：按母體某些特性予以配置樣本，但取樣時(shí)卻由調(diào)查員任意抽取。76機(jī)率抽樣機(jī)率抽樣：抽取之樣本是按照樣本之機(jī)率隨機(jī)抽出。優(yōu)點(diǎn)：1.樣本較具代表性。2.可計(jì)算估計(jì)之精確度。3.可隨不同之抽樣設(shè)計(jì)採(cǎi)取不同之抽樣方法。4.隨之不同之抽樣方法，採(cǎi)取相互配合之估計(jì)方法。機(jī)率抽樣之種類：1.簡(jiǎn)單隨機(jī)抽樣：不對(duì)母體加以任何修飾或分割，而使每一樣本均有相同之被抽中

26、機(jī)率。2.分層隨機(jī)抽樣：將母體按照某些特性，分成數(shù)個(gè)不重疊的組群，這些組群即稱為層，而再由各層分別抽取樣本。3.系統(tǒng)抽樣：將母體之元素按順序編號(hào)後，有系統(tǒng)的每隔一定間隔抽取一個(gè)樣本之方法。4.集群抽樣：將母體中相鄰近之個(gè)體排成為一集體，而以集體為抽樣單位，即每一抽樣單位為一集體之抽樣單位。5.兩段集群抽樣：首先抽出一些樣本集體，再由樣本集體內(nèi)抽出部分基本個(gè)體。6.分層集群抽樣：將母體內(nèi)之集體予以分層後，再由各層抽取樣本。77簡(jiǎn)單隨機(jī)抽樣法(simple random sampling)簡(jiǎn)單隨機(jī)抽樣是一種最基礎(chǔ)且最簡(jiǎn)便的抽樣方法。優(yōu)點(diǎn)是(i)當(dāng)母體底冊(cè)完整時(shí)，直接由母體中抽出樣本，方法簡(jiǎn)單；和(

27、ii)每一單位被抽中的機(jī)率均相等，參數(shù)的估計(jì)較簡(jiǎn)單。限制是(i)母體底冊(cè)不易取得，或取得很費(fèi)時(shí)，費(fèi)力且費(fèi)錢；(ii)母體內(nèi)樣本單位太多時(shí)，作業(yè)不方便；(iii)樣本分配較分散，行政作業(yè)較不易；和(iv)樣本代表性恐有不足(尤其當(dāng)樣本點(diǎn)差異大時(shí)或重要性不同時(shí))。使用最佳時(shí)機(jī)，便是當(dāng)(i)母體內(nèi)樣本單位不多，且有完備名冊(cè)，可茲編號(hào)時(shí)；(ii)母體內(nèi)樣本單位間的差異不大時(shí)(對(duì)研究的目的而言)；和(iii)對(duì)母體資訊無(wú)法充份獲得時(shí)。簡(jiǎn)單隨機(jī)抽樣法的準(zhǔn)確度會(huì)受下列二因素的影響，即(i)母體本身的變異，和(ii)樣本的大小。78分層抽樣法(stratified sampling)優(yōu)點(diǎn)是(i)可增加樣本代表

28、性；(ii)可提高估計(jì)的確度；(iii)可分別獲得各層的訊息，並做各層間的比較分析；(iv)可在各層設(shè)立行政單位，以便於執(zhí)行；和(v)可視各層情形，採(cǎi)取不同的抽樣方法。限制是(i)分層變數(shù)的選取(要與所欲估計(jì)的特徵值具有高度相關(guān))；(ii)層數(shù)的釐定(要適當(dāng)並配合母體的分配狀況)；(iii)分層標(biāo)準(zhǔn)的決定(各層不能有重疊現(xiàn)象)；(iv)各層樣本的配置方法；和(v)分層後，樣本資料的整理及估計(jì)較複雜。使用最佳時(shí)機(jī)，便是當(dāng)(i)母體內(nèi)樣本單位的差異較大時(shí)；和(ii)分層後能達(dá)到層間差異大，層內(nèi)差異小的原則。原則上要使層內(nèi)變異小，而層間變異大；各層不能有重疊現(xiàn)象。第一層第二層第K層:樣本79系統(tǒng)抽

29、樣法(systematic sampling) 優(yōu)點(diǎn)是(i)在抽取樣本的過(guò)程中，很容易完成抽樣工作；(ii)通常可使樣本普遍的散佈於母體內(nèi)，使樣本更具代表性；和(iii)在某些條件下，系統(tǒng)抽樣可取代簡(jiǎn)單隨機(jī)抽樣。限制是(i)對(duì)母體狀況宜略有所瞭解；(ii)避免系統(tǒng)樣本內(nèi)的樣本單位趨於一致；(iii)不易計(jì)算估計(jì)量的變異數(shù)，和(iv)避免母體內(nèi)樣本單位特徵值的週期性變動(dòng)。使用最好是當(dāng)(i)母體內(nèi)的樣本單位，按有興趣的特徵值而言是隨機(jī)的或按大小排列的；(ii)母體內(nèi)單位數(shù)過(guò)多，而抽取的樣本又較多時(shí)；和(iii)母體內(nèi)的單位數(shù)不能確定時(shí)。1 2 3 4 5 6 7 8 9 10 11 12 13 1

30、4 15 16 17 18 s (s+1) (s+2) N61218樣本母體K=N/n80群集抽樣法(cluster sampling)有時(shí)母體底冊(cè)的蒐集及編造極為困難或龐大，而在調(diào)查時(shí)又希望節(jié)省成本時(shí)，則可採(cǎi)用群集抽樣法。舉例來(lái)說(shuō)，在森林區(qū)的材積調(diào)查中，將調(diào)查區(qū)劃分多個(gè)小塊以為群集。又如在住戶調(diào)查中，以鄰或區(qū)段作為群集以進(jìn)行訪查。優(yōu)點(diǎn)是(i)母體底冊(cè)的編造較為簡(jiǎn)單；(ii)調(diào)查行動(dòng)半徑較小，調(diào)查成本較低；(iii)行政管理較為容易；和(iv)通信調(diào)查時(shí)較易宣傳及進(jìn)行。限制是(i)群集內(nèi)樣本單位的一致性太強(qiáng)，則易浪費(fèi)樣本；和(ii)群集大小的決定。使用最好時(shí)機(jī)是當(dāng)(i)母體底冊(cè)不易獲得時(shí)；(i

31、i)為簡(jiǎn)省調(diào)查成本時(shí)；及(iii)群集內(nèi)差異大，而群集間的變異小。採(cǎi)用群集抽樣法進(jìn)行樣本調(diào)查時(shí)，要注意到以下兩個(gè)原則。亦即，(i)根據(jù)經(jīng)驗(yàn)、試查及實(shí)際狀況以決定適當(dāng)?shù)娜杭缓?ii)確定群集間變異小，而群集內(nèi)變異大。81抽樣分配母體參數(shù)(Parameter)描述母體資料特性的統(tǒng)計(jì)測(cè)量數(shù)，為未知但固定的數(shù)。樣本統(tǒng)計(jì)量(Statistics)為一組隨機(jī)樣本的實(shí)數(shù)值函數(shù)。抽樣分配(Sampling Distribution)樣本統(tǒng)計(jì)量為一隨機(jī)變數(shù)，其機(jī)率分配稱為抽樣分配。82樣本平均數(shù)的抽樣分配自一大小為N的母體抽出一組隨機(jī)樣本，則樣本平均數(shù) 本身亦為隨機(jī)變數(shù)，有其機(jī)率分配。抽自無(wú)限母體：抽自有限母體：83母體常態(tài)分配非常態(tài)分配大樣本(n 30)小樣本(n 30)大樣本(n 30)小樣本(n中央極限定理=母體已知=母體未知=常態(tài)分配性質(zhì)t分配性質(zhì)常態(tài)分配性質(zhì)常態(tài)分配性質(zhì)視母體分配而定抽樣分配的型態(tài)84統(tǒng)計(jì)估計(jì)利用樣本統(tǒng)計(jì)量去推估母體參數(shù)的方法。點(diǎn)估計(jì)(Point Estimation)根據(jù)樣本資料求得一估計(jì)值，以推估未知的母體參數(shù)。評(píng)估估計(jì)量的好壞：不偏性(unbiasde)、有效性(efficiency)區(qū)間估計(jì)(Interval Estimation)根據(jù)樣本資料求得之點(diǎn)估計(jì)值，藉由點(diǎn)估計(jì)值

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

課件你應(yīng)該知道的統(tǒng)計(jì)知識(shí)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔