




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
預備知識1統計學知識
如隨機變量、概率分布、數學期望、方差、協方差、點估計、區間估計、假設檢驗、方差分析、正態分布、t分布、F分布等概念和性質2一、隨機變量和概率分布隨機變量就是在隨機試驗中能取得不同數值的量,它的數值是由隨機試驗的結果而定的。隨機變量可以分為離散隨機變量和連續隨機變量。隨機變量的頻率分布或概率分布稱為該隨機變量的概率分布。3二、隨機變量的數字特征數學期望----描述隨機變量的取值中心,也稱為均值。方差----描述隨機變量可能取值與均值的偏差的疏密程度。協方差----描述兩個隨機變量的線性相關程度的度量。4常用的概率分布正態分布t分布分布F分布5正態分布6標準正態分布7標準正態分布t分布8分布9F分布10三、點估計和區間估計用估計量的值作為參數的估計值,稱為參數的點估計。在點估計的基礎上,給出參數估計的一個范圍,稱為區間估計。
11在進行區間估計時必須知道統計量的抽樣分布,所依據的理論是大數定律和中心極限定理。常用的統計量的抽樣分布有:樣本平均數的抽樣分布是正態分布(大樣本、總體方差已知)或t分布(其他情況);樣本比率的抽樣分布是正態分布;樣本方差的分布是卡方分布。12總體均值的區間估計
設風險水平為,則置信水平為1-1、如果是大樣本,總體方差已知,則總體均值的區間估計方法是:2、如果是大樣本,總體方差未知,則總體均值的區間估計方法是:
13
如果是小樣本,則要求總體服從正態分布。這時同樣可以討論總體方差已知和總體方差未知時的情況。如果總體方差已知,總體均值的區間估計方法是:
如果總體方差未知,總體均值的區間估計方法是:14【例1】為了研究居民用于報刊的消費支出,某城市的統計部門抽取了64戶居民進行調查,得到平均用于報刊的消費支出為290元/年,假設總體的標準差是100元/年,置信水平為95%。(1)計算抽樣極限誤差;(2)對該城市居民用于報刊的消費支出做區間估計。15解:已知=64,=290,=100,
=95%,
查表得(1)
16該城市居民用于報刊的消費支出的95%的置信區間為(265.5,314.5)#
(2)17【例2】有一批供出口用的燈泡,從中隨機抽取49只進行檢驗,測得平均壽命為2400小時,標準差為210小時。假設置信水平為95%,求這批燈泡的平均壽命的置信區間。18解:已知n=49,=2400,
s=210,=95%,查表得這批燈泡的平均壽命的置信區間為(2339.7,2460.3)#
19【例3】某銀行為了估計一臺自動取款機(ATM機)的日取款額,連續抽取了25天該自動取款機的取款額,計算得平均取款額為7.2萬元。假設總體服從正態分布,標準差為1萬元,求該自動取款機置信水平為95%的日取款額置信區間。20解:已知=25,=7.2,=1,=95%,查表得該自動取款機置信水平為95%的取款額置信區間為(6.808,7.592)#
21【例4】美國人的每晚睡眠的小時數變化相當大,總人口中的12%的人睡眠少于6小時,有3%的人睡眠超過8小時(TheMacmillanVisualAlmanac1996)。下面是由25個人組成的樣本報告的每晚睡眠的小時數。
6.9
7.6
6.5
6.2
5.3
7.8
7.0
5.5
7.6
6.7
7.3
6.6
7.1
6.9
6.0
6.8
6.5
7.2
5.8
8.6
7.6
7.1
6.0
7.2
7.7(1)每晚睡眠的小時數的總體的點估計為多少?(2)假設總體服從正態分布,構造每晚睡眠的小時數的總體均值的95%的置信區間。22解:由樣本數據計算得:=6.86,s=0.78,n=25,=95%(1)每晚睡眠的小時數的總體的點估計為6.86小時。
(2)每晚睡眠的小時數的總體均值的95%的置信區間為(6.538,7.182)#
23
正態分布再生定理:如果都是服從的獨立隨機變量,那么其線性組合也服從均值為、方差為的正態分布,即:24四、假設檢驗假設檢驗的理論依據是小概率原理、反證法、中心極限定理。過程:1、提出假設;
2、構造檢驗統計量(確定其分布);
3、確定一個合適的顯著性水平,并確定拒絕域(臨界值);
4、用檢驗統計量與臨界值進行比較,做出決策。25檢驗統計量的構造方法
1、根據樣本觀測結果計算得到的,并據以對原假設和備擇假設作出決策的某個樣本統計量2、對樣本估計量的標準化結果原假設H0為真點估計量的抽樣分布3、標準化的檢驗統計值26顯著性水平和拒絕域(雙側檢驗)0臨界值臨界值a/2a/2
樣本統計量拒絕H0拒絕H01-置信水平27決策規則
1、給定顯著性水平,查表得出相應的臨界值;
2、將檢驗統計量的值與
水平的臨界值進行比較;
3、作出決策雙側檢驗:I統計量I>臨界值,拒絕H0左側檢驗:統計量<-臨界值,拒絕H0右側檢驗:統計量>臨界值,拒絕H028
【例5】一種罐裝飲料采用自動生產線生產,每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質檢人員在某天生產的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平=0.05,檢驗該天生產的飲料容量是否符合標準要求?29解:H0
:
=255H1
:
255=0.05n
=40=255.8檢驗統計量:30z01.96-1.960.025拒絕H0拒絕H00.025臨界值:決策:不拒絕H0。樣本提供的證據表明該天生產的飲料符合標準要求#31
【例6】一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產企業在購進配件時,通常是經過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進。現對一個配件提供商提供的16個樣本進行了檢驗,檢測得平均長度為11.90cm,標準差為0.50cm。假定該供貨商生產的配件長度服從正態分布,在0.05的顯著性水平下,檢驗該供貨商提供的配件是否符合要求?32解:H0:H1:拒絕域(-∞,-2.131),(2.131,+∞)檢驗統計量沒有落入拒絕域,故不拒絕原假設#33五、方差分析方差分析的作用是檢驗多個總體均值是否相等。通過分析數據的誤差判斷各總體均值是否相等。34方差分析的基本思想和原理1、比較兩類誤差,以檢驗均值是否相等2、比較的基礎是方差比3、如果系統(處理)誤差明顯地不同于隨機誤差,則均值就是不相等的;反之,均值就是相等的4、誤差是由各部分的誤差占總誤差的比例來測度的351、隨機誤差因素的同一水平(總體)下,樣本各觀察值之間的差異這種差異可以看成是隨機因素的影響,稱為隨機誤差
2、系統誤差因素的不同水平(不同總體)下,各觀察值之間的差異這種差異可能是由于抽樣的隨機性所造成的,也可能是由于行業本身所造成的,后者所形成的誤差是由系統性因素造成的,稱為系統誤差36提出假設
H0
:m1=m2=…=
mk
(自變量對因變量沒有顯著影響)
H1:m1
,m2
,…
,mk不全相等(自變量對因變量有顯著影響)注意:拒絕原假設,只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等37構造檢驗統計量總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之間的關系SST=SSA+SSE381、各誤差平方和的大小與觀察值的多少有關,為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差2、計算方法是用誤差平方和除以相應的自由度3、三個平方和對應的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個數SSA的自由度為k-1,其中k為因素水平(總體)的個數SSE的自由度為n-k39
組間方差:SSA的均方,記為MSA
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年牙偏魚段行業深度研究分析報告
- 食品行業產品召回流程指南
- 幼兒園小朋友入隊儀式安排
- 人教版九年級數學下冊28.2.2 應用舉例課件
- 教育課程設計變更控制措施實施方案
- 機場周邊環境綠化施工部署措施
- 2025年貴州旅游行業洞察報告及未來五至十年預測分析報告
- 施工現場環境安全管理措施
- 一年級道德與法制課外活動計劃
- 公共設施噪音防治與加固措施
- 電氣試驗報告模板
- 生命周期環境因素(ISO14001)
- 國家中小學智慧教育平臺培訓專題講座
- 文藝晚會人員分工完整
- 安全生產知識與管理能力考核合格證申請表(安全生產管理人員)
- 裝修常用數據手冊(空間布局和尺寸)
- 腮腺癌精準放療靶區勾畫課件
- 板式換熱器、半容積式換熱器換熱器面積計算表(自動計算)
- 專題04命題定理定義(四大題型)
- 園林工程施工現場危險源一覽表
- 部編版二年級道德與法治下冊《試種一粒籽》教案及教學反思
評論
0/150
提交評論