




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數學建模與數學實驗數學建模與數學實驗數據的統計描述和分析數據的統計描述和分析實驗目的實驗目的實驗內容實驗內容2掌握用數學軟件包求解統計問題掌握用數學軟件包求解統計問題.1直觀了解統計基本內容直觀了解統計基本內容.1 1統計的基本理論統計的基本理論. .3 3實驗作業實驗作業. .2用數學軟件包求解統計問題用數學軟件包求解統計問題.統計的基本概念統計的基本概念參數估計參數估計假設檢驗假設檢驗數據的統計描述和分數據的統計描述和分析析一、統計量一、統計量二、分布函數的近似求法二、分布函數的近似求法三、幾個在統計中常用的概率分布三、幾個在統計中常用的概率分布-4-2024600.050.10.150.
2、20.250.30.350.41正態分布正態分布),(2smn密度函數:222)(21)(smsp-=xexp分布函數:dyexfyx222)(21)(smsp-=其中m為均值,2s為方差,+-x.標準正態分布:n(0,1)密度函數2221)(xex-=pjdyexyx2221)(-=fp 分布函數0510152000.020.040.060.080.10.120.140.16-6-4-2024600.050.10.150.20.250.30.350.400.511.522.5300.10.20.30.40.50.60.70.80.91返回返回f(10,50)分布的密度函數曲線一、點估計的求法
3、一、點估計的求法(一)矩估計法(二)極大似然估計法二、區間估計的求法二、區間估計的求法1已知已知dx,求,求ex的置信區間的置信區間2 未知方差未知方差dx,求,求ex的置信區間的置信區間(一一)數學期望的置信區間數學期望的置信區間(二)方差的區間估計(二)方差的區間估計返回返回1.參數檢驗參數檢驗:如果觀測的分布函數類型已知,這時構造出的 統計量依賴于總體的分布函數,這種檢驗稱為參數檢驗. 參數檢驗的目的往往是對總體的參數及其有關性質作出明 確的判斷. 對總體x的分布律或分布參數作某種假設,根據抽取的樣本觀察值,運用數理統計的分析方法,檢驗這種假設是否正確,從而決定接受假設或拒絕假設.2.非
4、參數檢驗非參數檢驗:如果所檢驗的假設并非是對某個參數作出明 確的判斷,因而必須要求構造出的檢驗統計量的分布函數 不依賴于觀測值的分布函數類型,這種檢驗叫非參數檢驗. 如:要求判斷總體分布類型的檢驗就是非參數檢驗.假設檢驗的一般步驟假設檢驗的一般步驟(一)單個正態總體均值的檢驗(一)單個正態總體均值的檢驗一、參數檢驗一、參數檢驗2總總體體方方差差2s未未知知(二)單個正態總體方差的檢驗(二)單個正態總體方差的檢驗(三)兩個正態總體均值的檢驗(三)兩個正態總體均值的檢驗構造統計量212121222211)2() 1() 1(nnnnnnsnsnyxt+-+-+-=,(四)兩個正態總體方差的檢驗(四
5、)兩個正態總體方差的檢驗(一)(一) 皮爾遜皮爾遜2擬合檢驗法擬合檢驗法二、非參數檢驗二、非參數檢驗(二)概率紙檢驗法(二)概率紙檢驗法 概率紙是一種判斷總體分布的簡便工具.使用他們,可以很快地判斷總體分布的類型.概率紙的種類很多.返回返回統計工具箱中的基本統計命令統計工具箱中的基本統計命令1. 數據的錄入、保存和調用數據的錄入、保存和調用2. 基本統計量基本統計量3. 常見的概率分布函數常見的概率分布函數4. 頻頻 數數 直直 方方 圖圖 的的 描描 繪繪5. 參數估計參數估計6. 假設檢驗假設檢驗7. 綜合實例綜合實例返回返回一、數據的錄入、保存和調用一、數據的錄入、保存和調用 例例1 上
6、海市區社會商品零售總額和全民所有制職工工資總額的數據如下:統計工具箱中的基本統計命令統計工具箱中的基本統計命令年份1978197919801981198219831984198519861987職工工資總額(億元)23.827.631.632.433.734.943.252.863.873.4商品零售總額(億元)41.451.861.767.968.777.595.9137.4155.0175.01年份數據以1為增量,用產生向量的方法輸入. 命令格式: x=a:h:b t=78:872分別以x和y代表變量職工工資總額和商品零售總額.x=23.8,27.6,31.6,32.4,33.7,34.9
7、,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.03將變量t、x、y的數據保存在文件data中. save data t x y 4進行統計分析時,調用數據文件data中的數據. load datato matlab(txy)1輸入矩陣:data=78,79,80,81,82,83,84,85,86,87; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155
8、.0,175.02將矩陣data的數據保存在文件data1中:save data1 data3 3進行統計分析時,先用命令:load data1 調用數據文件data1中的數據,再用以下命令分別將矩陣data的第一、二、三行的數據賦給變量t、x、y: t=data(1,:) x=data(2,:) y=data(3,:)若要調用矩陣data的第j列的數據,可用命令: data(:,j)to matlab(data)返回返回二、基本統計量二、基本統計量對隨機變量x,計算其基本統計量的命令如下:均值:mean(x)中位數:median(x)標準差:std(x) 方差:var(x)偏度:skewne
9、ss(x) 峰度:kurtosis(x)例例 對例1中的職工工資總額x,可計算上述基本統計量.to matlab(tjl)返回返回三三、常見概率分布的函數常見概率分布的函數matlab工具箱對每一種分布都提供5類函數,其命令字符為:概率密度:pdf 概率分布:cdf逆概率分布:inv 均值與方差:stat隨機數生成:rnd (當需要一種分布的某一類函數時,將以上所列的分布命令字符與函數命令字符接起來,并輸入自變量(可以是標量、數組或矩陣)和參數即可.)2021-11-11307.2 隨機變量的概率密度計算name的取值函數說明beta或betabeta分布bino或binomial二項分布ch
10、i2或chisquare卡方分布exp或exponential指數分布f或ff分布gam或gammagamma分布geo或geometric幾何分布hyge或hypergeometric超幾何分布logn或lognormal對數正態分布nbin或 n e g a t i v e binomial負二項式分布ncf或noncentral f非中心f分布7.2.2常見分布的概率密度函數表2021-11-11317.2 隨機變量的概率密度計算7.2.2常見分布的概率密度函數表nctncx2normpoissrayltunifunidweib或或或或或或或或或noncentral tnoncentra
11、l chi-squarenormalpoissonrayleightuniform d i s c r e t e uniformweibull非中心t分布非中心卡方分布正態分布泊松分布瑞利分布t分布均勻分布離散均勻分布weibull分布2021-11-11321.31.3隨機變量(離散均勻分布)隨機變量(離散均勻分布)4.離散均勻分布l定義1.3.6 設x是一個隨機變量,離散均勻分布是由如下概率函數所確定的概率分布.l f(x)=1/n, x=1,2,n 若x服從離散均勻分布,則x 等概率取1至n中第個整數值.它的圖象用柱形圖表示如下(n=10時)2021-11-11331.31.3隨機變量
12、隨機變量( (二項分布)二項分布)5.二項分布l定義1.3.5 設x是一個隨機變量,二項分布是由如下概率函數所確定的概率分布 ( )(),0,1,2,xn xnf xp xxp qxnx- = ;, 1 , 0;)1 (),|(nxppcpnxfyxnxxn=-=- 其中n是正整數,0p1,q=1-p. 有時二項分布也可表示為用于強調參數對(n,p),以便作圖,二項分布的柱狀圖象如下頁所示2021-11-11340246810121416182000.020.040.060.080.10.120.140.160.18二 項 分 布 函 數 的 概 率 密 度 圖n=20,p=0.5,arph=
13、0.05 二項分布的概率函數圖形二項分布的概率函數圖形 二項分布的概率函數的圖形因受參數p的影響而呈偏對稱階梯形,若不斷增大p的值,則最高點就會不斷向右移動,圖象整體就偏向右側。2021-11-1135-50510152000.10.20.30.40.50.60.70.80.91二 項 分 布 的 分 布 函 數 條 形 圖n=20,p=0.31.2 1.2 二項分布的累積分布函數及圖象二項分布的累積分布函數及圖象二項分布的累積分布函數定義為:二項分布的累積分布函數的圖形為階梯形(如下):;)1 ()()(0knkxkknppcxkpxf-=2021-11-11361.31.3隨機變量隨機變量
14、( (超幾何分布)超幾何分布)例 某班有男生20名,女生28名,將15張電影票隨機發給15名同學,求恰有10名男生得到電影票的概率,并畫出概率分布的圖象.解: x(x=0,1,2,15)名男生得到電影票的概率分布是一個幾何分布(如下頁圖形所示),由幾何分布公式得x=10的概率為6.超幾何分布定義1.3.7 設x是一個隨機變量,超幾何分布是由下面的概率函數所確定,表示為0( )(),0abxaxkxf xp xxabkxbk-=+-2028105(10)(10)0.01664815fp x=2021-11-1137超幾何分布的概率函數的圖象超幾何分布的概率函數的圖象2021-11-1138超幾何
15、分布的分布函數圖象超幾何分布的分布函數圖象2021-11-11391.31.3隨機變量(隨機變量(poissonpoisson分布)分布)7 . 幾何分布:若隨機變量的分布列為l l則稱服從參數為p的幾何分布。幾何分布亦來源于貝努里概型。l8普哇松(poisson)分布。l若的分布列為:l其中l則稱服從參數為的普哇松分布,記為1,1,2,01,1kpkpqkpqp-= -=ekkpk!0,0,1,2k=p它的圖形(n=10,lambda=0.8)如下圖所示2021-11-11401.31.3隨機變量(隨機變量(poissonpoisson分布的概率函數圖象)分布的概率函數圖象)01234567
16、891000.050.10.150.20.250.30.350.40.45n=10,lambda=0.8n=10,lamda=0.8時有普哇松分布2021-11-11411.31.3隨機變量(隨機變量(poissonpoisson分布的分布函數圖象)分布的分布函數圖象)01234567891000.10.20.30.40.50.60.70.80.91n=10,lambda=0.8n=10,lamda=0.8例例 2 畫出正態分布) 1 , 0(n和)2 , 0(2n的概率密度函數圖形.在matlab中輸入以下命令:x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0
17、,2);plot(x,y,x,z)1密度函數密度函數:p=normpdf(x,mu,sigma) (當mu=0,sigma=1時可缺省)to matlab(liti2)如對均值為mu、標準差為sigma的正態分布,舉例如下:2021-11-11431.3 1.3 隨機變量(分布函數)隨機變量(分布函數)3.分布函數l定義1.3.4 對任意實數x,隨機變量x的分布函數就是x取值不大于x的概率,通常記作f(x),對于離散型變量來說,就是 ( )()( )t xf xp xxf t= 其中求和是對所有不超過x的t進行的.分布函數也稱作累積分 布函數(簡寫為cdf),這一叫法在于強調分布函數的概率積累
18、。to matlab(liti3)3逆概率分布逆概率分布:x=norminv(p,mu,sigma). 即求出x ,使得px50),按中心極限定理,它近似地 服從正態分布;二、使用matlab工具箱中具有特定分布總體的估計命令.(1)muhat, muci = expfit(x,alpha) 在顯著性水平alpha下,求指數分布的數據x的均值的點估計及其區間估計.(2)lambdahat, lambdaci = poissfit(x,alpha) 在顯著性水平alpha下,求泊松分布的數據x的參數的點估計及其區間估計.(3)phat, pci = weibfit(x,alpha) 在顯著性水平
19、alpha下,求weibull分布的數據x的參數的點估計及其區間估計.返回返回六、假設檢驗六、假設檢驗 在總體服從正態分布的情況下,可用以下命令進行假設檢驗.1總體方差總體方差 已知時,總體均值的檢驗使用已知時,總體均值的檢驗使用 z檢驗檢驗 h,sig,ci = ztest(x,m,sigma,alpha,tail)檢驗數據 x 的關于均值的某一假設是否成立,其中sigma 為已知方差, alpha 為顯著性水平,究竟檢驗什么假設取決于 tail 的取值:tail = 0,檢驗假設“x 的均值等于 m ”tail = 1,檢驗假設“x 的均值大于 m ”tail =-1,檢驗假設“x 的均值
20、小于 m ”tail的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒絕假設,h=0 表示不可以拒絕假設,sig 為假設成立的概率,ci 為均值的 1-alpha 置信區間.2s 例例7 matlab統計工具箱中的數據文件gas.mat.中提供了美國1993年1月份和2月份的汽油平均價格(price1,price2分別是1、2月份的油價,單位為美分),它是容量為20的雙樣本.假設1月份油價的標準偏差是每加侖4分幣(s=4),試檢驗1月份油價的均值是否等于115.解解 作假設:m = 115.首先取出數據,用以下命令: load gas然后用以下命令
21、檢驗 h,sig,ci = ztest(price1,115,4)返回:h = 0,sig = 0.8668,ci = 113.3970 116.9030.檢驗結果: 1. 布爾變量h=0, 表示不拒絕零假設. 說明提出的假設均值115 是合理的. 2. sig值為0.8668, 遠超過0.5, 不能拒絕零假設 3. 95%的置信區間為113.4, 116.9, 它完全包括115, 且精度很 高. to matlab(liti7)2總體方差總體方差 未知時,總體均值的檢驗使用未知時,總體均值的檢驗使用t 檢驗檢驗 h,sig,ci = ttest(x,m,alpha,tail)檢驗數據 x 的
22、關于均值的某一假設是否成立,其中alpha 為顯著性水平,究竟檢驗什么假設取決于 tail 的取值:tail = 0,檢驗假設“x 的均值等于 m ”tail = 1,檢驗假設“x 的均值大于 m ”tail =-1,檢驗假設“x 的均值小于 m ”tail的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒絕假設,h=0 表示不可以拒絕假設,sig 為假設成立的概率,ci 為均值的 1-alpha 置信區間.2s返回:h = 1,sig = 4.9517e-004,ci =116.8 120.2.檢驗結果: 1. 布爾變量h=1, 表示拒絕零假設.
23、 說明提出的假 設油價均值115是不合理的. 2. 95%的置信區間為116.8 120.2, 它不包括 115, 故不能接受假設. 3. sig值為4.9517e-004, 遠小于0.5, 不能接受零 假設. to matlab(liti8)例例8 試檢驗例8中2月份油價price2的均值是否等于115.解解 作假設:m = 115,price2為2月份的油價,不知其方差,故用以下命令檢驗h,sig,ci = ttest( price2 ,115)3兩總體均值的假設檢驗兩總體均值的假設檢驗使用使用 t 檢驗檢驗 h,sig,ci = ttest2(x,y,alpha,tail)檢驗數據 x
24、,y 的關于均值的某一假設是否成立,其中alpha 為顯著性水平,究竟檢驗什么假設取決于 tail 的取值:tail = 0,檢驗假設“x 的均值等于 y 的均值 ”tail = 1,檢驗假設“x 的均值大于 y 的均值 ”tail =-1,檢驗假設“x 的均值小于 y 的均值 ”tail的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒絕假設,h=0 表示不可以拒絕假設,sig 為假設成立的概率,ci 為與x與y均值差的的 1-alpha 置信區間.返回:h = 1,sig = 0.0083,ci =-5.8,-0.9.檢驗結果:1. 布爾變量h
25、=1, 表示拒絕零假設. 說明提出的 假設“油價均值相同”是不合理的. 2. 95%的置信區間為-5.8,-0.9,說明一月份油 價比二月份油價約低1至6分. 3. sig-值為0.0083, 遠小于0.5, 不能接受“油價均 相同”假設. to matlab(liti9)例例9 試檢驗例8中1月份油價price1與2月份的油價price2均值是否相同.解解 用以下命令檢驗h,sig,ci = ttest2(price1,price2)4非參數檢驗:總體分布的檢驗非參數檢驗:總體分布的檢驗matlab工具箱提供了兩個對總體分布進行檢驗的命令:(1)h = normplot(x)(2)h = w
26、eibplot(x) 此命令顯示數據矩陣x的正態概率圖.如果數據來自于正態分布,則圖形顯示出直線性形態.而其它概率分布函數顯示出曲線形態. 此命令顯示數據矩陣x的weibull概率圖.如果數據來自于weibull分布,則圖形將顯示出直線性形態.而其它概率分布函數將顯示出曲線形態.返回返回例例10 一道工序用自動化車床連續加工某種零件,由于刀具損壞等會出現故障.故障是完全隨機的,并假定生產任一零件時出現故障機會均相同.工作人員是通過檢查零件來確定工序是否出現故障的.現積累有100次故障紀錄,故障出現時該刀具完成的零件數如下: 459 362 624 542 509 584 433 748 815
27、 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851試觀察該刀具出現故障時完成的零件數屬于哪種分布.解解 1數據輸入to matlab(liti101)2作頻數直方圖 hist(x,10) 3分布的正態性檢驗 normplot(x)4參數估計: muhat,sigmahat,muci,sigmaci=normfit(x)(看起來刀具壽命服從正態分布)(刀具壽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CATCM 028-2024中藥飲片質量評價新技術應用指南
- T/CATCM 001.2-2017保健類眼貼第2部分:檢測方法
- T/CAR 4-2020制冷自提柜
- T/CAQI 32-2017家用和類似用途飲用水處理裝置用電磁閥
- T/CAQI 274-2022水處理構筑物鋼結構模塊智能制造系統技術要求
- T/CAQI 249-2022民用建筑室內空氣質量分級與評價
- T/CAMIR 003-2022媒體大數據分類分級指南
- 法治相關面試題及答案
- 公司面試題型及答案
- 惡劣環境面試題及答案
- GB/T 17468-1998電力變壓器選用導則
- 有機化學課件第十九章
- 工程部部門級安全培訓課件
- DB42T1745-2021橋梁高強度螺栓連接安裝技術指南
- 實驗室安全記錄表
- 進出口業務內部審計制
- 揚塵污染防治監理實施細則
- 教科版二年級下冊各單元知識整理復習及思維導圖-課件
- 四年級下冊數學課件-3 乘法分配律2-冀教版14張PPT
- 《學弈》優質課教學課件
- 2022年檢驗科三基試題及答案
評論
0/150
提交評論