




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
一般地,假設一批產品共有N件,其中有M件次品.從N件產品中隨機抽取n件(不放回),用X表示抽取的n件產品中的次品數,則X的分布列為1.超幾何分布:若隨機變量X服從超幾何分布,則有2.超幾何分布的均值:其中n,N,M∈N*,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M}.
溫故知新:超幾何分布二項分布試驗類型
抽樣
抽樣試驗種數有
種物品有
種結果總體個數
個
個隨機變量取值的概率利用
計算利用
計算聯系當
時,超幾何分布
二項分布不放回
有放回兩兩有限無限古典概型獨立重復試驗總體N很大近似3.超幾何分布與二項分布的聯系與區別:人教A版2019選擇性必修第三冊7.5正態分布
第七章《隨機變量及其分布》
高斯是一個偉大的數學家,一生中的重要貢獻不勝枚舉.德國的10馬克紙幣上印有高斯的頭像和正態分布的曲線,這就傳達了一個信息:在高斯的科學貢獻中,對人類文明影響最大的是正態分布.
那么,什么是正態分布?正態分布的曲線有什么特征?
情境引入:
現實中,除了前面已經研究過的離散型隨機變量外,還有大量問題中的隨機變量不是離散型的,它們的取值往往充滿某個區間甚至整個實軸,但取一點的概率為0,我們稱這類隨機變量為連續型隨機變量(continuousrandomvariable).下面我們看一個具體問題.
問題:自動流水線包裝的食鹽,每袋標準質量為400g.由于各種不可控制的因素,任意抽取一袋食鹽,它的質量與標準質量之間或多或少會存在一定的誤差(實際質量減去標準質量).用X表示這種誤差,則X是一個連續型隨機變量,檢測人員在一次產品檢驗中,隨機抽取了100袋食鹽,獲得誤差X(單位:g)的觀測值如下:-0.6-1.4-0.73.3-2.9-5.21.40.14.40.9-2.6-3.4-0.7-3.2-1.72.90.61.72.91.20.5-3.72.71.1-3.0-2.6-1.91.72.6.0.42.6-2.0-0.21.8-0.7-1.3-0.5-1.30.2-2.12.4-1.5-0.43.8-0.11.50.3-1.80.02.53.5-4.2-1.0-0.20.10.91.12.20.9-0.6-4.4-1.13.9-1.0-0.61.70.3-2.4-0.1-1.7-0.5-0.81.71.44.41.2-1.8-3.1-2.1-1.62.20.34.8-0.8-3.5-2.73.81.4-3.5-0.9-2.2-0.7-1.31.5-1.5-2.21.01.31.7-0.9(1)如何描述這100個樣本誤差數據的分布?(2)如何構建適當的概率模型刻畫誤差X的分布?思考:(1)如何描述這100個樣本誤差數據的分布?(2)如何構建適當的概率模型刻畫誤差X的分布?根據已學的統計知識,可用頻率分布直方圖描述這組誤差數據的分布,如圖(1)所示.頻率分布直方圖中每個小矩形的面積表示誤差落在相應區間內的頻率,所有小矩形的面積之和為1.
觀察圖形可知:誤差觀測值有正有負,并大致對稱地分布在X=0的兩側,而且小誤差比大誤差出現得更頻繁.頻率/組距X-60-4-200.150.050.100.20426圖(1)
隨著樣本數據量越來越大,讓分組越來越多,組距越來越小,由頻率的穩定性可知,頻率分布直方圖的輪廓就越來越穩定,接近一條光滑的鐘形曲線,如圖(2)所示.頻率/組距X-60-4-200.150.05圖(2)0.100.20426PX-60-4-200.150.05圖(3)0.100.20426
根據頻率與概率的關系,可用圖(3)中的鐘形曲線(曲線與水平軸之間的區域的面積為1)來描述袋裝食鹽質量誤差的概率分布.例如,任意抽取一袋食鹽,誤差落在[-2,-1]內的概率,可用圖中黃色陰影部分的面積表示.追問1:由函數知識可知,圖(3)中的鐘形曲線是一個函數.那么,這個函數是否存在解析式呢?
答案是肯定的.在數學家的不懈努力下,找到了以下刻畫隨機誤差分布的解析式:其中μ∈R,σ>0為參數.
探究新知:
顯然,對任意的x∈R,f(x)>0,它的圖象在x軸的上方,可以證明x軸和曲線之間的區域的面積為1.我們稱f(x)為正態密度函數,稱它的圖象為正態密度曲線,簡稱正態曲線.若隨機變量X的概率分布密度函數為f(x),則稱隨機變量X服從正態分布,記為X~N(μ,σ2).f(x)x
μaA圖(4)BxbO
若X~N(μ,σ2),則如圖(4)所示,X取值不超過x的概率P(X≤x)為圖中區域A的面積,而P(a≤X≤b)為區域B的面積.1.正態曲線特別地,當μ=0,σ=1時,稱隨機變量X服從標準正態分布.
早在1734年,法國數學家棣莫弗(A.DeMoivre,1667-1754)在研究二項概率的近似計算時,已提出了正態密度函數的形式,但當時只是作為一個數學表達式.直到徳國數學家高斯(C.F.Gauss,1777-1855)提出“正態誤差”的理論后,正態密度函數才取得“概率分布”的身份.因此,人們也稱正態分布為高斯分布.
正態分布在概率和統計中占有重要地位,它廣泛存在于自然現象、生產和生活實踐之中.在現實生活中,很多隨機變量都服從或近似服從正態分布,例如,某些物理量的測量誤差,某一地區同年齡人群的身高、體重、肺活量等,一定條件下生長的小麥的株高、穗長、單位面積產量,自動流水線生產的各種產品的質量指標(如零件的尺寸、纖維的纖度、電容器的電容),某地每年7月的平均氣溫、平均濕度、降水量等,一般都近似服從正態分布.追問2:觀察正態曲線及相應的密度函數,你能發現正態曲線的哪些特點?
由X的密度函數及圖象可以發現,正態曲線還有以下特點:(1)曲線是單峰的,它關于直線x=μ對稱;(2)曲線在x=μ處達到峰值
(3)當|x|無限增大時,曲線無限接近x軸.f(x)x
μaA圖(4)BxbO2.正態曲線的特點追問3:一個正態分布由參數μ和σ完全確定,這兩個參數對正態曲線的形狀有何影響?它們反映正態分布的哪些特征?
由于正態曲線關于x=μ對稱,因此,當參數σ固定時,正態曲線的位置由μ確定,且隨著μ的變化而沿x軸平移,所以參數μ反映了正態分布的集中位置,可以用均值來估計,故有E(X)=μ.0.4x-3μ=12-1圖(5)-213Oμ=-1μ=0yσ=1
探究新知:
當μ取定值時,因為正態曲線的峰值與σ成反比,而且對任意的σ>0,正態曲線與x軸之間的區域的面積總為1.因此,當σ較小時,峰值高,正態曲線“瘦高”,表示隨機變量X的分布比較集中;當σ較大時,峰值低,正態曲線“矮胖”,表示隨機變量X的分布比較分散,所以σ反映了隨機變量的分布相對于均值μ的離散程度,可以用標準差來估計,故有D(X)=σ2.0.4x-3σ=0.52-1圖(6)-213Oσ=2μ=0yσ=10.8追問3:一個正態分布由參數μ和σ完全確定,這兩個參數對正態曲線的形狀有何影響?它們反映正態分布的哪些特征?(1)曲線在x軸的上方,與x軸不相交;(3)曲線與x軸之間的面積為1;(4)當μ一定時,σ越大,曲線越“矮胖”,表示總體的分布越分散;σ越小,曲線越“瘦高”,表示總體的分布越集中.3.正態曲線的性質(5)參數μ反映了正態分布的集中位置,σ反映了隨機變量的分布相對于均值μ的離散程度.
在實際問題中,參數μ,σ可以分別用樣本均值和樣本標準差來估計,故有(2)曲線是單峰的,它關于直線x=μ對稱,且在x=μ處取得最大值;σ=0.5012-1-2xy-33X=μσ=1σ=2例:李明上學有時坐公交車,有時騎自行車,他各記錄了50次坐公交車和騎自行車所花的時間,經數據分析得到:坐公交車平均用時30min,樣本方差為36;騎自行車平均用時34min,樣本方差為4.假設坐公交車用時X和騎自行車用時Y都服從正態分布.(1)估計X,Y的分布中的參數;(2)根據(1)中的估計結果,利用信息技術工具畫出X和Y的分布密度曲線;(3)如果某天有38min可用,李明應選擇哪種交通工具?如果某天只有34min可用,又應該選擇哪種交通工具?請說明理由.解:(1)隨機變量X的樣本均值為30,樣本標準差為6;隨機變量Y的樣本均值為34,樣本標準差為2.用樣本均值估計參數μ,用樣本標準差估計參數σ,可以得到
X~N(30,62),Y~N(34,22).(2)由(1)得X~N(30,62),Y~N(34,22),作出X和Y的分布密度曲線如圖示.(3)應選擇在給定時間內不遲到的概率大的交通工具.由圖可知,P(X≤38)<P(Y≤38),P(X≤34)>P(Y≤34).所以,如果有38min可用,那么騎自行車不遲到的概率大,應選擇騎自行車;如果只有34min可用,那么坐公交車不遲到的概率大,應選擇坐公交車.
4.正態曲線下的面積規律-x1
-x2x2x1
a-a正態曲線下對稱區域的面積相等對應的概率也相等利用“對稱法”求正態分布下隨機變量在某個區間的概率012-1-2xy-334μ=10.51-aa1-a1-2a1.若X~N(2,32),則E(X)=______,D(X)=______
2932
2.X~N(μ,σ2),若E(X)=3,σ(X)=2,則μ=___,σ=___
3.若X~N(1,σ2),且P(X<0)=a,則(1)P(X>1)=_______;(2)P(X>0)=______;(3)P(X>2)=______;(4)P(X<2)=______;(5)P(0<X<2)=______;(6)P(0<X<1)=________0.5-a
學以致用:
假設X~N(μ,σ2),可以證明:對給定的k∈N*,P(μ-kσ≤X≤μ+kσ)是一個只與k有關的定值.5.特殊區間的概率
由此看到,盡管正態變量取值范圍是(-∞,+∞),但在一次試驗中,X的取值幾乎總是落在區間[μ-3σ,μ+3σ]內,而在此區間以外取值的概率大約只有0.0027,通常認為這種情況幾乎不可能發生.
在實際應用中,通常認為服從于正態分布N(μ,σ2)的隨機變量X只取[μ-3σ,μ+3σ]中的值,這在統計學中稱為3σ原則.若隨機變量X的概率分布密度函數為f(x),則稱隨機變量X服從正態分布,記為X~N(μ,σ2).特別地,當μ=0,σ=1時,稱隨機變量X服從標準正態分布.1.正態分布:正態密度函數:2.特殊區間的概率:
課堂小結:(1)曲線在x軸的上方,與x軸不相交;(3)曲線與x軸之間的面積為1;(4)當μ一定時,σ越大,曲線越“矮胖”,表示總體的分布越分散;σ越小,曲線越“瘦高”,表示總體的分布越集中.3.正態曲線的性質(5)參數μ反映了正態分布的集中位置,σ反映了隨機變量的分布相對于均值μ的離散程度.
在實際
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 柴油運輸合同環保設施投入協議
- 2024年福州市羅源生態環境局招聘筆試真題
- 校醫個人工作總結1000字(32篇)
- 行政組織的人力資源戰略與績效關系研究試題及答案
- 農村合作社農產品供應鏈協作合同書
- 數據庫性能監控與調優試題及答案
- 醫學影像技術診斷與實踐試題集
- 籃球裁判員考試試題及答案大全
- 游艇代理合同協議書
- 燈具行業的工作報告
- (完整word版)電梯管理證復審申請表
- 材料科學基礎基礎知識點總結
- 醫學倫理審查申請表1
- 數控銑工圖紙(60份)(共60頁)
- 香樟栽植施工方案
- 惠州市出租車駕駛員從業資格區域科目考試題庫(含答案)
- 加工設備工時單價表
- 高脂血癥藥物治療ppt課件
- 高層建筑等電位聯結安裝技術分析探討
- 模型預測控制(課堂PPT)
- OQC出貨檢驗規范及方法
評論
0/150
提交評論