第三章理論分布與抽樣分布_第1頁
第三章理論分布與抽樣分布_第2頁
第三章理論分布與抽樣分布_第3頁
第三章理論分布與抽樣分布_第4頁
第三章理論分布與抽樣分布_第5頁
已閱讀5頁,還剩30頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一節概率-頻率的穩定性一、統計概率的概念事件的概率:在相同條件下進行n次重復試驗,事件A發生的次數為α,則α與n之比,稱為事件A的頻率,如果試驗次數逐漸增多,事件A的頻率越來越穩定地接近定值ρ,ρ就稱為事件A的概率。P(A)=ρ當前1頁,總共35頁。統計概率的概念當n充分大時,事件A的頻率作為該事件概率的近似值,稱為統計概率。概率的基本性質:任一事件的概率不可能大于1,也不可能小于0[0≤P(A)≤1];必然事件的概率等于1[P(A)=1];不可能事件的概率等于0[P(A)=0]當前2頁,總共35頁。假設檢驗假設檢驗就是根據總體的理論分布和小概率原理,對未知或不完全知道的總體提出兩種彼此對立的假設,然后由樣本的實際結果,經過一定的計算.作出在一定概率意義上應該接受的那種假設的推斷。如果抽樣結果使小概率發生。則拒絕假設.如抽樣結果沒有使小概率發生,則接受假設。一般認為小于0.05或0.01的概率為小概率。通過假設檢驗,可以正確分析處理效應和隨機誤差,作出可取的結論。當前3頁,總共35頁。隨機事件的概率表示了隨機事件在一次試驗中出現的可能性大小。若隨機事件的概率很小,例如小于0.05、0.01、0.001,稱之為小概率事件。小概率事件實際不可能性原理當前4頁,總共35頁。小概率事件雖然不是不可能事件,但在一次試驗中出現的可能性很小,不出現的可能性很大,以至于實際上可以看成是不可能發生的。在統計學上,把小概率事件在一次試驗中看成是實際不可能發生的事件稱為小概率事件實際不可能性原理,亦稱為小概率原理。小概率事件實際不可能性原理是統計學上進行假設檢驗(顯著性檢驗)的基本依據。當前5頁,總共35頁。假設檢驗的步驟1.提出假設無效假設(nullhypothesis):備選假設(alternativehypothesis):“無效”指處理效應與總體參數之間沒有真實的差異,試驗結果中的差異乃誤差所致。引進一醋的新曲種,以原生產標準為對照,已知原生產標準醋酸含量為=9.75%,采用新曲種釀造10個樣本的醋酸含量平均數為11.99%,標準差S為1.3%,試分析采用新曲種是否提高了醋酸的含量。假設:

即:是來自隨機誤差當前6頁,總共35頁。2.確定顯著水平以多大概率接受或否定無效假設?通常規定5%()和1%()為測試差異是否顯著的概率標準,稱為檢驗水平或顯著標準,一般以a表示。當前7頁,總共35頁。3.推斷是否接受假設當時,認為差異顯著,標記為“*”,否定;當時,便認為差異非常顯著,標記“**”號;當時,則認為其差異不顯著,其差值為零,差值是來自誤差,接受當前8頁,總共35頁。二、概率的運算法則1.概率的加法定理:互斥事件。某種產品的正品率與次品率。2.概率的乘法定理:互不排斥或相容的事件。某生產流水線上第一道工序產品與第二道工序產品的正品率。當前9頁,總共35頁。第二節二項分布有些總體的各個個體的某種性狀,只有兩種結果,非此即彼,此和彼是對立事件。這種由非此即彼事件構成的總體,叫做二項總體。這些資料的理論分布為二項分布。當前10頁,總共35頁。二項分布的概念

如某實驗中小白鼠染毒后死亡概率P為0.8,則生存概率為=1-P=0.2,故對一只小白鼠進行實驗的結果為:死(概率為P)或生(概率為1-P)

對二只小白鼠(甲乙)進行實驗的結果為:甲乙均死(概率為P2)、甲死乙生[概率為P(1-P)]、乙死甲生[概率為(1-P)P]或甲乙均生[概率為(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]2

依此類推,對n只小白鼠進行實驗,所有可能結果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n其中n為樣本含量,即事件發生總數,x為某事件出現次數,cnxPx(1-P)n-x為二項式通式,cnx=n!/x!(n-x)!,P為總體率。

因此,二項分布是說明結果只有兩種情況的n次實驗中發生某種結果為x次的概率分布。其概率密度為:

,x=0,1,...n。

當前11頁,總共35頁。二項分布的應用條件每次實驗只有兩類對立的結果;n次事件相互獨立;每次實驗某類結果的發生的概率是一個常數。當前12頁,總共35頁。二項分布的形狀(1)二項分布圖形的形狀取決于P和n的大小;(2)當P=0.5時,無論n的大小,均為對稱分布;(3)當P<>0.5,n較小時為偏態分布,n較大時逼近正態分布。當前13頁,總共35頁。當前14頁,總共35頁。二項分布的參數平均數和標準差二項分布的平均數μ=np,二項分布的標準差為np(1-p)的算術平方根。當前15頁,總共35頁。正態分布

1、正態分布也稱高斯(Gauss)分布,是一種連續型隨機變量的理論分布。它的分布狀態是多數變量都圍繞在平均值左右,由平均值到分布的兩側,變量數減少。正態分布的概率函數為:

為正態分布的概率密度函數,表示某一定x值出現的概率密度。表示總體平均數,表示總體方差。

正態分布是一種在統計理論和應用上最重要的分布。試驗誤差的分布一般服從于這種分布,許多生物現象的計量資料均近似服從這種分布。正態分布記為N(,)。

當前16頁,總共35頁。當時,f(x)值最大,所以正態分布曲線是以平均數為中心分布。當的絕對值相等時,f(x)值也相等,所以正態分布是以為中心向左右兩側對稱的分布。標準離差u=的絕對值越大,f(x)值就越小,但f(x)永遠不會等于0,所以正態分布以x軸為漸近線,x的取值區間為。正態分布曲線完全由位置參數和形態參數來決定。確定正態分布曲線在x軸上的中心位置,確定正態分布的變異度。正態分布具有以下特征:

當前17頁,總共35頁。當前18頁,總共35頁。值不同,值相同的三條正態分布曲線值相同,值不同的三條正態分布曲線當前19頁,總共35頁。標準正態分布記為N(0,1)

標準正態分布當前20頁,總共35頁。為了方便,令即可將的正態分布轉化為的標準正態分布。欲求一定區間標準正態分布曲線下的面積只需查附表1即可。當前21頁,總共35頁。有一批面包,重量平均為100g,標準差為1.2g,試求其單個面包重量從100g到102g的概率是多少?根據公式得:查表得當u=1.66時,對應的概率P=0.451,從100g到102g的面包占總面包數量的45.1%當前22頁,總共35頁。t分布

當樣本容量較大(),用樣本方差估計。但當樣本容量不大()時,如果仍用估計,這時標準離差就不呈正態分布,而是服從自由度為的t分布。

當前23頁,總共35頁。t分布具有以下特征:

t分布曲線也是左右對稱的,以0為中心向兩側遞降。t分布受自由度df=n-1的制約,每個自由度都有一條t分布曲線。和正態分布相比,t分布的頂部偏低,尾部偏高,自由度df>30時,其曲線就比較接近正態分布曲線,當時則和正態分布曲線重合。當前24頁,總共35頁。抽樣誤差當前25頁,總共35頁。系統誤差和隨機誤差系統誤差是指測定值的數學期望與真值之差用ε表示。

ε=x∞-x真值

隨機誤差是指n次測量中各次測量值x與測量數學期望之差。用σi表示:

σi=xi-x∞

數學期望:指當測量次數n趨向無窮大(n→∞)時算術平均值的極限。用x∞表示:

當前26頁,總共35頁。x真值、x∞和xi關系的示意圖。從圖中得知,隨機誤差σi說明各次測量值與x∞的離散程度,即精密度,σi越小說明數據的重復性好、精密度高;而系統誤差ε可做為x∞與真值x真值偏離的尺度,ε越小,即準確度越高。當前27頁,總共35頁。平均誤差與標準誤差平均誤差可用下式表示:

其中:;用平均誤差表示測量誤差,計算方便,但由于采用平均值的方法,容易掩蓋個別質量不高的測量。

當前28頁,總共35頁。標準誤差σ又稱均方根誤差。通常真值x是未知的,而且測量次數n有限,這時可以用貝塞爾(Bessel)式得出在有限次測量情況下,單次測量值的標準離差S,且把測量的標準離差(S)作為標準誤差(σ)的估計,σ≈S,這樣標準誤差σ就表示為:

當前29頁,總共35頁。絕對誤差與相對誤差絕對誤差是測量值與真值之間的偏差,某次實驗的絕對誤差可用下式計算:

絕對誤差=測量值-真值

視測量值與真值相比較大小不同,絕對誤差可以是正值,也可以是負值,它的單位與測量的單位相同。

相對誤差是絕對誤差與真值的比值(百分數表示),某次實驗的相對誤差可用下式計算:當前30頁,總共35頁。樣本異常值的判斷和處理

1、概念

樣本異常值是指樣本中的個別值,其數值明顯偏離它所在樣本的其余觀測值。

異常值可能僅僅是數據中固有的隨機誤差的極端表現,也可能是過失誤差。異常值檢驗的顯著性水平,推薦的值為1%。當前31頁,總共35頁。2、異常值的處理

A、異常值保留在樣本中參加其后的數據統計計算。B、允許剔除異常值,即把異常值從樣本中排除。C、允許剔除異常值并追加適宜的觀測值代入樣本。D、在找到實際原因時修正異常值。處理規則為:(1)對于任何異常值,若無充分的技術上的原因,則不得剔除或修正。(2)異常值中除有充分的技術上的或實驗上的理由外,在統計上表現為高異常,才允許剔除或修正。當前32頁,總共35頁。3、簡單的壞值及其剔除原則

(1)拉依達原則

如果某個測量值Xd的離差Ud滿足:

Ud>3

就認為Xd是含有過失誤差的壞值,須剔除,誤差絕對值大于3的概率為0.26%.(2)肖維勒準則

如果某個測量值Xd的離差Ud滿足:

Ud>Wn

式中wn與測量值的測試次數n有關

壞值Xd應剔除。當前33頁,總共35頁。肖維勒系數wn數值表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論