




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第三節 統計一、基本知識概要:1.三種常用抽樣方法:(1)簡單隨機抽樣:設一個總體的個數為N。如果通過逐個抽取的方法從中抽取一個樣本,且每次抽取時各個個體被抽到的概率相等,就稱這樣的抽樣為簡單隨機抽樣。簡單隨機抽樣的常用方法:抽簽法,隨機數表法用隨機數表進行抽樣的步驟:將總體中的個體編號;選定開始號碼;獲取樣本號碼。(2)系統抽樣(也稱為機械抽樣):當總體的個數較多時,采用簡單隨機抽樣較為費事。這時可將總體分成均衡的幾個部分,然后按照預先定出的規則,從每一部分抽取一個個體,得到所需要的樣本,這種抽樣叫做系統抽樣(也稱為機械抽樣)。系統抽樣的步驟:采用隨機的方式將總體中的個體編號;整個的編號分段
2、(即分成幾個部分),要確定分段的間隔k。當N/n(N為總體中的個體的個數,n為樣本容量)是整數時,k=N/n;當N/n不是整數時,通過從總體中剔除一些個體使剩下的總體中個體的個數N能被n整除,這時k=N/n;在第一段用簡單隨機抽樣確定起始的個體編號1;按照事先確定的規則抽取樣本(通常是將1加上間隔k得到第2個編號1+k,第3個編號1+2k,這樣繼續下去,直到獲取整個樣本)。(3)分層抽樣:當已知總體由差異明顯的幾部分組成時,為了使樣本更充分地反映總體的情況,常將總體分成幾個部分,然后按照各部分所占的比例進行抽樣,這種抽樣叫做“分層抽樣”,其中所分成的各部分叫做“層”。三種抽樣方法的比較類別共同
3、點各自特點相互聯系適用范圍簡單隨機抽樣抽樣過程中每個個體被抽取的概率相等從總體中逐個抽取總體中的個數較少系統抽樣將總體均分成幾部分,按事先確定的規則分別在各部分中抽取在起始部分抽樣時采用簡單隨機抽樣總體中的個數較多分層抽樣將總體分成幾層,分層進行抽取各層抽樣時采用簡單隨機抽樣或系統抽樣總體由差異明顯的幾部分組成2、總體分布的估計:隨著試驗次數的不斷增加,試驗結果的頻率值在相應的概率值附近擺動.當試驗次數無限增大時,頻率值就變成相應的概率了.此時隨著樣本容量無限增大其頻率分布也就會排除抽樣誤差,精確地反映總體取的概率分布規律,通常稱為總體分布.用樣本的頻率分布去估計總體分布:由于總體分布通常不易
4、知道,我們往往用樣本的頻率分布去估計總體分布,一般地,樣本容量越大,估計越精確.總體分布的估計的兩種方式(1)頻率分布表 (2)頻率分布直方圖。3、正態分布的概念及主要性質:正態分布的概念:如果連續型隨機變量的概率密度曲線為,其中為常數,并且,則稱服從正態分布,簡記為。正態分布的期望與方差:若,則。正態分布的主要性質:)曲線在x軸上方,并且關于直線x=對稱;)曲線在x=時處于最高點,由這一點向左右延伸時,曲線逐漸降低;)曲線的對稱軸位置由確定;曲線的形狀由確定,越大,曲線越:“矮胖”;反之曲線越“高瘦”。2 / 9標準正態分布:當=0,=1時,可以寫成,這時稱服從標準正態分布,簡記為。標準正態
5、分布的函數表:由于標準正態分布應用十分廣泛,已制成專門的標準正態函數表,供人們查閱。在標準正態分布表中,相應于每一個的函數值是指總體取小于的值的概率(函數實際上是正態總體N(0,1)的累積分布函數),即=。若,則,4、線性回歸:(1)相關關系:自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關系。注:與函數關系不同,相關關系是一種非確定性關系。(2)回歸分析:對具有相關關系的兩個變量進行統計分析的方法。(3)散點圖:表示具有相關關系的兩個變量的一組數據的圖形。(4)回歸直線方程:,其中, 。相應的直線叫回歸直線,對兩個變量所進行的上述統計叫做回歸分析。(5)相關系數:相關系數的性質
6、:(1)|r|1。(2)|r|越接近于1,相關程度越大;|r|越接近于0,相關程度越小二、例題:例1:某批零件共160個,其中一級品有48個,二級品64個,三級品32個,等外品16個從中抽取一個容量為20的樣本請說明分別用簡單隨機抽樣、系統抽樣、分層抽樣法抽取時總體中的每個個體被取到的概率相同解:(1)簡單隨機抽樣法:可采用抽簽法,將160個零件按160編號,相應地制做160號的160個簽,從中隨機抽個。顯然每個個體被抽到的概率為。(2)系統抽樣法:將160個零件按160編號,按編號順序分成20組,每組8個。先在第一組用抽簽法抽得號,則在其余組中分別抽得第號,此時每個個體被抽到的概率為。(3)
7、分層抽樣法:按比例,分別在一級品,二級品,三級品,等外品,是抽取個,個,個,個。每個個體被抽到的概率分別為,即都是。綜上所述,無論采取哪種抽樣,總體和每個個體被抽到的概率都是。說明:三種抽樣方法的共同點就是每個個體被抽到的概率相同,這樣樣本的抽取體現了公平性和客觀性。例2:將溫度調節器放置在貯存著某種液體的容器內,調節器設定在,液體的溫度(單位:)是一個隨機變量,且。(1) 若,求的概率(2) 若要保持液體的溫度至少為的概率不低于0.99,問至少是多少?(其中若)。剖析:(1)要求P()F(89),因為不是標準正態分布,而給出的是,故需轉化為標準正態分布的數值。(2)轉化為標準正態分布下的數值
8、求概率,再利用解:(1)(2)由已知滿足說明:(1)若(2)標準正態分布的密度函數是偶函數,時,為增函數,時,為減函數。例3:已知測量誤差,必須進行多少次測量,才能使至少有一次測量誤差的絕對值不超過的頻率大于0.9?解:設表示次測量中絕對誤差不超過的次數,則其中由題意,因此,至少要進行3次測量,才能使至少有一次誤差的絕對值不超過的概率大于0.9。例4:有一個容量為100的樣本,數據的分組及各組的頻數如下:(1)列出樣本的頻率分布表;(2)畫出頻率分布直方圖;(3)估計數據小于30.5的概率。解:(1)樣本的頻率分布如下:分組頻數頻率12.515.560.0615.518.5160.1618.5
9、21.5180.1821.524.5220.2224.527.5200.2027.530.5100.1030.533.580.08合計100100(2)頻率分布直方圖如圖(3)數據大于等于30.5的頻率是0.08,所以,小于30.5的頻率是0.92. 所以,小于30.5的概率約是0.92.例5:一個工廠在某年里每月產品的總成本y(萬元)與該月產量x(萬件)之間有如下一組數據:x1.081.121.191.281.361.481.591.681.801.871.982.07y2.252.372.402.552.642.752.923.033.143.263.363.50(1) 畫出散點圖(2) 求月成本與月產量之間的回歸直線方程。解:(1)畫出散點圖如圖所示:(2)列出下表,并用科學計算器進行有關計算i123456789101112xi1.081.121.191.281.361.481.591.681.801.871.982.07yi2.252.372.402.552.642.752.923.033.143.263.363.50xiyi2.432.6542.8563.2643.5904.074.6435.0905.6526.09666537.245 ,于是由公式可得:,因此所求的回歸直線方程是說明:求線性回歸直線方程的步驟:(1)畫散點圖觀察相關性(2)列出表格,求出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廠房建設工程承包合同風險評估與預防措施
- 2025(現匯)外貿合同書模板
- 2025上海市二手房買賣合同模板范文
- 2025企業軟件工程師勞動合同
- amc面試題目及答案
- 農學生物化學試題及答案
- 蘭坪交警考試題庫及答案
- 測試題及答案英語
- 汽車上崗證試題及答案
- 青海日報考試題庫及答案
- 高考日語培訓協議書
- 2025年江蘇省泰州市中考二模數學試題(含部分答案)
- 鋼筋綁扎技術交底(鋼筋)
- 2025浙江杭州市科創集團有限公司招聘10人筆試參考題庫附帶答案詳解
- 貸款居間協議書范本
- 佛山事業考試試題及答案
- 施工過程中常見安全隱患的識別與預防
- 物業住宅小區弱電系統培訓課件
- 赤峰山金紅嶺有色礦業有限責任公司招聘筆試題庫2025
- 項目樣板引路管理制度
- 語文基礎模塊上知到課后答案智慧樹章節測試答案2025年春長春市城建工程學校
評論
0/150
提交評論