隨機抽樣正態分布_第1頁
隨機抽樣正態分布_第2頁
隨機抽樣正態分布_第3頁
隨機抽樣正態分布_第4頁
隨機抽樣正態分布_第5頁
已閱讀5頁,還剩41頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1.了解分布的意義和作用,會列頻了解分布的意義和作用,會列頻率分布表,會畫頻率分布直方圖、頻率率分布表,會畫頻率分布直方圖、頻率折線圖、莖葉圖,理解它們各自的特點折線圖、莖葉圖,理解它們各自的特點.2.理解樣本數據標準差的意義和作理解樣本數據標準差的意義和作用,會計算數據標準差用,會計算數據標準差.3.能從樣本數據中提取基本的數字能從樣本數據中提取基本的數字特征(如平均數、標準差),并做出合特征(如平均數、標準差),并做出合理的解釋理的解釋.4.會用樣本的頻率分布估計總體分布會用樣本的頻率分布估計總體分布,會用樣本的基本數字特征估計總體的基本會用樣本的基本數字特征估計總體的基本數字特征數字特征

2、,理解用樣本估計總體的思想理解用樣本估計總體的思想.5.會用隨機抽樣的基本方法和樣本估會用隨機抽樣的基本方法和樣本估計總體的思想,解決一些簡單的實際問題計總體的思想,解決一些簡單的實際問題.6.通過實際問題,借助直觀(如實際通過實際問題,借助直觀(如實際問題的直方圖),認識正態分布曲線的特問題的直方圖),認識正態分布曲線的特點及曲線所表示的意義點及曲線所表示的意義.1.某初級中學共有某初級中學共有30個班,其中初一有個班,其中初一有12個個班,初二有班,初二有12個班,初三有個班,初三有6個班個班.現從中現從中抽出抽出5個班進行調查,則應在初三個班進行調查,則應在初三6個班中個班中抽取抽取 個

3、班個班.12.把數據把數據x1,x2,xn分成若干組分成若干組,已知某數已知某數xi的頻的頻數和頻率分別為數和頻率分別為4和和0.125,則則n的值是的值是( )CA.16 B.24C.32 D.643.數據數據5,10,73,1,3,105,111的中位的中位數與極差的差為數與極差的差為 .-100 因為中位數是因為中位數是10,極差是,極差是111-1=110,故所求的值為故所求的值為10-110=-100.4.將一組數據同時減去將一組數據同時減去3.1,得到一組新數,得到一組新數據據,若原數據的平均數、方差分別為、若原數據的平均數、方差分別為、s2,則新數據的平均數是則新數據的平均數是

4、,方差是方差是 .-3.1s2x 設設= (x1+x2+xn),則則 = (x1-3.1)+(x2-3.1)+(xn-3.1) =-3.1.s2= (xi- )2= (xi-3.1)-(-3.1)2= (xi- )2=s2.x1n1n1n1nix1n1ni1n1nix5.隨機變量隨機變量的概率密度函數為的概率密度函數為 (x)= x(-,+).若若N(0,1),且,且=a+b(a0),則則=( )2(5)812 2xeA. B.C. D.525252 252 2A 因為因為E=0,D=1,E=-5,D=4,而而E=E(a+b)=aE+b,D=D(a+b)=a2D. -5a+b=0 a= 4a2

5、=1 b= ,所以所以= + ,故選,故選A.又又a0,所以所以,解得解得125212526.已知正態曲線已知正態曲線,(x)= ,當當=時,曲時,曲線最高點的縱坐標是標準正態曲線最高點的線最高點的縱坐標是標準正態曲線最高點的縱坐標的縱坐標的 倍倍.22()212xe2332 當當= 時,正態曲線最高點的縱時,正態曲線最高點的縱坐標為坐標為 ,而標準正態曲線最高點,而標準正態曲線最高點的縱坐標為的縱坐標為 ,故答案是,故答案是 .23122312321.數據的基本數字特征數據的基本數字特征(1)平均數:一組數據的平均數,記為平均數:一組數據的平均數,記為.設有設有n個數據個數據x1,x2,xn

6、,則平均數為,則平均數為 = .(2)中位數:一組數據按照從小到大或從中位數:一組數據按照從小到大或從大到小的順序進行排列時,處于中間位置的大到小的順序進行排列時,處于中間位置的數數.當這組數據的個數為奇數時,中位數為當這組數據的個數為奇數時,中位數為中間一個數;當這組數據的個數為偶數時,中間一個數;當這組數據的個數為偶數時,中位數為中間的兩個數的平均數中位數為中間的兩個數的平均數.x12nxxxn(3)眾數眾數:一組數據中出現次數最多的數一組數據中出現次數最多的數.(4)極差極差:一組數據中最大數與最小數的差一組數據中最大數與最小數的差.(5)方差方差:一組數據中所有數與平均數的差一組數據中

7、所有數與平均數的差的平方和的平均數的平方和的平均數,記為記為s2,即即s2= .(6)標準差:方差的算術平方根標準差:方差的算術平方根,記作記作s.2.主要統計圖表主要統計圖表(1)基本統計圖表:象形、條形、折線、基本統計圖表:象形、條形、折線、扇形統計圖扇形統計圖.22212()()()nxxxxxxn(2)頻率分布直方圖的畫圖步驟:頻率分布直方圖的畫圖步驟:()求極差;求極差;()決定組距與組數;決定組距與組數;()將將數據分組;數據分組;()列頻率分布表;列頻率分布表;()畫頻率分畫頻率分布直方圖布直方圖(以頻率組距為縱坐標以頻率組距為縱坐標).(3)頻率分布折線圖:連接頻率分布直方頻率

8、分布折線圖:連接頻率分布直方圖中各小長方形上端的中點所得的折線圖中各小長方形上端的中點所得的折線.(4)總體密度曲線:隨著樣本容量的增加總體密度曲線:隨著樣本容量的增加,作頻率分布折線圖時所分的組數增加作頻率分布折線圖時所分的組數增加,組距減組距減小小,相應的頻率折線圖會越來越接近于一條光相應的頻率折線圖會越來越接近于一條光滑曲線滑曲線,則稱這條光滑曲線為總體密度曲線則稱這條光滑曲線為總體密度曲線.(5)莖葉圖:中間的數字表示數據的十位莖葉圖:中間的數字表示數據的十位數字,旁邊的數字分別表示兩組數據中各數字,旁邊的數字分別表示兩組數據中各個數據的個位數字個數據的個位數字.3.抽樣方法抽樣方法(

9、1)簡單隨機抽樣:從含有簡單隨機抽樣:從含有N個個體的總個個體的總體中逐個不放回地抽取體中逐個不放回地抽取n個個體作為樣本個個體作為樣本(nN),如果每次抽取時總體內的各個個體,如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法被抽到的機會都相等,就把這種抽樣方法叫做叫做 .有兩種常用方法:有兩種常用方法:簡單隨機抽樣簡單隨機抽樣() :就是把總體中的就是把總體中的N個個體編個個體編號號,把號碼寫在號簽上把號碼寫在號簽上,將號簽放在一個容器中將號簽放在一個容器中,攪拌均勻后,每次從中取出一個號簽攪拌均勻后,每次從中取出一個號簽,連續抽連續抽取取n次次,就得到一個容量為就得到一個

10、容量為n的樣本的樣本.() :利用隨機數表、隨機利用隨機數表、隨機數骰子或計算機產生的隨機數進行抽樣數骰子或計算機產生的隨機數進行抽樣.(2)系統抽樣:按下列步驟進行抽樣:系統抽樣:按下列步驟進行抽樣:()先將總體的先將總體的N個個體編號;個個體編號;()確定確定分段間隔分段間隔k,對編號進行分段;,對編號進行分段;()在第在第1段用段用簡單隨機抽樣確定第一個個體編號簡單隨機抽樣確定第一個個體編號l(lk);()按照一定的規則抽取樣本按照一定的規則抽取樣本.抽簽法抽簽法隨機數表法隨機數表法 (3)分層抽樣分層抽樣:即即 . . . . 4.正態分布正態分布 (1)如果隨機變量如果隨機變量的概率

11、密度為的概率密度為 ,(x)= . 其中其中、分別表示總體的平均數與標準分別表示總體的平均數與標準差,稱差,稱服從參數為服從參數為、的正態分布,記作的正態分布,記作N(,2),函數圖象稱為正態密度曲線,簡函數圖象稱為正態密度曲線,簡稱正態曲線稱正態曲線.在抽樣時在抽樣時,將總體分成將總體分成互不交叉的層互不交叉的層,然后按照一定的比例然后按照一定的比例,從各層從各層獨立地抽出一定數量的個體獨立地抽出一定數量的個體,將各層取出的將各層取出的個體合在一起作為樣本個體合在一起作為樣本(x(-,+)22()212xe一般的,如果對于任何實數一般的,如果對于任何實數ab,隨機變隨機變量量滿足滿足P(ab

12、)= ,(x)dx,則稱,則稱的分布為的分布為 .(2)標準正態分布標準正態分布在正態分布中在正態分布中,當當= ,= 時時,正態總正態總體稱為標準正態總體,正態分布體稱為標準正態總體,正態分布N(0,1),稱,稱為標準正態分布,記作為標準正態分布,記作N(0,1).(3)正態曲線的性質正態曲線的性質()曲線在曲線在x軸的上方,與軸的上方,與x軸不相交;軸不相交;()曲線關于直線曲線關于直線x=對稱;對稱;ba正態分布正態分布01()曲線在)曲線在x=時位于最高點;時位于最高點;()當)當x時時,曲線下降曲線下降,并且當曲線向左、右兩邊無限延并且當曲線向左、右兩邊無限延伸時伸時,以以x軸為漸近

13、線向它無限靠近;軸為漸近線向它無限靠近;()當)當一定時,曲線的形狀由一定時,曲線的形狀由確定,確定,越大,曲線越越大,曲線越“矮胖矮胖”,表示總體的分布,表示總體的分布越分散;越分散;越小,曲線越越小,曲線越“瘦高瘦高”,表示總,表示總體的分布越集中體的分布越集中.(4)若若N(,2),則則E=,D=2.(5)若若XN(,2),則則P(-X+i)=0.6826,P(-2X+2)=0.9544,P(-3X+3)=0.9974.(6)通常認為服從正態分布通常認為服從正態分布N(,2)的隨機的隨機變量變量X只取只取 ,并并簡稱之為簡稱之為3原則原則.(-3,+3)之間的值之間的值1111例例1 在

14、我國東南沿海有在我國東南沿海有60個人均個人均GDP在在3萬萬元以上的城市,其中人均元以上的城市,其中人均GDP在在34萬元之萬元之間的有間的有36個,在個,在45萬元之間的有萬元之間的有18個,在個,在5萬元以上的有萬元以上的有6個個.國家環保總局欲用分層抽國家環保總局欲用分層抽樣從中隨機抽取部分城市進行環境調查,若樣從中隨機抽取部分城市進行環境調查,若抽取的人均抽取的人均GDP在在45萬元之間的城市個數萬元之間的城市個數為為3,則抽取的人均,則抽取的人均GDP在在34萬元之間的萬元之間的城市個數為城市個數為. 根據分層抽樣的特征,在各層抽根據分層抽樣的特征,在各層抽取的比例是相同的,故可先

15、依據已知求取的比例是相同的,故可先依據已知求出這個比例,再求解出這個比例,再求解. 抽取的人均抽取的人均GDP在在45萬元之間的萬元之間的城市的比例為城市的比例為 ,故抽取的人均,故抽取的人均GDP在在34萬元之間的城市的比例也是萬元之間的城市的比例也是 ,則抽,則抽取的城市個數為取的城市個數為36 .318318318 分層抽樣在各層抽取樣本的比例是相分層抽樣在各層抽取樣本的比例是相等的等的,這是解決分層抽樣計算問題的主要依據這是解決分層抽樣計算問題的主要依據.例例2 某 批 材 料 的 強 度某 批 材 料 的 強 度 服 從 正 態 分 布服 從 正 態 分 布N(200,182),任取

16、一件這種材料,強度在,任取一件這種材料,強度在164236的概率是多少?的概率是多少? 依題意,得依題意,得=200,=18.則則P(164236)=P(200-218200+218)P(-2+2)=0.9544.故任取一件材料故任取一件材料,其強度在其強度在164236的概率是的概率是0.9544. 求此概率問題需化為服從正態分布求此概率問題需化為服從正態分布的隨機變量的幾種特殊值的概率形式的隨機變量的幾種特殊值的概率形式. 設在一次數學考試中,某班學設在一次數學考試中,某班學生的分數服從生的分數服從N(110,202),且已知,且已知滿分為滿分為150分,這個班的學生共分,這個班的學生共5

17、0人,人,求這個班在這次考試中不小于求這個班在這次考試中不小于90分的分的人數和超過人數和超過130分以上的人數分以上的人數. 因為因為N(110,202),則則=110,=20,P(110-20130)=12(1-0.6826)=0.1587.P(90)=0.6826+0.1587=0.8413.故不小于故不小于90分的人數為分的人數為500.841342(人人).超過超過130分以上的人數為分以上的人數為500.15878(人人). 求此概率需將問題化為正態隨機變求此概率需將問題化為正態隨機變量的幾種特殊值的概率形式,然后利用量的幾種特殊值的概率形式,然后利用對稱性求解對稱性求解.例例3

18、在生產過程中,測得纖維產品的纖度在生產過程中,測得纖維產品的纖度(表示纖維粗細的一種量表示纖維粗細的一種量)共有共有100個數據,個數據,數據分組如下表數據分組如下表分組1.30,1.34)1.34,1.38)1.38,1.42)1.42,1.46)1.46,1.50)1.50,1.54)合計頻數4253029102100(1)完成頻率分布表,并在給定的坐標系完成頻率分布表,并在給定的坐標系中畫出頻率分布直方圖;中畫出頻率分布直方圖;分組頻數頻率1.30,1.34)41.34,1.38)251.38,1.42)301.42,1.46)291.46,1.50)101.50,1.54)2合計100

19、(2)估計纖度落在估計纖度落在1.38,1.50)中的概中的概率及纖度小于率及纖度小于1.40的概率是多少?的概率是多少?(3)統計方法中,同一組數據常用該統計方法中,同一組數據常用該組區間的中點值(例如區間組區間的中點值(例如區間1.30,1.34)的中點值是的中點值是1.32)作為代表)作為代表.據此,估計據此,估計纖度的期望纖度的期望.分組頻數頻率1.30,1.34)40.041.34,1.38)250.251.38,1.42)300.31.42,1.46)290.291.46,1.50)100.101.50,1.54)20.02合計1001.00(1)頻率分布表為:頻率分布表為:(2)

20、纖度落在纖度落在1.38,1.50)中的概率約)中的概率約為為0.30+0.29+0.100.69,纖度小于,纖度小于1.40的概率約為的概率約為0.04+0.25+120.300.44.( 3 ) 總 體 數 據 的 期 望 約 為總 體 數 據 的 期 望 約 為1.320.04+1.360.25+1.400.30+1.440.29+1.480.10+1.520.02=1.4088. 1.解答本題時,第解答本題時,第(1)問首先需計問首先需計算出每組的頻率(利用頻數算出每組的頻率(利用頻數100);第);第(2)問注意問注意1.38,1.42)中既有小于中既有小于1.40,又,又有大于有大

21、于1.40的,可以認為各一半;第的,可以認為各一半;第(3)問先計算出中點的概率,然后根據期望問先計算出中點的概率,然后根據期望的定義求解的定義求解. 2.本題主要考查頻率分布直方圖、本題主要考查頻率分布直方圖、頻率、期望等概念和用樣本頻率估計整頻率、期望等概念和用樣本頻率估計整體分布的統計方法,考查運用概率、統體分布的統計方法,考查運用概率、統計知識解決實際問題的能力計知識解決實際問題的能力.例例3 對甲、乙兩名自行車賽手在相同條件下進對甲、乙兩名自行車賽手在相同條件下進行了行了6次測試,測得他們的最大速度次測試,測得他們的最大速度(m/s)的數據的數據如下表:如下表:(1)畫出莖葉圖畫出莖

22、葉圖,由莖葉圖你能獲得哪些信息由莖葉圖你能獲得哪些信息?(2)分別求出甲、乙兩名自行車賽手最大速分別求出甲、乙兩名自行車賽手最大速度度(m/s)數據的平均數、中位數、標準差,并判數據的平均數、中位數、標準差,并判斷選誰參加比賽更合適斷選誰參加比賽更合適.甲273830373531乙332938342836 (1)畫莖葉圖畫莖葉圖,中間數為數據的十位數字中間數為數據的十位數字: 從這個莖葉圖上可以看出從這個莖葉圖上可以看出,甲、乙的最甲、乙的最大速度情況都是分布均勻的大速度情況都是分布均勻的,只是乙更好一只是乙更好一些些;乙的中位數是乙的中位數是33.5,甲的中位數是甲的中位數是33.因因此此,

23、乙發揮比較穩定乙發揮比較穩定,總體情況比甲好總體情況比甲好.(2) =33, =33;s甲甲=3.96,s乙乙=3.56;甲的中位數是甲的中位數是33,乙的中位數是,乙的中位數是33.5.綜合比較,選乙參加比賽較為合適綜合比較,選乙參加比賽較為合適.x甲x乙 在某籃球比賽中,根據甲和乙兩人的得分在某籃球比賽中,根據甲和乙兩人的得分情況得到如圖所示的莖葉圖情況得到如圖所示的莖葉圖. (1)從莖葉圖的特征來說明他們誰發揮得更穩定從莖葉圖的特征來說明他們誰發揮得更穩定; (2)用樣本的數字特征驗證他們誰發揮得更好用樣本的數字特征驗證他們誰發揮得更好. 莖葉圖的直觀形狀像橫放的頻莖葉圖的直觀形狀像橫放

24、的頻率分布直方圖,且保留了所有原始數率分布直方圖,且保留了所有原始數據的信息,所以從數與形的特征來看,據的信息,所以從數與形的特征來看,甲和乙的得分都是對稱的,葉的分布甲和乙的得分都是對稱的,葉的分布是是“單峰單峰”的,但甲全部的葉都集中的,但甲全部的葉都集中在莖在莖2上,而乙只有上,而乙只有57的葉集中在莖的葉集中在莖2上,這說明甲發揮得更穩定上,這說明甲發揮得更穩定.(2) = =25, = =25, = (20-25)2+(21-25)2+(25-25)2+(26-25)2+(27-25)2+(28-25)2+(28-25)29.14, = (17-25)2+(23-25)2+(24-2

25、5)2+(25-25)2+(26-25)2+(29-25)2+(31-25)217.43.因為因為 = , ,所以甲發揮得更好所以甲發揮得更好.x甲x乙2021252627282871723242526293172s甲2s乙1717x甲x乙2s甲2s乙1.統計的基本思想方法是用樣本估計總統計的基本思想方法是用樣本估計總體,即用局部推斷整體,這就要求樣本應具體,即用局部推斷整體,這就要求樣本應具有很好的代表性,而樣本良好客觀的代表性,有很好的代表性,而樣本良好客觀的代表性,完全依賴抽樣方法,弄清簡單隨機抽樣和分完全依賴抽樣方法,弄清簡單隨機抽樣和分層抽樣的客觀合理性,從而會在不同的情況層抽樣的客

26、觀合理性,從而會在不同的情況下采用適當的抽樣方法下采用適當的抽樣方法.掌握三種抽樣方法掌握三種抽樣方法的抽樣步驟的抽樣步驟.三種抽樣方法的比較:三種抽樣方法的比較:類別共同點各自特點相互聯系適用范圍簡單隨機抽樣抽樣過程中每個個體被抽取的概率是相等的;均屬于不放回抽樣從總體中逐個抽取最基本的抽樣方法總體中的個體數較少分層抽樣將總體分成幾層進行抽取各層抽樣時采用簡單隨機抽樣總體由差異明顯的幾部分組成系統抽樣將總體均分成幾部分,按事先確定的規則在各部分抽取在起始部分抽樣時采用簡單隨機抽樣總體中的個體數較多2.頻率分布直方圖會使樣本的一些數字頻率分布直方圖會使樣本的一些數字特征更明顯特征更明顯,繪制頻率分布直方圖時繪制頻率分布直方圖時,要合理分要合理分組組,以便使數據中的特征能更好地反映出來以便使數據中的特征能更好地反映出來.總體分布估計中總體分布估計中,(1)先確定分組的組數先確定分組的組數,其其方法是:最大數據與最小數據之差除組距得方法是:最大數據與最小數據之差除組距得組數組數.(2)計算每組中的頻數及頻率,其中頻率計算每組中的頻數及頻率,其中頻率= .(3)畫出直方圖畫出直方圖.3.畫莖葉圖的步驟如下:畫莖葉圖的步驟如下:(1)將每個數據分為莖將每個數據分為莖(高位高位)和葉和葉(低位低位)兩兩部分部分;頻數總數

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論