




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
「‘第㈡章統計
DIERZHANG2.2用樣本估計總體
2.2.1用樣本的頻率分布估計總體分布
卜課前自主預習
一、用樣本估計總體的兩種情況
通過隨機抽樣抽取到具有代表性的樣本,對樣本數據進行列表,制圖、計算
分析,從數據中找到它所包含的信息和規律,然后對總體作出估計.估計一般分
為兩種:畫樣本的頻率分布估計總體的分布:畫樣本的數字特征(如平均數、
標準差等)估計總體的數字特征.
1.頻率分布直方圖
在頻率分布直方圖中,縱軸表示畫_頻率/組距,數據落在各小組內的頻率用
回錯曙誓來表示,各小長方形的面積的總和等于畫1.
2.頻率分布折線圖和總體密度曲線
(1)頻率分布折線圖
連接頻率分布直方圖中各小長方形畫上端的中點,就得到了頻率分布折線
圖.
(2)總體密度曲線
隨著樣本容量的增加,作圖時所分的叵[組數增加,組距減小,相應的頻率
折線圖就會越來越接近于一條國光滑曲線,統計中稱之為總體密度曲線,它反
映了凰總體在各個范圍內取值的百分比.
二、莖葉圖
1.莖葉圖的適用范圍
當樣本數據較少時,用莖葉圖表示數據的效果較好.
2.莖葉圖的優點
它不但可以回保留所有信息,而且可以四隨時記錄,給數據的畫記錄
和國表示都能帶來方便.
3.莖葉圖的缺點
當叵[樣本數據較多時,枝葉就會很長,莖葉圖就顯得不太方便.
O自診小測
1.判一判(正確的打“J”,錯誤的打“X”)
(1)頻率分布直方圖的縱軸表示頻率.()
(2)頻率分布折線圖是總體密度曲線的特殊情形.()
(3)莖葉圖不能表示一位數.()
答案(1)X(2)V(3)X
2.做一做
(1)下列關于莖葉圖的敘述正確的是()
A.將數組的數按位數進行比較,將數大小基本不變或變化不大的位作為一
個主桿(莖),將變化大的位的數作為分枝(葉),列在主桿的后面
B.莖葉圖只可以分析單組數據,不能對兩組數據進行比較
C.莖葉圖更不能表示三位數以上的數據
D.畫圖時莖要按照從小到大的順序從下向上列出,共莖的葉可隨意同行列
出
答案A
解析由莖葉圖的概念易知選A.
(2)將容量為100的樣本數據分為8個組,如下表:
組號12345678
頻數1013X141513129
則第3組的頻率為()
A.0.03B.0.07C.0.14D.0.21
答案C
解析由題意得尤=100—(10+13+14+15+13+12+9)=14,所以第3組
14
的頻率為血=0.14.
(3)(教材改編P70例題)如圖是甲、乙兩名籃球運動員某賽季一些場次得分的
莖葉圖,據圖可知()
甲乙
08
1247
322199
8754336
9444
52
A.甲運動員的成績好于乙運動員
B.乙運動員的成績好于甲運動員
C.甲、乙兩名運動員的成績沒有明顯的差異
D.甲運動員的最低得分為。分
答案A
解析由莖葉圖可以看出甲的成績都集中在30?50分,且高分較多.而乙
的成績只有一個高分52分,其他成績比較低,故甲運動員的成績好于乙運動員
的成績.
(4)為了了解一片經濟林的生長情況,隨機抽測了其中60株樹木的底部周長
(單位:cm),所得數據均在區間[80,130]上,其頻率分布直方圖如圖所示,則在抽
測的60株樹木中,有株樹木的底部周長小于100cm.
答案24
角翠析60X(0.015+0.025)X10=24.
卜課堂互動探究
探究1列頻率分布表、畫頻率分布直方圖及折線圖
例1為了了解某中學高二女生的身高情況,該校對高二女生的身高(單位:
cm)進行了一次隨機抽樣測量,所得數據整理后列出了頻率分布表如下:
分組頻數頻率
[150.5,154.5)10.02
[154.5,158.5)40.08
[158.5,162.5)200.40
[162.5,166.5)150.30
[166.5,170.5)80.16
[170.5,174.5]mn
合計MN
(1)表中n,M,N所表示的數分別是多少?
(2)繪制頻率分布折線圖;
(3)估計該校女生身高小于162.5cm的百分比.
[解](1)由于頻率和為1,所以N=l,所以九=1一(0.02+0.08+為40+0.30
+0.16)=0.04,所以加=焉=50,加=50—(1+4+20+15+8)=2,故有加=2,
〃=0.04,M=50,N=1.00.
(2)頻率分布折線圖如圖中的折線:
(3)該校女生身高小于162.5cm的百分比為(0.02+0.08+0.4)X100%=50%.
拓展提升
繪制頻率分布直方圖的注意事項
(1)計算極差,需要找出這組數的最大值和最小值,當數據很多時,可選一個
數當參照.
(2)將一批數據分組,目的是要描述數據分布規律,要根據數據多少來確定分
組數目,一般來說,數據越多,分組越多.
(3)將數據分組,決定分點時,一般使分點比數據多一位小數,并且把第一組
的起點稍微減小一點.
(4)列頻率分布表時,可通過逐一判斷各個數據落在哪個小組內,以“正”字
確定各個小組內數據的個數.
(5)畫頻率分布直方圖時,縱坐標表示頻率與組距的比值,一定不能標成頻率.
【跟蹤訓練1]美國歷屆總統中,就任時年齡最小的是羅斯福,他于1901
年就任,當時年僅42歲;就任時年齡最大的是特朗普,他于2016年就任,當時
70歲.下面按時間順序(從1789年的華盛頓到2016年的特朗普,共45任)給出
了歷屆美國總統就任時的年齡:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,
52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,
54,51,60,62,43,55,56,61,52,69,64,46,54,47,70.
(1)將數據分為7組,列出頻率分布表,并畫出相應的頻率分布直方圖和頻率
分布折線圖;
(2)用自己的語言描述一下歷屆美國總統就任時年齡的分布情況.
解(1)以4為組距,列頻率分布表如下:
分組頻數頻率
[42,46)20.0444
[46,50)70.1555
[50,54)80.1778
[54,58)160.3556
[58,62)50.1111
[62,66)40.0889
[66,70]30.0667
合計451.0000
畫出相應的頻率分布直方圖和頻率分布折線圖,如圖所示.
(2)從頻率分布表中可以看出,將近60%的美國總統就任時的年齡在50歲至
60歲之間,45歲及45歲以下和65歲以上就任的總統所占的比例相對較小.
探究2頻率分布直方圖的應用
例2為了迎接某市作為全國文明城市的復查,愛衛會隨機抽取了60位路
人進行問卷調查,調查項目是自己對該市各方面衛生情況的滿意度(假設被問卷
的路人回答是客觀的),以分數表示問卷結果,并統計他們的問卷分數,把其中不
低于50分的分成五段:[50,60),[60,70),…,[90,100]后畫出如圖所示的部分頻
率分布直方圖,觀察圖形信息,回答下列問題:
頻率/組距
0.030
0.025
0.020
0.015
0.010
0.005
5060708090100成績/分
⑴求出問卷調查分數低于50分的被問卷人數;
⑵估計全市市民滿意度在60分及以上的百分比.
[解](1)因為各組的頻率和等于1,
故低于50分的頻率為
f=1-(0.015X2+0.030+0.025+0.005)X10=0.1,故低于50分的人數為
60X0.1=6.
(2)依題意,60分及以上的頻率和為
(0.015+0.030+0.025+0.005)X10=0.75,
所以抽樣滿意度在60分及以上的百分比為75%.
于是,可以估計全市市民滿意度在60分及以上的百分比為75%.
拓展提升
頻率分布直方圖的應用
頻率分布指的是一個樣本數據在各個小范圍內所占比例的大小,一般用頻率
分布直方圖反映樣本的頻率分布,其中:
頻率
(1)頻率分布直方圖中縱軸表示篇;
(2)頻率分布直方圖中,各個小長方形的面積等于頻率,各個小長方形的面積
之和為1;
(3)長方形的高的比也就是頻率之比.
【跟蹤訓練2】從某小學隨機抽取100名同學,將他們的身高(單位:厘米)
數據繪制成頻率分布直方圖(如圖所示),由圖中數據可知a=.若要從身
高在[120,130),[130,140),[140,150]三組內的學生中,用分層抽樣的方法選取18
人參加一項活動,則從身高在口40,150]內的學生中選取的人數應為.
頻率/組距
0.010
0.005
100110120130140150身高/厘米
答案0.0303
解析因為頻率分布直方圖中各小長方形的面積之和為1,所以10X(0.005
+0.035+a+0.020+0.010)=1,解得°=0.030.由圖可知身高在[120,150]內的學
生人數為100X10X(0.030+0.020+0.010)=60,其中身高在[140,150]內的學生人
1Q
數為10,所以從身高在[140,150]內的學生中選取的人數為而X10=3.
探究3莖葉圖的繪制及應用
例3某中學甲、乙兩名同學最近幾次的數學考試成績情況如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
畫出兩人數學成績的莖葉圖,并根據莖葉圖對兩人的成績進行比較.
甲乙
56
65179
9818368
5493889
71013
0114
[解]甲、乙兩人數學成績的莖葉圖如圖所示.從這個莖葉圖上可以看出,
乙同學的得分情況是大致對稱的,中位數是98分;甲同學的得分情況除一個特
殊得分外,也大致對稱,但分數分布相對于乙來說,趨向于低分階段.因此乙同
學總體得分情況比甲同學好.
拓展提升
(1)畫莖葉圖時,用中間的數表示數據的十位和百位數,兩邊的數分別表示兩
組數據的個位數.要先確定中間的數取數據的哪幾位,填寫數據時邊讀邊填.比
較數據時從數據分布的對稱性、中位數、穩定性等幾方面來比較.
(2)繪制莖葉圖的關鍵是分清莖和葉,一般地說數據是兩位數時,十位數字為
“莖”,個位數字為“葉”;如果是小數的,通常把整數部分作為“莖”,小數
部分作為“葉”,解題時要根據數據的特點合理選擇莖和葉.
【跟蹤訓練3】為了比較兩種治療失眠癥的藥(分別稱為A藥,B藥)的療
效,隨機地選取20位患者服用A藥,20位患者服用B藥,這40位患者在服用
一段時間后,記錄他們日平均增加的睡眠時間(單位:h).試驗的觀測結果如下:
服用A藥的20位患者日平均增加的睡眠時間:
0.61.22.71.52.81.82.22.33.23.5
2.52.61.22.71.52.93.03.12.32.4
服用B藥的20位患者日平均增加的睡眠時間:
3.21.71.90.80.92.41.22.61.31.4
1.60.51.80.62.11.12.51.22.70.5
根據兩組數據完成如圖所示的莖葉圖,從莖葉圖看,哪種藥的療效更好?
解由觀測結果可繪制莖葉圖如圖所示.
A藥_____________B藥
-60755689~~
85522I.122346789
98776543322.14567
52103.2
從以上莖葉圖可以看出,A藥療效的試驗結果有方7的葉集中在莖2,3上,而
7
B藥療效的試驗結果有方的葉集中在莖0,1上,由此可看出A藥的療效更好.
r---------------------------1涕:黜加----------------------
1.頻率分布直方圖的繪制與特征
(1)頻率分布直方圖的繪制
①將數據分組時,組數應力求合適,使數據的分布規律能較清楚地呈現出
來.一般樣本容量越大,所分組數越多,為方便起見,組距的選擇力求“取
整”,當樣本容量不超過120時,按照數據的多少,通常分成5?12組.若
極差斗超蛇“極差如必甘極差丁爪蜘如nJ極差L㈤物、、
藥而為整數,則n回而=組數,右西施不為整數,則醫施J+l=組數.(汪:r㈤
表示不大于X的最大整數)
②頻率分布直方圖中,橫軸表示樣本數據,縱軸表示頻率/組距,在橫軸上
以數據分組的兩個端點所組成的線段為底,在縱軸上以頻率/組距為高作小長方
形.
(2)頻率分布直方圖的特征
①頻率分布表中的數字和頻率分布直方圖的形狀都與分組數(組距)有
關.頻率分布直方圖的外觀和坐標系的單位長度有關.
②頻率分布表和頻率分布直方圖由樣本決定,因此它們會隨著樣本的改變
而改變.
③頻率分布直方圖直觀、形象地反映了樣本的分布規律.但是從頻率分布
直方圖中得不出原始的數據內容.把數據繪制成頻率分布直方圖后,原有的具
體數據信息就被抹掉了.
2.頻率分布折線圖和總體密度曲線的特征
頻率分布折線圖反映了數據的變化趨勢.總體密度曲線能夠精確地反映總
體在各個范圍內取值的百分比,能給我們提供更加精細的信息.
3.莖葉圖的制作及特征
(1)莖葉圖的制作
莖是指中間的一列數,葉就是從莖的旁邊生長出來的數,莖葉圖通常用來
記錄兩位數的數據,其可用來分析單組數據,也可對兩組數據進行比較.
(2)莖葉圖的特征
莖葉圖能夠保留原始數據,并且展示數據的分布情況,便于記錄與讀取,
但當樣本數據較多或數據位數較多時,莖葉圖就顯得不太方便.
卜隨堂達標白測
1.下列關于樣本頻率分布折線圖與總體密度曲線的關系的說法中,正確的
是()
A.頻率分布折線圖與總體密度曲線無關
B.頻率分布折線圖就是總體密度曲線
C.樣本容量很大的頻率分布折線圖就是總體密度曲線
D.如果樣本容量無限增大,分組的組距無限減小,那么頻率分布折線圖就
會無限接近于總體密度曲線
答案D
解析
選項正誤理由
當總體個數較多時,隨著樣本容量的增加,組數增加,組距減
AX
小,頻率分布折線圖趨向于總體密度曲線,所以兩者有關
BX只有當樣本容量很大時,頻率分布折線圖趨向于總體密度曲線
總體密度曲線是由頻率分布折線圖估計的,樣本容量越大就越準
CX
確
頻率分布折線圖在樣本容量無限增大,分組的組距無限減小的情
DV
況下會無限接近于一條光滑曲線,這條光滑曲線就是總體密度曲
2.為了研究某藥品的療效,選取若干名志愿者進行臨床試驗,所有志愿者
的舒張壓數據(單位:kPa)的分組區間為[12,13),[13,14),[14,15),[15,16),[16,17],
將其按從左到右的順序分別編號為第一組,第二組,…,第五組,如圖是根據試
驗數據制成的頻率分布直方圖.已知第一組與第二組共有20人,第三組中沒有
療效的有6人,則第三組中有療效的人數為()
頻率/組距
0.24
0.16
0.08
121314151617舒張壓/kPa
A.6B.8C.12D.18
答案C
20
解析志愿者的總人數為iQvi=50,
(U.24十U.16)X1
所以第三組人數為50X0.36X1=18,
所以有療效的人數為18-6=12.
3.一個頻率分布表(樣本容量為30)不小心被損壞了一部分,只記得樣本中
數據在[20,60)內的頻率為0.8,則估計樣本在[40,50),[50,60)內的數據個數共為
()
分組[10,20)
A.14B.15C.16D.17
答案B
解析I,樣本中數據在[20,60)內的頻率為0.8,
二樣本數據在[20,60)內的頻數為30X0.8=24,
二樣本在[40,50),[50,60)內的數據個數共為24-4-5=15.
4.下圖是12名同學某次測驗的分數的莖葉圖,由此可知,這些分數中最低
分與最高分之和為.
53
628
75577
83345
94
答案147
解析最低分為53分,最高分為94分,它們之和為147分.
5.從高三參加數學競賽的學生中抽取50名學生的成績,成績的分組及各組
的頻數如下(單位:分):
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],
8.
(1)列出樣本的頻率分布表;
(2)畫出頻率分布直方圖和頻率分布折線圖;
(3)估計成績在[60,90)分的學生比例;
(4)估計成績在80分以下的學生比例.
解(1)頻率分布表如下:
Z
成績分組頻數頻率
[40,50)20.04
[50,60)30.06
[60,70)100.2
[70,801150.3
[80,90)120.24
[90,100]80.16
合計501
(2)頻率分布直方圖和折線圖如圖所示.
(3)樣本中所求學生的比例為0.20+0.30+0.24=0.74=74%.
由樣本估計總體,成績在[60,90)分的學生約占74%.
(4)所求學生的比例為1—(0.24+0.16)=1—0.4=0.6=60%.由樣本估計總體,
成績在80分以下的學生約占60%.
卜課后課時精練
A級:基礎鞏固練
一、選擇題
1.為了解某地區高一學生的身體發育情況,抽查了該地區100名年齡為
17.5?18歲的男生體重(kg),得到頻率分布直方圖(如圖所示).
可得這100名學生中體重在[56.5,64.5)的學生人數是()
A.20B.30C.40D.50
答案C
解析由頻率分布直方圖易得到體重在[56.5,64.5)的學生的頻率為(0.03+
0.05+0.05+0.07)X2=0.4,那么學生的人數為100X0.4=40.故選C.
2.下列關于莖葉圖的敘述正確的是()
A.莖葉圖可以展示未分組的原始數據,它與頻率分布表以及頻率分布直方
圖的處理方式不同
B.對于重復的數據,只算一個
C.莖葉圖中的葉是“莖”十進制的上一級單位
D.制作莖葉圖的程序是:第一步:畫出莖;第二步:畫出葉;第三步:將
“葉子”任意排列
答案A
解析由莖葉圖的概念知A正確,故選A.
3.對某種燈泡隨機地抽取200個樣品進行使用壽命調查,結果如下:
壽命(天)頻數頻率
[100,200)200.10
[200,300)30y
[300,400)700.35
[400,500)X0.15
[500,600]500.25
合計2001
規定:使用壽命大于或等于500天的燈泡是優等品,小于300天是次品,其
余的是正品.現從燈泡樣品中隨機地抽取〃(〃dN*)個,若這〃個燈泡的等級分布
情況恰好與從這200個樣品中按三個等級分層抽樣所得的結果相同,則n的最小
值為()
A.2B.3C.4D.5
答案C
解析由頻率分布表,得x=200X0.15=30.
燈泡樣品中優等品有50個,正品有100個,次品有50個,
,優等品、正品、次品的比為50:100:50=1:2:1.
二按分層抽樣方法,隨機地抽取燈泡的個數n=k+2k+k=4k(k^^)
:.n的最小值為4.故選C.
4.如圖是總體密度曲線,下列說法正確的是()
A.組距越大,頻率分布折線圖越接近于它
B.樣本容量越小,頻率分布折線圖越接近于它
C.陰影部分的面積代表總體在(a,份內取值的百分比
D.陰影部分的平均高度代表總體在(a,勿內取值的百分比
答案C
解析總體密度曲線與頻率分布折線圖關系如下:當樣本容量越大,組距越
小時,頻率分布折線圖越接近于總體密度曲線,但它永遠達不到總體密度曲線,
在總體密度曲線中,陰影部分的面積代表總體在3,份內取值的百分比,因而選
C.
5.某教育機構隨機抽查某校20個班級,調查各班關注“漢字聽寫大賽”的
學生人數,根據所得數據的莖葉圖,以5為組距將數據分組成[0,5),[5,10),[10,15),
[15,20),[20,25),[25,30),[30,35),[35,40]時,所作的頻率分布直方圖如圖所示,
則原始的莖葉圖可能是()
()74076
17644101765440
2755421027554210
395320395320
AB
()74074
17744401764440
2755521028764210
395320395520
CD
答案A
解析由頻率分布直方圖知,各組頻數統計如下表:
分組[0,5)[5,10)[10,15)[15,20)[20,25)[25,30)[30,35)[35,40]
頻數11424332
結合各選項莖葉圖中的數據可知選項A正確.
二'填空題
6.某地為了了解該地區10000戶家庭的用電情況,采用分層抽樣的方法抽
取了500戶家庭的月平均用電量,并根據這500戶家庭的月平均用電量畫出頻率
分布直方圖如圖所示,則該地區10000戶家庭中月平均用電度數在[70,80)的家庭
有戶.
答案1200
解析根據頻率分布直方圖得該地區10000戶家庭中月平均用電度數在
[70,80)的家庭有10000X0.012X10=l200(戶).
7.如圖是某學校抽取的〃個學生體重的頻率分布直方圖,已知圖中從左到
右的前3個小組的頻率之比為1:2:3,第3小組的頻數為18,則n的值是
答案48
解析根據頻率分布直方圖得,從左到右的前3個小組的頻率和為1—
(0.0375+0.0125)X5=0.75.
又?.?前三組頻率之比為1:2:3,
3
.?.第3小組的頻率為]+2+3*0.75=0.375.
又:第3小組對應的頻數為18,
1Q
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國帶底盆磨砂花盆行業市場發展前景及發展趨勢與投資戰略研究報告(2024-2030)
- 工業區污水處理廠工程可行性研究報告
- 遼寧省文化和旅游廳事業單位真題2024
- 2024年襄陽汽車職業技術學院輔導員考試真題
- 2024年麗水市青田縣招聘專職社區工作者筆試真題
- 2024年巴州招聘中小學教師考試真題
- 雞蛋冷鏈物流項目資金申請報告x
- 2024-2030年中國清潔電器軟管行業發展潛力預測及投資戰略研究報告
- 2024-2030全球瑞士型數控自動車床行業調研及趨勢分析報告
- 中國儲能EPC行業調查報告
- 2023-2024學年廣西壯族自治區桂林市物理八下期末考試試題及答案解析
- (高清版)JTGT 3365-02-2020 公路涵洞設計規范
- 2024春期國開本科《混凝土結構設計原理》形考作業1至4試題及答案
- 融資租賃租金及IRR收益測算表
- 電大財務大數據分析編程作業2
- 很完整半導體制造工藝流程
- 建筑結構荷載規范DBJ-T 15-101-2022
- 通信線路工程(第二版)第8章通信線路工程施工安全
- 腸外營養制劑講解
- 如何在求職過程中實現時間管理
- 船舶管理臺賬全套表格模板
評論
0/150
提交評論