




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第2講統計與統計案例
考綱展示命題探究
1抽樣方法
⑴簡單隨機抽樣的概念
設一個總體含有N個個體,從中逐個不放回地抽取個個
體作為樣本,如果每次抽取時總體內的各個個體被抽到的機會都相
笠,就把這種抽樣方法叫做簡單隨機抽樣.
(2)特點與方法
(3)系統抽樣的概念
當總體中的個體數較多時,可將總體分成均衡的幾個部分,然后
按照預先定出的規則,從每一部分抽取一個個體,得到所需要的樣本,
這種抽樣方法叫做系統抽樣(也稱為機械抽樣或等距抽樣).
(4)系統抽樣的特點
①適用于元素個數很多旦均衡的總體.
②各個個體被抽到的機會均等.
③總體分組后,在起始部分采用的是簡單隨機抽樣.
④如果總體容量N能被樣本容量n整除,則抽樣間隔為
如果總體容量N不能被樣本容量〃整除,可隨機地從總體中剔除余
數,然后再按系統抽樣的方法抽樣.
(5)分層抽樣的概念
在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從
各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣
本,這種抽樣方法就叫做分層抽樣.
(6)分層抽樣的步驟
①分層:按某種特征將總體分成若干部分.
②按比例確定每層抽取個體的個數.
③各層分別按簡單隨機抽樣或系統抽樣的方法抽取個體.
④綜合每層抽樣,組成樣本.
2用樣本估計總體
(1)頻率分布表與頻率分布直方圖
頻率分布表與頻率分布直方圖的繪制步驟如下:
①求極差,即求一組數據中最大值與最小值的差.
②決定組距與組數.
③將數據分組.
④列頻率分布表.落在各小組內的數據的個數叫做頻數,每小組
的頻數與數據總數的比值叫做這一小組的頻率.計算各小組的頻率,
列出頻率分布表.
⑤畫頻率分布直方圖.依據頻率分布表畫頻率分布直方圖,其中
縱坐標(小長方形的高)表示頻率與組距的比值,其相應組距上的頻率
頻率
等于該組上的小長方形的面積,即每個小長方形的面積=組距X
=頻率.
這樣,頻率分布直方圖就以面積的形式反映了數據落在各個小組
的頻率的大小,各個小長方形面積的總和等于1.
(2)頻率分布折線圖和總體密度曲線
①頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中
臣,就得到頻率分布折線圖.
②總體密度曲線:隨著樣本容量的增加,作頻率分布直方圖時所
分的組數也在增加,相應的頻率分布折線圖會越來越接近于一條光滑
曲線,統計中稱這條光滑曲線為總體密度曲線.
(3)莖葉圖
莖葉圖是統計中用來表示數據的一種圖,莖是指中間的一列數,
葉就是從莖的旁邊生長出來的數.
對于樣本數據較少,且分布較為集中的一組數據:若數據是兩位
整數,則將十位數字作莖,個位數字作葉;若數據是三位整數,則將
百位、十位數字作莖,個位數字作葉.樣本數據為小數時做類似處理.
對于樣本數據較少,且分布較為集中的兩組數據,關鍵是找到兩
組數據共有的莖.
(4)眾數、中位數、平均數
定義特點
體現了樣本數據的最大集中
在一組數據中出現次數最多
眾數點,不受極端值的影響,而且
的數據
不唯一
將一組數據按大小順序依次
中位數不受極端值的影響,僅
中位排列,處在最空間位置的一個
利用了排在中間數據的信息,
數數據(或最中間兩個數據的平
只有一個
均數)
平均與每一個樣本數據有關,只有
樣本數據的算術平均數
數一個
(5)極差、標準差與方差
定義特點
反映一組數據的波動
情況,一般情況下,
極差大,則數據波動
極差一組數據中最大值與最小值的差性大;極差小,則數
據波動性小,但極差
只考慮兩個極端值,
可靠性較差
反映了各個樣本數據
聚集于樣本平均數周
圍的程度.標準差越
小,表明各個樣本數
標準差是樣本數據到平均數的一種平均
標準差據在樣本平均數周圍
距離,即5=
越集中;標準差越大,
表明各個樣本數據在
樣本平均數的兩邊越
分散
同標準差一樣用來衡
標準差的平方,即心=
量樣本數據的離散程
方差1————
22度,但是平方后夸大
-1(X|—九)+(X2-X---X)]
了偏差程度
M注意點眾數、平均數、中位數的關系
(1)眾數、中位數與平均數都是描述一組數據集中趨勢的量,平
均數是最重要的量.
(2)平均數反映的是樣本個體的平均水平,眾數和中位數貝,]反映
樣本中個體的“重心”.
(3)實際問題中求得的平均數、眾數和中位數應帶上單位.
1.思維辨析
(1)系統抽樣在第1段抽樣時采用簡單隨機抽樣.()
(2)若為了適合分段或分層而剔除幾個個體后再抽樣,則對剔除
的個體來說是不公平的.()
(3)一組數據的平均數一定大于這組數據中的每個數據.()
(4)一組數據的方差越大,說明這組數據的波動越大.()
(5)頻率分布直方圖中,小矩形的面積越大,表示樣本數據落在
該區間內的頻率越高.()
(6)莖葉圖中的數據要按從小到大的順序寫,相同的數據可以只
記一次.()
答案(1)7(2)X(3)X(4)V(5)7(6)X
2.如圖是容量為15()的樣本的頻率分布直方圖,則樣本數據落
在[6,10)內的頻數為()
A.12B.48
C.60D.80
答案B
解析XX150=48.
3.為了檢查某超市貨架上的飲料是否含有塑化劑,要從編號依
次為1到50的塑料瓶裝飲料中抽取5瓶進行檢驗,用每部分選取的
號碼間隔一樣的系統抽樣方法確定所選取的5瓶飲料的編號可能是
()
A.5,10,15,20,25B.2,4,8,16,32
C.123,4,5D.7,17,27,37,47
答案D
解析利用系統抽樣,把編號分為5段,每段10個,每段抽取
一個,號碼間隔為10.
>[考法綜述]高考對隨機抽樣的考查常以實際應用為背景考
查樣本的抽取,特別是分層抽樣與系統抽樣的理解與計算.利用樣本
頻率分布估計總體分布是高考熱點,會列頻率分布表,會畫頻率分布
直方圖,小題一般較容易,大題往往結合概率考查,難度中等.
命題法1抽樣方法
典例1(1)已知某單位有40名職工,現要從中抽取5名職工,
將全體職工隨機按1?40編號,并按編號順序平均分成5組.按系統
抽樣方法在各組內抽取一個號碼.若第1組抽出的號碼為2,則所有
被抽出職工的號碼為.
(2)某個年級有男生560人,女生420人,用分層抽樣的方法從
該年級全體學生中抽取一個容量為280的樣本,則此樣本中男生人數
為.
[解析](1)由系統抽樣知識知,第一組1?8號;第二組為9?16
號;第三組為17?24號;第四組為25?32號;第五組為33?40號.
第一組抽出號碼為2,則依次為10,18,26,34.
(2)抽取比例為益著所以樣本中男生人數為
□0U-r4ZUVow/
560Xy=160.
[答案]⑴2,10,18,26,34(2)160
Q[解題法】三種抽樣方法的比較
類別共同點各自特點相互聯系適用范圍
簡單隨機抽樣是不放回從總體中逐個—總體中的個
抽樣,抽樣抽取數較少
過程中,每將總體均分成
個個體被幾部分,按事在起始部分抽
總體中的個
系統抽樣抽到的機先確定的規樣時,采用簡
數比較多
會(概率)相貝IJ,在各部分單隨機抽樣
等抽取
各層抽樣時,
將總體分成幾總體由差異
采用簡單隨機
分層抽樣層,分層進行明顯的幾部
抽樣或者系統
抽取分組成
抽樣
命題法2用樣本估計總體
典例2(1)某校10。名學生期中考試語文成績的頻率分布直方
圖如圖所示,其中成績分組區間是:[50,60),[60,70),[70,80),[80,90),
[90,100].
①求圖中。的值;
②根據頻率分布直方圖,估計這100名學生語文成績的平均分;
③若這100名學生語文成績某些分數段的人數(X)與數學成績相
應分數段的人數。)之比如下表所示,求數學成績在[50,90)之外的人
數.
分數段[50,60)[60,70)[70,80)[80,90)
x*y1:12:13:44:5
(2)為了比較兩種治療失眠癥的藥(分別稱為A藥,B藥)的療效,
隨機地選取20位患者服用A藥,20位患者服用B藥,這40位患者
在服用一段時間后,記錄他們日平均增加的睡眠時間(單位:h).試
驗的觀測結果如下:
服用A藥的20位患者日平均增加的睡眠時間:
服用B藥的20位患者日平均增加的睡眠時間:
①分別計算兩組數據的平均數,從計算結果看,哪種藥的療效更
好?
②根據兩組數據完成下面莖葉圖,從莖葉圖看,哪種藥的療效更
好?
[解](1)①由頻率分布直方圖可知:
(2aX10=l,所以〃
②根據頻率分布直方圖,估計這100名學生語文成績的平均分為
55XXXXX
③根據頻率分布直方圖及表中數據得:
分數段xy
[50,60)55
[60,70)4020
[70,80)3()40
[80,90)2025
???數學成績在[50,90)之外的人數為100—5—20—40—25=10.
(2)①設A藥觀測數據的平均數為x,B藥觀測數據的平均數為
y,
由觀測結果可得
—__i_
X=20
1
}?=20
由以上計算結果可知:尤>),,由此可看出4藥的療效更好.
②由觀測結果可繪制如下莖葉圖:
7
從以上莖葉圖可以看出,A藥療效的試驗結果有總的葉集中在
7
“2二"3.”上,而3藥療效的試驗結果有面的葉集中在“0.”,力.”上,
由此可看出A藥的療效更好.
Q【解題法】用樣本估計總體的解題策略
(1)用樣本估計總體時,樣本的平均數、標淮差只是總體的平均
數、標準差的近似.實際應用中,當所得數據平均數不相等時,需先
分析平均水平,再計算標準差(方差)分析穩定情況.
(2)若給出圖形,一方面可以由圖形得到相應的樣本數據,再計
算平均數、方差(標準差);另一方面,可以從圖形直觀分析樣本數據
的分布情況,大致判斷平均數的范圍,并利用數據的波動性大小反映
方差(標準差)的大小.
1.根據下面給出的2004年至2013年我國二氧化硫年排放量(單
位:萬噸)柱形圖,以下結論中不正確的是()
A.逐年比較,2008年減少二氧化硫排放量的效果最顯著
B.2007年我國治理二氧化硫排放顯現成效
C.2006年以來我國二氧化硫年排放量呈減少趨勢
D.2006年以來我國一氧化硫年排放量與年份正相關
答案D
解析根據柱形圖可觀察兩個變量的相關性,易知A、B、C正
確,2006年以來我國二氧化硫年排放量與年份負相關,選項D錯誤.故
選D.
2.若樣本數據即,應,…,即o的標準差為8,則數據2AR一1,2處
—1,…,2>V[()—1的標準差為()
A.8B.15
C.16D.32
答案C
解析由標準差的性質知,21]—1,2x2—1,…2xio—1的標準差為
2X8=16,故選C.
3.重慶市2013年各月的平均氣溫(C)數據的莖葉圖如下:
則這組數據的中位數是()
A.19B.20
D.23
答案B
解析根據莖葉圖及中位數的概念,由莖葉圖知,該組數據的中
位數為1-=20.故選B.
4.我國古代數學名著《數書九章》有“米谷粒分”題:糧倉開倉
收糧,有人送來米1534石,驗得米內夾谷,抽樣取米一把,數得254
粒內夾谷28粒,則這批米內夾谷約為()
A.134石B.169石
C.338石D.1365石
答案B
解析根據樣本估計總體,可得這批米內夾谷約為急
義1534y169石.故選B.
5.某中學初中部共有110名教師,高中部共有150名教師,其
性別比例如圖所示,則該校女教師的人數為()
A.167B.137
C.123D.93
答案B
解析初中部女教師的人數為110X70%=77,高中部女教師的
人數為150X(1-60%)=60,則該校女教師的人數為77+60=137,
故選B.
6.對一個容量為N的總體抽取容量為〃的樣本,當選取簡單隨
機抽樣、系統抽樣和分層抽樣三種不同方法抽取樣本時,總體中每個
個體被抽中的概率分別為Pl,P2,P3,則()
A.Pl=P2<〃3B.P2=P3Vpi
C.Pl=P3Vp2D?P1=〃2=P3
答案D
解析由隨機抽樣定義可知,每個個體成為樣本的概率相等,故
選D.
7.為了研究某藥品的療效,選取若干名志愿者進行臨床試驗.所
有志愿者的舒張壓數據(單位:kPa)的分組區間為[12,13),[13,14),
[14,15),[15,16),[16,17],將其按從左到右的順序分別編號為第一組,
第二組,……,第五組.如圖是根據試驗數據制成的頻率分布直方
圖.已知第一組與第二組共有20人,第三組中沒有療效的有6人,
則第三組中有療效的人數為()
A.6B.8
C.12D.18
答案C
解析設樣本容量為〃,
XlXn=20,解得〃=50.
X1X50=18.
因為第三組中沒有療效的有6人,所以第三組中有療效的人數為
18—6=12.
8.在一次馬拉松比賽中,35名運動員的成績(單位:分鐘)的莖
葉圖如圖所示.
若將運動員按成績由好到差編為1?35號,再用系統抽樣方法從
中抽取7人,則其中成績在區間[139,151]上的運動員人數是
答案4
解析由系統抽樣方法知,應把35人分成7組,每組5人,每
組按規則抽取1人,因為成績在區間[139,151]上的共有4組,故成績
在區間[139,151]上的運動員人數是4
9.為了了解一片經濟林的生長情況,隨機抽測了其中6()株樹木
的底部周長(單位:cm),所得數據均在區間[80,130]上,其頻率分布
直方圖如圖所示,則在抽測的6()株樹木中,有株樹木的底
部周長小于100cm.
答案24
解析60XX10=24.
10.某公司為了解用戶對其產品的滿意度,從A,B兩地區分別
隨機調查了40個用戶,根據用戶對產品的滿意度評分,得到A地區
用戶滿意度評分的頻率分布直方圖和B地區用戶滿意度評分的頻數
分布表.
A地區用戶滿意度評分的頻率分布直方圖
B地區用戶滿意度評分的頻數分布表
滿意度
[50,60)[60,70)[70,80)[80,90)[90,100]
評分分組
頻數2814106
(1)在圖中作出B地區用戶滿意度評分的頻率分布直方圖,并通
過直方圖比較兩地區滿意度評分的平均值及分散程度(不要求計算出
具體值,給出結論即可);
B地區用戶滿意度評分的頻率分布直方圖
(2)根據用戶滿意度評分,將用戶的滿意度分為三個等級:
滿意度評分低于70分70分到89分不低于90分
滿意度等級不滿意泗思非常滿意
估計哪個地區用戶的滿意度等級為不滿意的概率大?說明理由.
解⑴
通過兩地區用戶滿意度評分的頻率分布直方圖可以看出,B地區
用戶滿意度評分的平均值高于A地區用戶滿意度評分的平均值;B
地區用戶滿意度評分比較集中,而A地區用戶滿意度評分比較分散.
(2)A地區用戶的滿意度等級為不滿意的概率大.
記CA表示事件:“A地區用戶的滿意度等級為不滿意”;CB表
示事件:“B地區用戶的滿意度等級為不滿意”.
由頻率分布直方圖得P(CAX
P(CBX
所以A地區用戶的滿意度等級為不滿意的概率大.
11.某工廠36名工人的年齡數據如下表:
工人編號年齡工人編號年齡工人編號年齡工人編號年齡
1401()3619272834
244113120432939
340123821413043
441133922373138
533144323343242
640154524423353
745163925373437
842173826443549
943183627423639
(1)用系統抽樣法從36名工人中抽取容量為9的樣本,且在第
分段里用隨機抽樣法抽到的年齡數據為44,列出樣本的年齡數據;
(2)計算⑴中樣本的均值;和方差
(3)36名工人中年齡在二一s與7+s
解(1)由系統抽樣的知識可知,36人分成9組,每組4人,其
中第一組的工人年齡為44,所以其編號為2,故所有樣本數據的編號
為4〃-2,72=1,2,…,9.其數據為:44,40,36,43,36,37,44,43,37.
—44+4()+-??+37
(2)x=---------5---------=40.
由方差公式知,52=|[(44-40)2+(40-40)2+-+(37-40)2]=
y
10()
-9*,
(3)因為舟=喈,所以$=¥*3,4),
JZJ
所以36名工人中年齡在G—s和M+s之間的人數等于在區間
[37,43]內的人數,
即40,40,41,…,39,共23人.
所以36名工人中年齡在1一5和或+s之間的人數所占的百分比
唔
12.某城市100戶居民的月平均用電量(單位:度),以[160,180),
[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分
組的頻率分布直方圖如圖所示.
(1)求直方圖中”的值;
(2)求月平均用電量的眾數和中位數;
(3)在月平均用電量為[220,240),[240,260),[260,280),[280,300]
的四組用戶中,用分層抽樣的方法抽取11戶居民,則月平均用電量
在[220,240)的用戶中應抽取多少戶?
解(1)依題意,20Xxr
(2)由題圖可知,最高矩形的數據組為[220,240),
220+240
眾數為=230.
X
???依題意,設中位數為y,
.“一220)X
解得y=224,
???中位數為224.
(3)月平均用電量在[220,240)的用戶在四組用戶中所占比例為,=
5
TT
???月平均用電量在[220,240)的用戶中應抽取11X得=5(戶).
13.某校高三共有900名學生,高三模擬考之后,為了了解學生
學習情況,用分層抽樣方法從中抽出若干學生此次數學成績,按成績
分組,制成如下的頻率分布表:
第一第二第三第四第五第六第七第八
組號
組組組組組組組組
合計
[70,8[80,9[90,1[100,[110,[120,[130,[140,
分組
0)0)00)110)120)130)140)150)
頻數64222018a105C
頻率b1
⑴確定表中江C的值;
(2)為了了解數學成績在120分以上的學生的心理狀態,現決定
在第六、七、八組中用分層抽樣方法抽取6名學生,在這6名學生中
又再隨機抽取2名與心理老師面談,求第七組中至少有一名學生被抽
到與心理老師面談的概率;
(3)估計該校本次考試的數學平均分.
解(1)因為頻率和為1,所以b
因為頻率=頻數/樣本容量,所以c=100,a=15.
(2)第六、七、八組共有30個樣本,用分層抽樣方法抽取6名學
生,每個被抽取的概率均為:,第七組被抽取的樣本數為1X10=2,
將第六組、第八組抽取的樣本分別用A,B,C,D表示,第七組抽出
的樣本用E,尸表示.
抽取2個的方法有AB、AC.AD、AE、AF、BC、BD、BE、BF、
CD、CE、CF、DE、DF、EF,共15種.
3
其中至少含E或尸的取法有9種,則所求概率為W
(3)估計平均分為75XXXXXXXX
1回歸分析
(1)變量間的相關關系
當自變量取值一定時;因變量的取值帶有一定的隨機性,則這兩
個變量之間的關系叫做相關關系.即相關關系是一種非確定性關系.
當一個變量的值由小變大時,另一個變量的值也由小變大,則這
兩個變量正相關;
當一個變量的值由小變大時,而另一個變量的值由大變小,則這
兩個變量負相關.
(2)散點圖
將樣本中的〃個數據點(為,y)(i=l,2,…描在平面直角坐標
系中,所得圖形叫做散點圖.
具有正相關關系的兩個變量的散點圖如圖⑴所示,
具有負相關關系的兩個變量的散點圖如圖⑵所示.
(3)兩個變量的線性相關
如果散點圖中點的分布從整體上看大致在二附近,則這兩
個變量之間具有線性相關關系,這條直線叫做回歸直線.回歸直線對
應的方程叫做回歸直線方程(簡稱回歸方程).
(4)回歸方程的求解
求回歸方程的方法是最小二乘法,即使得樣本數據的點到回歸直
線的距離的平方和最小.
若變量x與),具有線性相關關系,有〃個樣本數據(為,y)(i=
n
£(x-x)(y—y)
AAAA、Z')
1,2,…,〃),則回歸方程y=中------------=
E(x/—x)2
ZX/:V/-KX.vA〃〃
----------,。=y.其中尤=[1:如丁二^£孫(x,y)稱為
E后一〃三200
樣本點的中心.
(5)相關系數
我們可以利用相關系數來定量地衡量兩個變量之間的線性相關
n
X(X-X)(y—y)
關系,計算公式為r=—,1g.
[£8一%)江(V/-y)2
\11=\/=i
當》o時,表明兩個變量正相關;當r<o時,表明兩個變量負相
關.
一越接近于1,表明兩個變量的線性相關性越強;
仍越接近于o,表明兩個變量之間幾乎不存在線性相關關系.
通常,當上時,我們認為兩個變量之間存在著很強的線性相關關
2獨立性檢驗
(1)2X2列聯表
設X,y為兩個變量,它們的取值分別為{為,松}和{y”》},其
樣本頻數列聯表(2X2列聯表)如下:
>2總計
X1aba+b
X2Cdc+d
總計a+cb+d〃+/?+c+d
(2)獨立性檢驗
利用隨機變量一(也可表示為2”啜空;上八
(其中〃=〃+/?+c+d為樣本容量)來判斷“兩個變量有關系”的
方法稱為獨立性檢驗.
(3)獨立性檢驗的一般步驟
①根據樣本數據列出2X2列聯表;
②計算隨機變量心的觀測值k,查下表確定臨界值k°:
尸(蜉2谿)
P(心/))
ko
③如果攵2自,就推斷“X與丫有關系”,這種推斷犯錯誤的概
率不超過。(昭2姐;否則,就認為在犯錯誤的概率不超過P(照》公)
的前提下不能推斷“X與y有關系”.
M注意點對獨立性檢驗的理解
(1)通常認為k&“x與y有關系”.
(2)獨立性檢驗得出的結論是帶有概率性質的,只能說結論成立
的概率有多大,而不能完全肯定一個結論,因此才出現了臨界值表.在
分析問題時一定要注意這點,不可對某個問題下確定性結論,否則就
可能對統計計算的結果作出錯誤的解釋.
1.思維辨析
(1)相關關系的兩個變量是非確定關系.()
(2)散點圖中的點越集中,兩個變量的線性相關性越強.()
(3)對于分類變量X與K它們的隨機變量片的觀測值越小.“X
與y有關聯”的把握程度越大.()
(4)“名師出高徒”可以解釋為教師的教學水平與學生的水平成
正相關關系.()
(5)只有兩個變量有相關關系,所得到的回歸模型才有預測價
值.()
答案(1)7(2)X(3)X(4)J(5)7
AA
A.yx+4B.yx+5
AA
C.yxD.yx
答案C
解析因為回歸直線方程必過樣本點的中心(嚏,7),將點(4,5)
代入A,B,C,D檢驗可知,選項C正確.
3.某高校教“統計初步”課程的教師隨機調查了選該課程的一
些學生的情況,具體數據如下表:
專業
非統計專業統計專業
性另
男1310
女720
為了判斷主修統計專業是否與性別有關系,根據表中的數據,得
5QX(13X2O-1QX7)2^
到心的觀測值k=
23X27X20X30
因為k
答案5%
解析???4P(心2
命題法1回歸分析
典例1假設關于某設備的使用年限N年)和所支出的維修費
用M萬元),有如下表的統計資料:
使用年限M年)23456
維修費用M萬元)
若由資料可知y對x呈線性相關關系,試求:
(1)線性回歸直線方程;
(2)根據回歸直線方程,估計使用年限為12年時,維修費用是多
少?
[解]⑴列表
i12345合計
Xj2345620
y25
砂
X?4916253690
x=4,y=5;
55
Ex?=90;Ex%
i=1i=1
5_____
A^Xiy—5xy
i=I
h=-------=錯誤!
X后一5x2
Z=1
A_A——
于是a=y—bxX
A
所以線性回歸直線方程為期
A
(2)當工=12時,yX
Q【解題法】求線性回歸直線方程的步驟
(1)用散點圖或進行相關性檢驗判斷兩個變量是否具有線性相關
關系.
⑵列表求出X,y,£君,Exm(可用計算器進行計算).
z=lz=li=I
八/2xy
A——A——
(3)利用公式〃=胃---a-=--y---hx求得回歸系數.
(4)寫出回歸直線方程.
命題法2獨立性檢驗
典例2某工廠有25周歲以上(含25周歲)工人300名,25周歲
以下工人200名.為研究工人的日平均生產量是否與年齡有關,現采
用分層抽樣的方法,從中抽取了10()名工人,先統計了他們某月的日
平均生產件數,然后按工人年齡在“25周歲以上(含25周歲)”和“25
周歲以下”分為兩組,再將兩組工人的H平均生產件數分成5組:
[50,60),[60,70),[70,80),[80,90),[90,100]分別加以統計,得到如圖
所示的頻率分布直方圖.
(1)從樣本中日平均生產件數不足60件的工人中隨機抽取2人,
求至少抽到一名“25周歲以下組”工人的概率;
(2)規定日平均生產件數不少于80件者為“生產能手”,請你根
據已知條件完成2X2列聯表,并判斷是否有90%的把握認為“生產
能手與工人所在的年齡組有關”?
〃(小僧22—〃
附:/=
〃1+,2+〃+1〃+2
P*k)
k
(注:此公式也可以寫成爛=}工J普浮
(4)(c十d)(a+c)(b+a)
[解](1)由已知得,樣本中有25周歲以上組工人60名,25周歲
以下組工人4()名.所以,樣本中日平均生產件數不足60件的工人中,
25周歲以上組工人有60XA,4,4;25周歲以下組工人有40XB],
B2.
從中隨機抽取2名工人,所有的可能結果共有10種,它們是:
(Ai,A2),(A),&),(A2,4),(Ai,Bi,),(4,&),(4,Bi),(A2,
&),(4,S),(A3,&),(Bi,4).
其中,至少有1名“25周歲以下組”工人的可能結果共有7種,
它們是:(4,Bi),(4,4),如,Bi),(4,&),(4,B3(4,82),
7
(Bi,&),故所求的概率尸=元.
(2)由頻率分布直方圖可知,在抽取的100名工人中,“25周歲
以上組”中的生產能手60X“25周歲以下組”中的生產能手
40XX2列聯表如下:
生產能手非生產能手合計
25周歲以上組154560
25周歲以下組152540
合計3070100
所以得K?=----------Md—bc)?---------
加以付A(a+bXc+d)(a+c)(b+d)
100X(15X25—15X45)225_
60X40X30X70=瓦心
所以沒有90%的把握認為“生產能手與工人所在的年齡組有
關”.
9【解題法】解決獨立性檢驗問題的方法
首先要根據題目條件列出兩個變量的2X2列聯表,通過計算隨
機變量心的觀測值上依據臨界值與犯錯誤的概率得出結論.注意觀
測值的臨界值與概率間的對應關系.
1.為了解某社區居民的家庭年收入與年支出的關系,隨機調查了
該社區5戶家庭,得到如下統計數據表:
收入式萬元)
支出M萬元)
根據上表可得回歸直線方程),=/?X+Q,其中加=y—據此估
計,該社區一戶年收入為15萬元家庭的年支出為()
B
D
答案B
AAAA
解析:xy6...QX.??回歸方程為y-=15代入上式得,yX
2.根據如下樣本數據:
X345678
y
A
得到的回歸方程為y="+。,則()
A.47>O,h>0B.a>0,h<0
C.〃<0,b>0D.6/<0,b<0
答案B
解析由樣本數據可知y值總體上是隨x值的增大而減少的,故
b<0,又回歸直線過第一象限,故縱截距00.故選B.
3.已知變量x與),正相關,且由觀測數據算得樣本平均數1=3,
y
AA
A.yxB.y=2x
AA
C.y=~2xD.yx
答案A
解析由變量x與y正相關,可知x的系數為正,排除C、D.而
所有的回歸直線必經過點(二,7),由此排除B,故選A.
4.某公司為確定下一年度投入某種產品的宣傳費,需了解年宣
傳費式單位:千元)對年銷售量),(單位:。和年利潤z(單位:千元)的
影響.對近8年的年宣傳費M和年銷售量),1,2,…,8)數據作了
初步處理,得到下面的散點圖及一些統計量的值.
廠——18
表中Wi=y]Xi,w=g£助.
/=i
(1)根據散點圖判斷,丁=。+以與y=c+八&哪一個適宜作為年銷
售量),關于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明
理由)
(2)根據⑴的判斷結果及表中數據,建立),關于x的回歸方程;
(3)已知這種產品的年利潤z與x,y的關系為zy—尤根據⑵的結
果回答下列問題:
①年宣傳費x=49時:年銷售量及年利潤的預報值是多少?
②年宣傳費x為何值時,年利潤的預報值最大?
附:對于一組數據(的,5),(〃2,02),…,(〃“,Vn)9其回歸直線
0=。+的的斜率和截距的最小二乘估計分別為
n
A£(出一〃)(①一v)AA
P='n,OL=V-PU.
£(均一U)2
i=l
解(1)由散點國可以判斷,y=c+小、&適宜作為年銷售量y關于
年宣傳費工的回歸方程類型.
⑵令w=必先建立y關于zo的線性回歸方程.由于
8
A£(助一z。)(y-y)
d------------=,=68,
E(w—w)2
/=!
AA
c=y—dw=563—68X
所以y關于w的線性回歸方程為)w,因此y關于x的回歸方程
A
為)
(3)①由(2)知,當x=49時-,年銷售量),的預報值
年利潤z的預報值
A
zX
②根據(2)的結果知,年利潤z的預報值
A
z\[x)~x=-x^x
A
所以當加=,2)應取得最大值.
5.某地區2007年至2013年農村居民家庭人均純收入),(單位:
千元)的數據如下表:
年份2007200820092010201120122013
年份
1234567
代號,
人均
純收
入.V
(1)求),關于,的線性回歸方程;
(2)利用(1)中的回歸方程,分析2007年至2013年該地區農村居
民家庭人均純收入的變化情況,并預測該地區2015年農村居民家庭
人均純收入.
附:回歸直線的斜率和截距的最小二乘估計公式分別為:b=
n
X(。一t)(0一y)
j=?A—A—
,a=y-bt.
it)2
/=1
解(1)由所給數據計算得
t=,(1+2+3+4+5+6+7)=4,
1
y=i
7_
S(6—t)2=9+4+l+0+l+4+9=28,
i=\
7__
t)8—y)=(—3)xx(-i)+(-i)xxxxx
i=l
7__
AA_A_
.z=i_________________14
b=7~=28〃=y-blX
£(Lt)2
A
所求回歸方程為w
(2)由(1)知,b
A
將2015年的年份代號t=9代入(1)中的回歸方程,得yX
6.2014年7月18日15時,超強臺風“威馬遜”
(1)根據頻率分布直方圖估計小區每戶居民的平均損失;
(2)臺風后區委會號召小區居民為臺風重災區捐款,小明調查的
50戶居民捐款情況如上表,在表格空白處填寫正確數字,并說明是
否有95%以上的把握認為捐款數額是否多于或少于500元和自身經
濟損失是否到4000元有關?
附:臨界值表
ko
P(心2⑹
n(ad-bc}2
參考公式:心=,n=a+b+c+d.
(a+b)(c+d)(a+c)(b+d)
解(1)記每戶居民的平均損失為x元,貝心
x=(1000XXXXXX2000=3360.
(2)如下表:
5OX(3OX6-9X5)2_
長=39X11X35X15)
所以有95%以上的把握認為捐款數額是否多于或少于500元和
自身經濟損失是否到4000元有關.
7.氣象部門提供了某地區今年六月份(30天)的日最高氣溫的統
計表如下:
日最高氣溫/
K2222V/W2828UW32。32
(單位:℃)
天數612YZ
由于工作疏忽,統計表被墨水污染,丫和z數據不清楚,但氣象
部門提供的資料顯示,六月份的日最高氣溫不高于32c
(1)若把頻率看作概率,求y,Z的值;
(2)把日最高氣溫高于32°C稱為本地區的“高溫天氣”,根據已
知條件完成下面2X2列聯表,并據此推測是否有95%的把握認為本
地區的“高溫天氣”與西瓜“旺銷”有關?說明理由.
高溫天氣非高溫天氣合計
旺銷1
不旺銷6
合計
n(ad-hc)2
附:=
(a+b)(c+d)(a+c){b+d)
由概率知識得:P(?32)=l一尸(/<
???Z=30X
7=30-(6+124-3)=9.
(2)由獨立性檢驗知識得到如下2X2列聯表:
高溫天氣非高溫天氣合計
旺銷12122
不旺銷268
合計32730
〃(ad—bc)2
(a+b)(c+d)(a+c)(b+d)
30X(1X6—2X21)2
22X8X3X27
??????沒有95%的把握認為本地區的“高溫天氣”與西瓜“旺
銷”有關.
機從某小區抽取100戶居民進行月用電量調查,發現其用電量都
在5()至35()度之間,頻率分布直方圖如圖所示.
(1)直方圖中x的值為;
(2)在這些用戶中,用電量落在區間[1()0,250)內的戶數為
[錯解]
[錯因分析]在頻率分布直方圖中,小矩形的面積表示頻率,縱
頻率
坐標表示而值而出錯,x
[正解]Xx=,50)
(2)VX
.,.XI00=70.
[答案]
[心得體會]
M課時撬分練
時間:60分鐘
基礎組
1J2016.冀州中學期中]某市共有400所學校,現要用系統抽樣的
方法抽取20所學校作為樣本,調查學生課外閱讀的情況.把這400
所學校編上1?400的號碼,再從1?20中隨機抽取一個號碼,如果
此時抽得的號碼是6,則在編號為21到40的學校中,應抽取的學校
的編號為()
A.25B.26
C.27D.以上都不是
答案B
解析系統抽樣是把個體編號后,先抽取第一個,然后每次間隔
相同的數依次抽取,本題中每次間隔20,第一個抽取的是6號,接
下來應該抽取的是第26號,故選B.
2.[201S衡水中學仿真]在某次測量中得到的A樣本數據如下:
82,84,84,86,86,86,88,88,88,88.若B樣本數據恰好是4樣本數據每個都
加2后所得數據,則4B兩樣本的下列數字特征對應相同的是()
A.眾數B.平均數
C.中位數D.標準差
答案D
解析由題原來眾數88變為90,中位數由86變為88,平均數
增加2,所以每個數與平均數的差不變,即標準差不變.故選D.
3.[2016.棗強中學預測]對具有線性相關關系的變量筋y有一組
AA
觀測數據(“y)(i=l,2,…,8),其回歸直線方程是產學十〃,且汨
A
+?+13H-----=2(y]2H-----F/)=6,則實數。的值是()
1
-
A-
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業地產整裝技術與環保材料應用
- 工業污染治理與環境保護策略
- 工業污染源監測及治理方案
- 工業污染防治與循環經濟
- 工業機器人技術及其產業升級策略
- 工業生產中的質量控制與檢測技術
- 工業自動化系統的遠程監控與控制
- 工業機械設備的使用與日常維護
- 工業環境影響評價與法規要求
- 工業自動化與智能工廠的發展趨勢
- 2025年廣東省廣州市白云區中考語文二模試卷
- 2025年天津市河西區中考二模數學試題(含部分答案)
- 醫院培訓課件:《藥品不良反應報告和監測工作簡介》
- 2025 屆九年級初三畢業典禮校長講話:星河長明共赴新程
- 2025年伽師縣(中小學、幼兒園)教師招聘考試模擬試題及答案
- 醫院培訓中心管理制度
- GM/T 0009-2023SM2密碼算法使用規范
- 中等職業教育與普通高中教育融合發展路徑研究
- 網約車轉讓合同協議書
- 2024年安徽省初中學業水平考試生物試題含答案
- 2024年浙江省中考英語試題卷(含答案解析)
評論
0/150
提交評論