




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
三統(tǒng)計案例
知識要點,易錯提醒
概念速記,
1.最小二乘法
對于一組數(shù)據(jù)(%,%),i=l,2,…,n,如果它們線性相關(guān),則線性回歸方程為尸6x+a,
其中少
苫(%-%)(力7)tx.y.-nxy_
------;-----——二.....-,a=y-bx.
£(4.一%)“£先.-nx
i=[1(=1i
2.2X2列聯(lián)表
2X2列聯(lián)表如表所示:
BB總計
Aaba+b
Acdc+d
總計a+cb+dn
其中〃=a+6+c+d為樣本容量.
3.片檢驗
常用隨機變量r=(a+方)(:**)"+d)來檢驗兩個變量是否有關(guān)系?
易誤辨析,一
1.回歸分析的兩個關(guān)注點
(1)回歸分析是建立在兩個具有相關(guān)性的變量之間的一種模擬分析,因此先判斷其是否具有
相關(guān)性.
(2)并非只有線性相關(guān)關(guān)系,還可能存在非線性相關(guān)關(guān)系.
2.獨立性檢驗的兩個注意點
(1)通過獨立性檢驗得到的結(jié)論未必正確,它只是對一種可靠性的預測.
(2)2X2列聯(lián)表中,當數(shù)據(jù)a,b,c,d都不小于5時,才可以用*檢驗.
4_主__題__串__講__,_綜__合__提_高__■nacrm4
主題1回歸分析
曲某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費近單位:千元)對年
銷售量y(單位:力和年利潤Z(單位:千元)的影響.對近8年的年宣傳費為和年銷售量%(i
=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.
年銷售量y/i
620
600???
580.*
560?
540.
520
500?
4801—?—?—?—?—?—?—?—?—?—?—i—?
343638404244464850525456
年宣傳費”千元
8888_
XyW£(一丁25-工2(x-%)(>->)y(IT-w)(y-y)
1=1ii=lii=liii=lii
46.65636.8289.81.61469108.8
8
表中啊=
(1)根據(jù)散點圖判斷,尸a+"與y=c+3那一個適宜作為年銷售量y關(guān)于年宣傳費x的
回歸方程類型?(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;
(3)已知這種產(chǎn)品的年利潤z與%y的關(guān)系為zy—x.根據(jù)(2)的結(jié)果回答下列問題:
①年宣傳費x=49時,年銷售量及年利潤的預報值是多少?
②年宣傳費x為何值時,年利潤的預報值最大?
附:對于一組數(shù)據(jù)Vi),(如V2),…,(0"%),其回歸直線/=〃+£〃的斜率和截
距的最小二乘估計分別為
£(%-〃)(4-”)
人<C—一人
B=----------:-------------------2-------=1Bu.
2
y(?i-M)
1=1
【解】(1)由散點圖可以判斷,適宜作為年銷售量y關(guān)于年宣傳費x的回歸方
程類型.
(2)令,仁正,先建立y關(guān)于田的線性回歸方程.
8
£(w.-w)(y.-y)
由于己=上一j-----------------------=畢滑=68,
V(2L6
Z(w.-W一)、
1=1
c=y-dW=563—68X6.8=100.6,
所以y關(guān)于甲的線性回歸方程為/=100.6+68科
因此y關(guān)于x的回歸方程為y+68y
(3)①由(2)知,當*=49時,
年銷售量y的預報值尸100.6+68749^576.6,
年利潤z的預報值z=576.6X0.2—49=66.32.
②根據(jù)⑵的結(jié)果知,年利潤z的預報值
z=0.2(100.6+68百)-x=-x4x+20.12.
所以當/=岑=6.8,即x=46.24時,z取得最大值.
故年宣傳費為46.24千元時,年利潤的預報值最大.
園圖畫幽
解決回歸分析問題的一般步驟
(1)畫散點圖.根據(jù)己知數(shù)據(jù)畫出散點圖.
(2)判斷變量的相關(guān)性并求回歸方程.通過觀察散點圖,直觀感知兩個變量是否具有相關(guān)關(guān)
系;在此基礎上,利用最小二乘法求回歸系數(shù),然后寫出回歸方程.
(3)回歸分析.畫殘差圖或計算",進行殘差分析.
(4)實際應用.依據(jù)求得的回歸方程解決問題.
0:跟蹤訓練在一段時間內(nèi),某種商品的價格x元和需求量y件之間的一組數(shù)據(jù)為:
x(元)1116182022
y(件)1210753
且知x與y具有線性相關(guān)關(guān)系,求出y關(guān)于x的回歸直線方程,并說明擬合效果的好壞.
—1
解:(14+16+18+20+22)=18,
5
一1
y=-X(12+10+7+5+3)=7.4,
□
Ix2=142+162+182+2O2+222=1660,
?=i1
Zx.y.=14x12+16x10+18x7+20x5+22x3=620,
5------
所以3^620-5x18x74^_L15
Lx2-5?1660-5x18-
1=11
所以a=7.4+1.15X18=28.1,
所以y對x的回歸直線方程為yx+28.1.
列出殘差表為
0
K—必
y\—y
5個
所以之(兀-兀)2=0.3,
£(兀-y)~=53.2,
1=11
57
Z(r-y.)2
R2=1-~^-?0.994.
斗(兀-y)2
所以**0.994,擬合效果較好.
主題2獨立性檢驗
倒畫某學生對其30位親屬的飲食習慣進行了一次調(diào)查,并用莖葉圖表示30人的飲食指
數(shù),如圖所示.(說明:圖中飲食指數(shù)低于70的人,飲食以蔬菜為主;飲食指數(shù)大于等于
70的人,飲食以肉類為主.)
甲(50歲以下)乙(50歲以上)
-r2015676
323796
534452
858
61
6784758
5328
09
(1)根據(jù)莖葉圖,幫助這位同學說明其30位親屬的飲食習慣;
⑵根據(jù)以上數(shù)據(jù)完成如表所示的2X2列聯(lián)表.
主食蔬菜主食肉類總計
50歲以下
50歲以上
總計
下認為“其親屬的飲食習慣與年齡有關(guān)”?
【解】(1)30位親屬中50歲以上的人飲食多以蔬菜為主,50歲以下的人飲食多以肉類為
主.
(2)2X2列聯(lián)表如表所示:
主食蔬菜主食肉類總計
50歲以下4812
50歲以上16218
總計201030
BOX(4X9—Qx1)2
(3)隨機變量片的觀測值k=?仃,d3萬乂備一=1。>6.635,
Ai1oAZUAiU
所以在犯錯誤的概率不超過0.01的前提下認為“其親屬的飲食習慣與年齡有關(guān)”.
四周回困
獨立性檢驗問題的求解策略
(1)等高條形圖法:依據(jù)題目信息畫出等高條形圖,依據(jù)頻率差異來粗略地判斷兩個變量的
相關(guān)性.
(2)片統(tǒng)計量法:通過公式
//7X2
*=-(汴〃)言忒一(:工、)"工石-先計算觀測值N再與臨界值表作比較,最后得出
結(jié)論.
處跟蹤訓練在考查黃煙是否經(jīng)過藥物處理與發(fā)生青花病的關(guān)系時,得到如下數(shù)據(jù):在試
驗的470株黃煙中,經(jīng)過藥物處理的黃煙有25株發(fā)生青花病,60株沒有發(fā)生青花病;未經(jīng)
過藥物處理的有185株發(fā)生青花病,200株沒有發(fā)生青花病.試推斷經(jīng)過藥物處理跟發(fā)生青
花病是否有關(guān)系.
解:由已知,得2X2列聯(lián)表如下:
經(jīng)過藥物處理未經(jīng)過藥物處理總計
青花病25185210
無青花病60200260
總計85385470
提出假設餌經(jīng)過藥物處理跟發(fā)生青花病無關(guān)系.
根據(jù)列聯(lián)表中的數(shù)據(jù),可以求得隨機變量A2的觀測值為
470X(25X200-185X60)2
k=--------------------------仁
210X260X85X3859二7,8。8。.
因為當外成立時,/27.879的概率約為0.005,而此時片的觀測值左79.788>7.879,
認為經(jīng)過藥物處理跟發(fā)生青花病是有關(guān)系的.
課后訓練,鞏固提升.
,[A基礎達標]
1.對兩個變量y和x進行回歸分析,得到一組樣本數(shù)據(jù):(①,弘),(熱,及),…,(工,%),
則下列說法中不正確的是()
A.由樣本數(shù)據(jù)得到的回歸方程y=6x+a必過樣本點的中心(x,y)
B.殘差平方和越小的模型,擬合的效果越好
C.用相關(guān)指數(shù)〃來刻畫回歸效果,〃的值越小,說明模型的擬合效果越好
D.若變量y和x之間的相關(guān)系數(shù)r=-0.9362,則變量y與x之間具有線性相關(guān)關(guān)系
解析:選C."的值越大,說明殘差平方和越小,也就是說模型的擬合效果越好,故選C.
2.下列說法中正確的有:()
①若r>0,則x增大時,y也相應增大;
②若r<0,則x增大時,y也相應增大;
③若r=l或r=-1,則矛與y的關(guān)系完全對應(有函數(shù)關(guān)系),在散點圖上各個散點均在一
條直線上.
A.①②B.②③
C.①③D.①②③
r>0,表示兩個相關(guān)變量正相關(guān),x增大時,y也相應增大,故①正確,rVO,表示兩個變
量負相關(guān),x增大時,y相應減小,故②錯誤.|萬越接近1,表示兩個變量相關(guān)性越高,61
=1表示兩個變量有確定的關(guān)系(即函數(shù)關(guān)系),故③正確.
3.若兩個變量的殘差平方和是325,Z(%一亍)2=923,則隨機誤差對預報變量的貢獻率
i=l
約為()
A.64.8%B.60%
C.35.2%D.40%
325
—^0.352.
yzj
4.有下列數(shù)據(jù)
X123
y3
下列四個函數(shù)中,模擬效果最好的為()
A.y=3X2'_1B.y=log2X
C.y=3xD.y=x
解析:選4分別把x=l,2,3,代入求值,求最接近y的值,即為模擬效果最好,故選4
5.通過隨機詢問100名性別不同的小學生是否愛吃零食,得到如下的列聯(lián)表:
男女合計
愛吃104050
不愛吃203050
合計3070100
P(百心
k
2nQad-be)2,100(10X30-20X40)2
由*=(a+b)(c+d)(a+c)Qb+d)'計算得*=50X50X30X70七4762.
參照附表,得到的正確結(jié)論為()
A.在犯錯誤的概率不超過5%的前提下,認為“是否愛吃零食與性別有關(guān)”
B.在犯錯誤的概率不超過5%的前提下,認為“是否愛吃零食與性別無關(guān)”
C.有97.5%以上的把握認為“是否愛吃零食與性別有關(guān)”
D.有97.5%以上的把握認為“是否愛吃零食與性別無關(guān)”
解析:選4因為*比4.762>3.841,尸(/>3.841)=0.05.所以在犯錯誤的概率不超過5%的前
提下,認為“是否愛吃零食與性別有關(guān)”,故選4
6.某種活性細胞的存活率7(%)與存放溫度”(℃)之間有如下幾組樣本數(shù)據(jù):
存放溫度x(℃)104-2-8
存活率7(%)20445680
6°C時,該種細胞的存活率的預報值為%.
解析:設回歸直線方程為yx+a,因為7=1,7=50,則a=*x=6時,y=-3.2X6+53.2
=34.
答案:34
7.已知具有相關(guān)關(guān)系的兩個隨機變量的一組觀測數(shù)據(jù)的散點圖分布在函數(shù)y=3#+i的圖象
附近,則可通過轉(zhuǎn)換得到的線性回歸方程為.
解析:由了=3產(chǎn)+‘,
得Iny=/〃(3e”+'),
即Iny=ln3+2x+l,
令u=lny,v—x,則線性回歸方程為u=l+ln3+2匕
答案:u=l+ln3+2x(其中u=lny)
8.為了調(diào)查患慢性氣管炎是否與吸煙有關(guān),調(diào)查了100名50歲以下的人,調(diào)查結(jié)果如下表:
患慢性氣管炎未患慢性氣管炎總計
吸煙202040
不吸煙55560
總計2575100
根據(jù)列聯(lián)表數(shù)據(jù),求得*=(保留3位有效數(shù)字),根據(jù)下表,在犯錯誤的概率不超
過的前提下認為患慢性氣管炎與吸煙有關(guān).
附:
尸(片24)
ko
n(ad-be)2__________
*=
(a+Z?)(c+d)(a+c)(/?+4).
解析:〃的觀測值人吟粽W展-22.2>I0.82&
所以在犯錯誤的概率不超過0.001的前提下認為患慢性氣管炎與吸煙有關(guān).
9.某學校高三年級有學生1000名,經(jīng)調(diào)查,其中750名同學經(jīng)常參加體育鍛煉(稱為A
類同學),另外250名同學不經(jīng)常參加體育鍛煉(稱為夕類同學),現(xiàn)用分層抽樣方法(按/
類、8類分兩層)從該年級的學生中共抽查100名同學,如果以身高達165c/作為達標的標
準,對抽取的100名學生,得到以下列聯(lián)表:
[」身高達標身高不達標總計
經(jīng)常參加體育鍛煉40
不經(jīng)常參加體育鍛煉15
總計100
(1)完成上表;
(2)能否在犯錯誤的概率不超過0.05的前提下認為經(jīng)常參加體育鍛煉與身高達標有關(guān)系(/
的觀測值精確到0.001)?
解:(1)填寫列聯(lián)表如下:
身高達標身高不達標總計
經(jīng)常參加體育鍛煉403575
不經(jīng)常參加體育鍛煉101525
總計5050100
(2)由列聯(lián)表中的數(shù)據(jù),得「的觀測值為
M二mg
333<3.841.
75X25X50X50
常參加體育鍛煉與身高達標有關(guān)系.
10.某城市理論預測2011年到2015年人口總數(shù)與年份的關(guān)系如表所示:
年份2011+x(年)01234
人口數(shù)y(十萬)5781119
(1)請畫出上表數(shù)據(jù)的散點圖;
(2)請根據(jù)上表提供的數(shù)據(jù),求出y關(guān)于x的線性回歸方程y="+a;
(3)據(jù)此估計2018年該城市人口總數(shù).
解:(1)散點圖如圖:
人口數(shù)十萬
20-?
15-
10-??,
1234~~
0+1+2+3+4
(2)因為3=
5
5+7+8+11+19
----------:----------=10,
*p;=0x5+1x7+2x8+3x11+4x19=132,
tx2=02+12+22+32+42=30,
i=1I
的,、,士132-5x2x10Q6
所以6=--------------------=3.2,
30-5x22
a=y-bx—3.6;
所以線性回歸方程為yx+3.6.
(3)令x=7,則y=3.2X7+3.6=26.
即估計2018年該城市人口總數(shù)為26十萬.
[B能力提升]
11.(2018?河南洛陽3月模擬)某省電視臺為了解該省衛(wèi)視一檔成語類節(jié)目的收視情況,抽
查東、西部各5個城市,得到觀看該節(jié)目的人數(shù)的統(tǒng)計數(shù)據(jù)(單位:千人),并畫出如下莖葉
圖,其中一個數(shù)字被污損.
東部西部
988337
2109?9
(1)求東部各城市觀看該節(jié)目的觀眾的平均人數(shù)超過西部各城市觀看該節(jié)目的觀眾的平均人
數(shù)的概率;
(2)該節(jié)目的播出極大地激發(fā)了觀眾對成語知識學習積累的熱情,現(xiàn)從觀看節(jié)目的觀眾中隨
機統(tǒng)計了4位觀眾學習成語知識的周均時間(單位:小時)與年齡(單位:歲),并制作了如下
對照表:
年齡才20304050
周均學習成語知識時間y34
根據(jù)表中數(shù)據(jù),試求線性回歸方程尸"+a,并預測年齡為60歲的觀眾周均學習成語知識
的時間.
n---
-nxy__
參考公式:6=-----------=y-bX.
V22
2%-nx
i=l1
解:(1)設被污損的數(shù)字為a,則a有10種情況.
由88+89+90+91+92>83+83+87+90+a+99,得a<8,
所以有8種情況使得東部各城市觀看該節(jié)目的觀眾的平均人數(shù)超過西部各城市觀看該節(jié)目
的觀眾的平均人數(shù),
84
所求概率為
1U□
4--
__-4xy
(2)由表中數(shù)據(jù),計算得%=35,y=3.5,1==一~—=
Zx2-4x2
1=11
525-4x35x3.5_7
5400-4x352一10°'
-721
a=y-bx=3.5——X35=—
-721
所以尸麗x+麗.
當x=60時,y=5.25.
即預測年齡為60歲的觀眾周均學習成語知識的時間為5.25小時.
12.(選做題)為了調(diào)查某地區(qū)成年人血液的一項指標,現(xiàn)隨機抽取了成年男性、女性各20
人組成一個樣本,對他們的這項血液指標進行了檢測,得到了如下莖葉圖.根據(jù)醫(yī)學知識,
我們認為此項指標大于40為偏高,反之即為正常.
男性女性
89750
98134
5973121558
87542312458
721403789
452567
(1)依據(jù)上述樣本數(shù)據(jù)研究此項血液指標與性別的關(guān)系,列出2義2列聯(lián)表,并判斷能否在犯
錯誤的概率不超過0.0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 診所引流現(xiàn)場管理制度
- 診療技術(shù)授權(quán)管理制度
- 調(diào)解中心監(jiān)督管理制度
- 財政特設專戶管理制度
- 貨代公司各類管理制度
- 貨物裝卸安全管理制度
- 貨船安全生產(chǎn)管理制度
- 2025年中國感應式皂液器行業(yè)市場全景分析及前景機遇研判報告
- 2025年中國動作感應手柄行業(yè)市場全景分析及前景機遇研判報告
- 液壓工具質(zhì)保協(xié)議書范本
- 2025至2030中國材料疲勞試驗機行業(yè)項目調(diào)研及市場前景預測評估報告
- 2025年陜西、山西、寧夏、青海四省(陜晉寧青)高考 生物真題試卷 附答案
- 2024年西昌市教育和體育局考核聘用公立幼兒園教師真題
- 2025設備租賃合同版本范文
- 2025年浙江杭州錢塘區(qū)和達能源有限公司招聘筆試沖刺題(帶答案解析)
- 2025年衣物清潔多元化發(fā)展趨勢白皮書-天貓家清第一財經(jīng)商業(yè)數(shù)據(jù)中心
- 冷鏈物流園建設項目投融資與財務方案
- 保險業(yè)務員分級考試試題及答案
- 2024統(tǒng)編版七年級道德與法治下冊期末測試卷(含答案)
- 酒店經(jīng)銷商合同協(xié)議書
- 轉(zhuǎn)讓釣場合同協(xié)議書
評論
0/150
提交評論