




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2025.高考科學復習創新方案?數學.提升版第3講成對
數據的統計分析
[課程標準.了解樣本相關系數的統計含義,了解樣本相關系數與標準化數據
向量夾角的關系.2.會通過相關系數比較多組成對數據的相關性3了解一元線性回
歸模型的含義,了解模型參數的統計意義,了解最小二乘原理,掌握一元線性回
歸模型參數的最小二乘估計方法,會使用相關的統計軟件4會用一元線性回歸模
型進行預測5理解2x2列聯表的統計意義.6.了解2x2列聯表獨立性檢驗及其應
用.
基礎知識整合
>知識梳理
1.相關關系
兩個變量有關系,但沒有確切到可由其中一個去精確地決定另一個的程度,
這種關系稱為相關關系.
2.相關關系的分類
(1)按變量間的增減性分為畫歪相關和國負相關.
①正相關:當一個變量的值增加時,另一個變量的相應值也呈現畫增加的
趨勢.
②負相關:當一個變量的值增加時,另一個變量的相應值呈現畫減少的趨
勢.
(2)按變量間是否有線性特征分為直線性相關或國韭線性相關(曲線相關).
①線性相關:如果兩個變量的取值呈現正相關或負相關,而且散點落在國二
條直線附近,我們就稱這兩個變量線性相關.
②非線性相關或曲線相關:如果兩個變量具有相關性,但不是畫線性相關,
我們就稱這兩個變量非線性相關或曲線相關.
3.相關關系的刻畫
(1)散點圖:為了直觀描述成對樣本數據的特征,把每對成對數據都用直角坐
標系中的點表示出來,由這些點組成的統計圖,叫做散點圖.
(2)樣本相關系數
①我們常用樣本相關系數一來確切地反映成對樣本數據(川,刈的相關程度,
其中r=
n__
E(劉-x)⑶-,)
(>")(…)2
②樣本相關系數r的取值范圍為畫JL—LL
當時,成對樣本數據回正相關;當xo時,成對樣本數據回負相關;
當仍越接近回L時,成對樣本數據的線性相關程度越強;當團越接近回。時,成
對樣本數據的線性相關程度越弱.
4.一元線性回歸模型
Y=bx+ae,____.
稱口』八八,、二為y關于犬的一元線性回歸模型.其中y稱為回
E(e)=0,D(e)=(r
因變量或回響應變量,尢稱為畫自變量或回健釋變量,回且稱為截距參數,
回女稱為斜率參數;6是回上與回公吐幺之間的隨機誤差,如果《二畫。,那
么丫與x之間的關系就可以用一元線性函數模型來描述.
5.最小二乘法
AAA
將y二飯+〃稱為y關于x的經驗回歸方程,也稱經驗回歸函數或經驗回歸公
式,其圖形稱為經驗回歸直線,這種求經驗回歸方程的方法叫做最小二乘法,求
AAA/£(劉一工)87)Aj
得的乩。叫做R。的最小二乘估計,其中二——------Z--------------------,。二回
£(X/-X)2
6.殘差與殘差分析
⑴殘差
對于響應變量Y,通過觀測得到的數據稱為畫觀測值,通過經驗回歸方程得
到的f稱為網預測值,網觀測值減去因預測值稱為殘差.
(2)殘差分析
國殘差是隨機誤差的估計結果,通過對畫殘差的分析可以判斷模型刻畫數
據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.
7.對模型刻畫數據效果的分析
(1)殘差圖法
在殘差圖中,如果殘差比較均勻地集中在同以橫軸為對稱軸的水平帶狀區
域內,則說明經驗回歸方程較好地刻畫了兩個變量的關系.
(2)殘差平方和法
殘差平方和回三_('?-倒2越小,模型的擬合效果越好.
i三1
(3)決定系數R2法
士n(》fA)-
可以用決定系數產=1-亍----------來比較兩個模型的擬合效果,R2越
W(D
國大,模型擬合效果越好,收越國小,模型擬合效果越差.
8.列聯表與獨立性檢驗
(1)2x2列聯表
①2X2列聯表給出了成對分類變量數據的同交叉分類頻數.
②定義一對分類變量x和匕我們整理數據如下表所示:
Y
X合計
Y=0Y=1
x=oaba+b
X=1cdc+d
合計a+cb+dn=a+h+c+d
像這種形式的數據統計表稱為2x2列聯表.
(2)獨立性檢驗
①定義:利用Z2的取值推斷分類變量X和庖是查獨立的方法稱為了獨立
性檢驗,讀作“卡方獨立性檢驗。簡稱獨立性檢驗.
?—?n[ad-be)2
(2)/2=36—------------7-----7——-,其中〃=a+/?+c+d.
J人1—,(〃+〃)(丁+一)(〃+?)(〃+〃)1
(3)獨立性檢險解決實際問題的主要環節
①提出零假設”。:x和丫相互獨立,并給出在問題中的解釋.
②根據抽樣數據整理出2x2列聯表,計算/的值,并與臨界值打比較.
③根據檢驗規則得出推斷結論.
④在x和y不獨立的情況下,根據需要,通過比較相應的頻率,分析x和y
間的影響規律.
0知識拓展
1.相關關系與函數關系的異同
共同點:二者都是指兩個變量間的關系;
不同點:函數關系是一種確定性關系,體現的是因果關系,而相關關系是一
種非確定性關系,體現的不一定是因果關系,也可能是伴隨關系.
AAA__
2.經驗回歸直線):二云+。一定過點(x,y).
>雙基自測
1.(人教A選擇性必修第三冊習題8.1Ti改編)下列四個散點圖中,變量x與
y之間具有負線性相關關系的是()
y)
()
I)
答案D
解析觀察散點圖可知,只有D中的散點圖表示的是變量x與),之間具有負
線性相關關系.故選D.
2.甲、乙、丙、丁四位同學各自對A,B兩個變量的線性相關性做了試驗,
并用回歸分析方法分別求得相關系數一與殘差平方和〃3如下表:
甲乙丙T
r0.820.780.690.85
m106115124103
則哪位同學的試驗結果體現的A,B兩變量有更強的線性相關性()
A.甲B.乙
C.丙D.丁
答案D
解析團越接近1,"Z越小,線性相關性越強,故選D.
3.已知相關變量工和),滿足關系£=-。以+1,相關變量丁與z負相關,則
下列結論中正確的是()
A.x與y正相關,x與z負相關
B.x與y正相關,x與z正相關
C.x與y負相關,x與z負相關
D.x與y負相關,x與z正相關
答案D
AAA
解析由-0.1X+1可得x與),負相關.因為y與z負相關,可設z=Z?),+
AAAAAAAA
a,b<0,JjllJz=Z?(-0.1A+1)+6/=-OAbx+b+a,故x與z正相關.
4.(多選)(人教B選擇性必修第二冊432例1改編)為了解閱讀量多少與幸福
感強弱之間的關系,一個調查機構根據所得到的數據,繪制了如下所示的2x2列
聯表(個別數據暫用字母表示):
幸福感
閱讀量合計
強弱
多m1872
少36n78
合計906015()
計算得到Z2力2.981,參照下表:
a0.100.050.0250.0100.0050.001
Xa2.7063.8415.0246.6357.87910.828
則下列結論正確的是()
A.根據小概率值。=0.010的獨立性檢驗,可以認為“閱讀量多少與幸福感強
弱無關”
B.=54
C.n=52
D.根據小概率值a=0.005的獨立性檢驗,可以在犯錯誤的概率不超過0.5%
的前提下認為“閱讀量多少與幸福感強弱有關”
答案BD
解析.??/引2.981>7.879>6.635,.?.根據小概率值。=0.010的獨立性檢驗,
可以在犯錯誤的概率不超過1%的前提下認為“閱讀量多少與幸福感強弱有關”,根
據小概率值〃=0.005的獨立性檢驗,可以在犯錯誤的概率不超過0.5%的前提下
認為“閱讀量多少與幸福感強弱有關”,A錯誤,D正確;?.■〃2+36=90,18+〃
=60,「.團=54,〃=42,7.B正確,C錯誤.
5.某產品的廣告費用x與銷售額),的統計數據如下表:
廣告費用*萬元)4235
銷售額y(萬元)49263954
根據上表可得經驗回歸方程5二篇+2中的分為9.4,據此模型預測廣告費用為
6萬元時銷售額約為萬元.
答案65.5
_4+2+3+5_49+26+39+54
解析由表可得了二----4----二3.5,y=-------4------=42,因為點
AAAAAA
(3.5,42)在經驗回歸直線),=灰+々上,旦〃=9.4,所以42=9.4x3.5+〃,解得a=
9.1.故經驗回歸方程為£=9.4x+9.1.令x=6,得R=65.5.故預測廣告費用為6萬元
時銷售額約為65.5萬元.
核心考向突破
多角度探究突破
考向一兩個變量的相關性
角度1相關關系的判斷
例1(1)某商家今年上半年各月的人均銷售額(單位:千元)與利潤率統計表
如下:
月份123456
人均銷售額658347
18.
利潤率(%)12.610.43.08.116.3
5
根據表中數據,下列說法正確的是()
A.利潤率與人均銷售額成正相關關系
B.利潤率與人均銷售額成負相關關系
C.利潤率與人均銷售額成正比例函數關系
D.利潤率與人均第售額成反比例函數關系
答案A
解析由統計表可得利潤率與人均銷售額不是正比例關系,也不是反比例關
系,排除C,D;其屬于正相關關系,A正確,B錯誤.故選A.
(2)在以下4幅散點圖中,圖_______中的y和x之間存在相關關系(將正確答
案的序號填在橫線上)
答案②③④
解析圖②③中的點成帶狀區域分布在某一直線附近,④中的點分布在某一
曲線附近,故②③④存在相關關系.
角度2相關系數的計算及意義
例2(1)(多選)某同學將收集到的六對數據制作成散點圖一
AA
如右,得到其經驗回歸方程為八:),=0.681+出計算其相關系.
*c{)
數為n,決定系數為即經過分析確定點F為“離群點”,把它去_上_____,
X
掉后,再利用剩下的五對數據計算得到經驗回歸方程為/2:y=
源+0.68,相關系數為2決定系數為R幺下列結論正確的是()
A.n>/*!>0B.Ri>Ri
AA
C.0<Z?<0.68D力>0.68
答案AC
解析由圖可知兩變量呈正相關,故n>0,m>0,去掉"離群點''后,相關
性更強,所以「V廢,故此v審,故A正確,B錯誤;根據圖象,當去掉尸點后,
直線基本在4,B,C,D,E附近的那條直線上,直線的傾斜程度會略向x軸偏
向,故斜率會變小,因此0<合<0.68,故C正確:D錯誤.故選AC.
(2)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為
調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊
中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據5,??)(,=1,
2,…,20),其中H和"分別表示第,個樣區的植物覆蓋面積(單位:公頃)和這種
2()2020-20_、
野生動物的數量,并計算得£即=60,Z?=1200,Z8-1)2=80,£(>7-y)2
/=1/=1/=1/=1
20__
=9(X)0,E(Xi-x)('?-),)=800.
,=!
①求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣
區這種野生動物數量的平均數乘以地塊數);
②求樣本(孫2,…,20)的相關系數(精確到0.01).
n
2U-x)(yi-y)
附:相關系數,二一----------:-------------,/R.414.
、Z(r-X)2E(V-y)2
V口?i='
1201
解①每個樣區野生動物數量的平均數為疝=而xl20()=6(),地塊數為
1=1
200,所以該地區這種野生動物數量的估計值為200x60=12000.
②樣本6,V)的相關系數為
20__
_g—Lx)(p—y)__________8002迫
r==
^(y;-7)r^=3??
口觸類旁通n判定兩個變量相關性的方法
若點的分布從左下角到右上角,則兩個變量正相關;若點的分
畫散點圖
布從左上角到右下角,則兩個變量負相關
當廠>0時,正相關;當X。時,負相關;M越接近1,線性相關
樣本相關系數
程度遺強
AA
經驗回歸方程當比>0時,正相關;當8Vo時,負相關
r即時訓練1.(2024?薊州開學考試)對兩個變量羽),進行線性市地嬴榛
性相關系數門=0.8995,對兩個變量〃,u進行線性相關檢驗,得線性相關系數9
=-0.9568,則下列判斷正確的是()
A.變量x與y正相關,變量〃與u負相關,變量x與),的線性相關性較強
B.變量x與y負相關,變量〃與口正相關,變量無與),的線性相關性較強
C.變量x與),正相關,變量〃與口負相關,變量〃與口的線性相關性較強
D.變量x與),負相關,變量〃與u正相關,變量〃與u的線性相關性較強
答案C
解析因為線性相關系數門二0.8995X),所以二y正相關,因為線性相關系
數旌=-0.9568<0,所以〃,>,負相關,又因為|川<四,所以變量〃,?的線性相關
性比心的線性相關性強,故A,B,D錯誤,C正確.故選C.
2.為了監控某種零件的一條生產線的生產過程,檢驗員每隔30min從該生
產線上隨機抽取一個零件,并測量其尺寸(單位:cm).下面是檢驗員在一天內依
次抽取的16個零件的尺寸:
抽取次序12345678
零件尺寸9.9510.129.969.9610.019.929.9810.04
抽取次序910111213141516
零件尺寸10.269.9110.1310.029.2210.0410.059.95
116/I16
經計算得x=石£一二9.97,s='/諱Z)2=
([?-16£2)=0.212,8.5)2-8.439,£(劉_I)*8.5)=-
2.78,其中方為抽取的第,個零件的尺寸,,.=1,2,…,16.
(1)求(8,/)(/=1,2,16)的相關系數人并回答是否可以認為這一天生產
的零件尺寸不隨生產過程的進行而系統地變大或變小(若I/K0.25,則可以認為零件
的尺寸不隨生產過程的進行而系統地變大或變小);
(2)一天內抽檢零件中,如果出現了尺寸在(1-3s,1+3s)之外的零件,就
認為這條生產線在這一天的生產過程可能出現了異常情況,需對當天的生產過程
進行檢查.
①從這一天抽檢的結果看,是否需對當天的生產過程進行檢查?
②在(1-35,工+3s)之外的數據稱為離群值,試剔除離群值,估計這條生產
線當天生產的零件尺寸的均值與標準差(精確到0.01).
附:樣本(孫,?)(,=1,2,〃)的相關系數
參考數據:^0.008-0.09.
解(1)由樣本數據,得但,i)(i=1,2,…,16)的相關系數r
16
-2.78
-------F=-------=-()18
0.212x716x18.439
由于仍<0.25,因此可以認為這一天生產的零件尺寸不隨生產過程的進行而系
統地變大或變小.
(2)①由于工二9.97,s=0.212,因此由樣本數據可以看出抽取的第13個零件
的尺寸在(1-3s,1+3s)以外,因此需對當天的生產過程進行檢查.
②剔除離群值,即第13個數據,剩下數據的平均數為tX(16X9.97-9.22)=
10.02,
這條生產線當天生產的零件尺寸的均值的估計值為10.02.
16
£^^16X0.2122416x9.972=1591.134,
/=1
剔除第13個數據,剩下數據的樣本方差為tx(1591.134-9.222-
15x10.022戶0.008,
這條生產線當天生產的零件尺寸的標準差的估計值為M麗巾.09.
多角度探究突破
考向二回歸分析
角度1線性回歸模型
例3(2024.濟南開學考試)隨著科技的發展,網購成了人們購物的重要選擇,
并對實體經濟產生了一定影響.為了解實體經濟的現狀,某研究機構統計了一個
大商場2019-2023年的線下銷售額如下:
年份編號X12345
年份20192020202120222023
銷售額y
1513146512021060860
(單位:萬元)
(1)由表中數據可以看出,可用線性回歸模型擬合銷售額),與年份編號x的關
系,請用相關系數加以說明;
(2)建立),關于久?的經驗回歸方程,并預測2024年該商場的線下銷售額.
參考公式及數據:
A£砂-〃工aA_A_
b=~,a=y-bx,
£京-nx2
1736.
5
斗
解(1)由已知數據可得,X=3,y=—=^=1220,
5
所以£卬,-5Ty=16589-5x3x1220=-1711,
/=!
5
I___________________________
所以〃二J7,21’5y)工浦在-0.9856.
因為M非常接近1,所以可用線性回歸模型擬合銷售額),與年份編號x的關系.
22222
(2)由已知數據可得,1>?=14-2+3+4+5=55,
/=i
5
孕C
Ay16589-5x3x1220
所以。二當者5“——=-171.1,
=DD-
a=y-bx=1220-(-171.1)x3=1733.3,
所以>關于x的經驗回歸方程為5二-171.我+1733.3.
令x=6,
5!ljy=-171.1x6+1733.3=706.7(萬元).
所以預測2024年該商場的線下銷售額為706.7萬元.
角度2非線性回歸模型
例4某公司為確定下一年度投入某種產品的宣傳費,需了解年宣傳費工(單
位:千元)對年銷售量)(單位:。和年利潤z(單位:千元)的影響.對近8年的年宣
傳費即和年銷售量2,…,8)數據作了初步處理,得到下面的散點圖及一
些統計量的值.
年銷售址/|
620
600...
580.■
560?
540.
520
500.?
48()1AA1AAAA,,A.
34363840424446485)525456
年宣傳費/千元
8
88_2(WL
£(M篙(Xz-X)?(y?
yj(無一IF
Xyvr
初2-y)vv)-(>v-y)
46.65636.8289.81.61469108.8
表中卬i=?,W=R*Wi.
⑴根據散點圖判斷,),二。+bx與尸c+小「哪一個適宜作為年銷售量y關于
年宣傳費X的經驗回歸方程類型?(給出判斷即可,不必說明理由)
(2)根據⑴的判斷結果及表中數據,建立y關于支的經驗回歸方程;
(3)已知這種產品的年利潤z與x,y的關系為z=().2y-x.根據⑵的結果回答
下列問題:
①年宣傳費工二49時,年銷售量及年利潤的預測值是多少?
②年宣傳費x為何值時,年利潤的預測值最大?
附:對于一組數據("I,Vl),(U2,V2),???,(4,v?),其經驗回歸直線^A二aA+/A
AZ/)(V/-V)AA_
〃的斜率和截距的最小二乘估計分別為"~~-----------------,?=v-Pu.
X〃)2
解(1)由散點圖可以判斷,y=c+M適宜作為年銷售量y關于年宣傳費x
的經驗回歸方程類型.
(2)令w=先建立y關于卬的經驗回歸方程.
8
八(Wi-(yi-y)
108.8
由于"二'68,
8_1.6
R(Wi~W)2
A_A_,一____
c=y-dvv=563-68x6.8=100.6,
A
所以y關于卬的經驗回歸方程為y=100.6+68iv,
因此y關于x的經驗回歸方程為£=100.6+68G.
(3)①由(2)知,當戶49時,年銷售量),的預測值為£=100.6+6隊用=576.6
千元,
年利潤z的預測值為1=576.6x0.2-49=66.32千元.
②根據⑵的結果知,年利潤z的預測值
z=0.2(100.6+68^)-x=-x+13.6^+20.12.
所以當5:號=6.8,即x=46.24時,2取得最大值.
故年宣傳費為46.24千元時,年利潤的預測值最大.
1觸類旁通I求經驗回歸方程的步驟
提醒:對非線性回歸分析問題,可通過適當的換元轉化為線性回歸分析問題
求解.
&即時訓練1.(2023?廈門二模)移動物聯網廣泛應用于皿億戶
25?
生產制造、公共服務、個人消費等領域.截至2022年底,20.
我國移動物聯網連接數達18.45億戶,成為全球主要經濟體!??
00I2345/
中首個實現''物超人''的國家.如圖是2018?2()22年移動物
聯網連接數卬與年份代碼,的散點圖,其中年份2018?2022對應的1分別為1?
5.
(1)根據散點圖推斷兩個變量是否線性相關.計算樣本相關系數(精確到0.01),
并推斷它們的相關程度;
(2)①假設變量x與變量丫的〃對觀測數據為(xi,yi),(X2,聞,…,g泗),
Y=bx+e
兩個變量滿足一元線性回歸模型口二、:八/、式隨機誤差
E(e)=0,D(e)-(T
bxi).請推導:當隨機誤差平方和。二£區取得最小值時,參數的最小二乘估計;
/=!
②令變量x=/-7,y=卬-6,則變量x與變量y滿足一元線性回歸模型
(Y=bx+e
1,、:n/、,利用①中結論求y關于X的經驗回歸方程,并預測2024
年移動物聯網連接數.
內
-
S(0f)(wf—w)
附:樣本相關系數r="£(%.一而",
2
S(w,-w)=76.9,S(/,-f)(w,-w)=27.2,Sw,=6081網之277
解(1)由散點圖可以看出樣本點都集中在一條直線附近,由此推斷兩個變量
線性相關.
因為7=1x(l+24-3+4+5)=3,
5
所以Ze-7)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=1(),
z=i
Z(6-7)(W7-HO
,7.2_27.227.2
[10x76.9=”27.7
=0.98,
所以這兩個變量正線性相關,且相關程度很強.
£一=£(北一)2=£(9一2bxiy,
⑵①。二-1"I"1
+b2xj)=lrN乂
—I___
要使Q取得最小值,當且僅當〃A二與y右??2.
55
2工<“2(。—)(w,
r°1_________£_____~_w__)
②由①知公二£5—')2二*二2.72,
所以y關于X的經驗回歸方程為£=2.72X,
5
之卬i
又6二一§一=?3=12.16,所以當/=7時,
貝IJx=7-3=4,w=y+b=2.72x4+12.16=23.04,
所以預測2024年移動物聯網連接數為23.04億戶.
2.(2023?遼寧名校聯盟期末)紅鈴蟲是棉花的主要害蟲之一,也侵害木棉、錦
葵等植物.為了防治蟲害,從根源上抑制害蟲數量.現研究紅鈴蟲的產卵數和溫
度的關系,收集到7組溫度工和產卵數y的觀測數據于表I中.根據繪制的散點
圖決定從回歸模型①),=oeclr與回歸模型②.v=+C4中選擇一個來進行擬合.
表【
溫度x/℃20222527293135
產卵數w個711212465114325
(1)請借助表n中的數據,求出回歸模型①的方程(精確到().01);
表11(注:表中Zi=lny)
7777_7_
X(Xi-x)2
工(V-5)2
18956725.2716278106
7£y>(ti
zli(力-居8-,S(無一
2
7)工)?(》-y)x)-(A-7)-7)
11.06304041.86825.09
(2)類似地,可以得到回歸模型②的方程為>=0.361-202.54,試求兩種模型
下溫度為20℃時的殘差;
(3)若求得回歸模型①的決定系數R2=0.95,回歸模型②的決定系數R2=0.81,
請結合(2)說明哪個模型的擬合效果更好.
參考數據:e-3⑷=o.o3,e026?1.30,e,79?5.99,e52O?181.27.
附:經驗回歸方程9=加+1中
n__
"(船一x)(y-y)
AA_A_
?Z~7,a-y-px.
£{Xi-X)2
解⑴由y=ciec2r,fliny=\nc\+ax,
令,=Iny,b=a,a=Inci,得,=+a,
由表H數據可得,
7
41.86
7-0.26,
£(Xi-X)2162
A_A_25.27八r,189
a-i-bx~~~-0.26x-=-3o.41,
A
所以f=0.26x—3.41,
所以所求經驗回歸方程為Q=e°.-3⑷(或Q=o.O3eO26v).
⑵由題意可知,模型①在x=20時殘差為yi-yi=7-e°-26x20-3-41?1.01,
模型②在x=20時殘差為yi-yi=7-(0.36x202-202.54)=65.54.
(3)因為0.95>0.81,即模型①的決定系數大于模型②的決定系數,由決定系
數公式知,模型①的殘差平方和小于模型②的殘差平方和,因此模型①得到的數
據更接近真實數據,所以模型①的擬合效果更好.
考向三獨立性檢驗
例5(2023?棗莊三中期末)某中學為調查本校學生“保
護動物意識的強弱與性別是否有關“,采用簡單隨機抽樣的
方法,從該校分別抽取了男生和女生各50名作為樣本,經
統計,得到如圖所示的等高堆積條形圖.
(1)根據已知條件,將下面2x2列聯表補充完整:II保護動物意隊強
II保護動物意隊弱
保護動物意識合計
性別
強弱
男生50
女生50
合計100
(2)根據(1)表中數據,依據小概率值a=0.005的獨立性檢驗,分析該校學生
保護動物意識的強弱與性別是否有關.
,n(ad-be)2
附.(〃+/?)(c+d)(a+c)(b+d),n=a+b+c+d.
a0.100.050.010.005
Xa2.7063.8416.6357.879
解(1)由等高堆積條形圖知,男生保護動物意識強的有50x0.7=35人,女生
保護動物意識強的有50x0.4=20人,于是補充2x2列聯表如下:
保護動物意識合計
性別
強弱
男生351550
女生203050
合計5545100
(2)零假設為"0:該校學生保護動物意識的強弱與性別無關,根據列聯表中的
數據,得
、100x(35x30-15x20)2100
/=-50X50X55X45-二,9.091>7.879=xo.oo5,
根據小概率值a=0.005的獨立性檢驗,我們推斷“0不成立,即認為該校學
生保護動物意識的強弱與性別有關,此推斷犯錯誤的概率不大于0.005.
I觸類旁通I
1.比較幾個分類變量有關聯的可能性大小的方法
(1)通過計算Z2的大小判斷:Z2越大,兩變量有關聯的可能性越大.
(2)通過計算|〃-慶|的大小判斷:|〃-曲|越大,兩變量有關聯的可能性越大.
(3)通過計算備與力的大小判斷:相差越大,兩變量有關聯的可能性越大.
V*Iexv*IV*
2.獨立性檢驗的一般步驟
(1)根據樣本數據制成2x2列聯表.
.n(ad-be)2.
⑵根據公式r=("份(,+d)(a+c)g+計算/的值,
(3)比較/與臨界值打的大小關系,作統計推斷.
r即時訓練(2024.貴州黔東南州從江縣高三期中檢測謀學校現有1000名學
生,為調查該校學生一周使用手機上網時間的情況,收集了〃名學生某周使用手
機上網時間的樣本數據(單位:小時).將數據分為6組:[0,2],(2,4J,(4,6J,
(6,8],(8,10],(1(),12],并整理得到如下的頻率分布直方圖:
(1)估計該校學生一周平均使用手機上網時間(每組數據以該組中點值為代
表);
(2)將一周使用手機上網時間在(4,12]內定義為“長時間使用手機上網“;一周
使用手機上網時間在(0,4]內定義為“不長時間使用手機上網”,在樣本數據中,
有().25〃名學生不近視.
①請補充完成該周使用手機上網時間與近視程度的列聯表;
②若〃為100,那么在犯錯誤的概率不超過0.001的前提下是否能認為該校學
生一周使用手機上網時間與近視程度有關?
一周使用手機近視程度
合計
上網時間近視不近視
長時間使用手機
不長時間使用手機0.15/?
合計0.25〃
n(ad-be)2
附:1“)(c+d)…(〃+"),其中,…+b+c+&
a0.10.050.0100.0050.001
2.7063.8416.6357.87910.828
解(1)根據頻率分布直方圖可估計該校學生一周平均使用手機上網時間為
x=1x0.025x2+3x0.100x2+5x0.150x2+7x0.125x2+9x0.075x2+11x0.025x2=
5.8(小時).
(2)①由頻率分布直方圖可得,上網時間在(0,4]內和(4,12]內的比例為0.25:
0.75=1:3,
故可得列聯表如下:
近視程度
一周使用手機上網時間合計
近視不近視
長時間使用手磯0.65〃0.1On0.75〃
不長時間使用手機0.10〃0.15/?0.25〃
合計0.75〃0.25〃n
100x(65x15-10x10)2
②若〃為100,則茬=—乂—?21.78>10.828,故在犯錯誤
的概率不超過0.001的前提下能認為該校學生一周使用手機上網時間與近視程度
有關.
課時作業
一、單項選擇題
1.根據分類變量X與>的成對樣本數據,計算得到犬二6.147.依據a=0.01
的獨立性檢驗(xo.oi=6.635),結論為()
A.變量犬與y不獨立
B.變量犬與),不獨立,這個結論犯錯誤的概率不超過0.01
C.變量x與),獨立
D.變量x與y獨立,這個結論犯錯誤的概率不超過0.01
答案C
解析依據a=0。的獨立性檢驗,當/=6.147<6.635時,可以認為變量x
與)獨立.故選C
2.(2023?天津高考)調查某種群花萼長度和花瓣長度,所得數據如圖所示.其
中相關系數一二0.8245,下列說法正確的是()
花滯長度
花萼氏度
A.花瓣長度和花萼長度沒有相關性
B.花瓣長度和花萼長度呈負相關
C.花瓣長度和花萼長度呈正相關
D.若從樣本中抽取一部分,則這部分的相關系數一定是0.8245
答案C
解析因為相關系數r=0,8245>0.75,所以花瓣長度和花萼長度的相關性較
強,并且呈正相關,所以A,B錯誤,C正確;因為相關系數與樣本的數據有關,
所以當樣本發生變化時,相關系數也可能會發生變化,所以D錯誤.故選C.
3.(2024.青島開學考試)已知某設備的使用年限x(單位:年)與年維護費用),(單
位:千元)的對應數據如下表:
X24568
y34.56.57.59
由所給數據分析可知,x與),之間具有線性相關關系,且y關于x的經驗回
AAA
歸方程為L05x+a,則。=()
A.0.75B.0.85
C.0.95D.1.05
答案B
_2+4+5+6+8_3+4.5+6.5+7.5+9
解析由已知可得,x==5,y==6.1,
AA
因為經驗回歸直線過樣本點的中心(5,6.1),所以6.1=1.05x5+。,解得4=0.85.
故選B.
4.用模型y=配機+1(〃>0)擬合一組數據時,令z=lny,將其變換后得到經驗
回歸方程z=2x+a,?j-=()
A.e
C.5D.2
答案D
解析對y=a/”(a>0)兩邊同時取對數,則析y=ln3ax+I)=lna+公+兀
b=2,b=2,b
令z=lny,5JlJz=+Ina+1,所以,I,解得所以.故選D.
a=\na+I,
5.下圖是某地區20()3年至2023年環境保護建設投資額(單位:萬元)的折線
圖.
根據該折線圖判斷,下列結論正確的是()
A.為預測該地2024年的環境保護建設投資額,應用2003年至2023年的數
據建立回歸模型更可靠
B.為預測該地2024年的環境保護建設投資額,應用2012年至2023年的數
據建立回歸模型更可靠
C.投資額與年份負相關
D.投資額與年份的相關系數廠<()
答案B
解析因為2011年之前與2012年之后投資額變化較大,故為預測該地2024
年的環境保護建設投資額,應用2012年至2023年的數據建立回歸模型更可靠,
所以A錯誤,B正確;隨年份的增長,投資額總體上在增長,所以投資額與年份
正相關,r>0,故C,D錯誤.故選B.
6.根據如下樣本數據:
X345678
y4.02.50.50.50.40.1
AAA
得到經驗回歸方程為),=尿+。,貝IJ()
AA
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 養殖產業聯合經營及責任分配合同
- 豆腐技術轉讓合同協議書
- 更改勞動合同協議書
- 農田租地合同協議書樣本
- 酒吧經營轉讓合同協議書
- 《2025聘請財務顧問合同》
- 2025雙方車輛買賣合同
- 2025家居用品采購合同范本
- 2025年廚師雇傭勞動合同模板
- 建筑搬運清理合同協議書
- 《社會主義制度在中國的確立》示范課教學設計【高中思想政治人教版必修1中國特色社會主義】
- 立方米臥式濃硫酸儲罐設計
- 三乙胺安全標簽
- GB/T 4490-2021織物芯輸送帶寬度和長度
- GB/T 28650-2012公路防撞桶
- GB/T 17793-1999一般用途的加工銅及銅合金板帶材外形尺寸及允許偏差
- ICU常見檢查項目及課件
- 土地荒漠化的防治(公開課)課件
- MSA量測系統分析RMSA量測系統分析課件
- 中考備考應對中考歷史學科的復習策略和解題技巧課件
- 思想道德修養與法律基礎(完整版PPT)
評論
0/150
提交評論