




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第02講成對數據的統計分析
目錄
01考情透視?目標導航............................................................2
02知識導圖?思維引航............................................................3
03考點突破題型探究............................................................4
知識點1:變量間的相關關系......................................................4
知識點2:線性回歸..............................................................5
知識點3:非線性回歸............................................................6
知識點4:獨立性檢驗............................................................7
解題方法總結...................................................................9
題型一:變量間的相關關系.......................................................9
題型二:一元線性回歸模型......................................................11
題型三:非線性回歸............................................................14
題型四:列聯表與獨立性檢驗....................................................18
題型五:誤差分析..............................................................21
04真題練習?命題洞見............................................................24
05課本典例高考素材............................................................25
06易錯分析?答題模板............................................................46
易錯點:對回歸直線的性質理解不深刻............................................46
答題模板:獨立性檢驗...........................................
考情透視.目標導航
考點要求考題統計考情分析
從近五年的全國卷的考查情況來看,
本節是高考的熱點,主要以解答題形式出
2024年甲卷(理)第17題,12分
(1)變量的相關關系現,經常與概率綜合出題,一般難度為中
2023年上海卷第14題,4分
(2)樣本相關系數等.也可能以選擇題、填空題形式出現,
2023年天津卷第7題,5分
(3)一元線性回歸模型難度不大.主要以應用題的方式出現,多
2023年甲卷(文)第19題,12分
(4)列聯表與獨立性檢驗與經濟、生活實際相聯系,需要在復雜的
2022年I卷第20題,12分
題目描述中找出數量關系,建立數學模
型,并且運用數學模型解決實際問題.
復習目標:
(1)了解樣本相關系數的統計含義.
(2)理解一元線性回歸模型和2x2列聯表,會運用這些方法解決簡單的實際問題.
(3)會利用統計軟件進行數據分析.
匐2
〃二知識導圖?思維引航\\
變置之間的相關關系
成對數據的統計分析
老占突硒?力理慳宙
-----
知識JJ
知識點1:變量間的相關關系
1、變量之間的相關關系
當自變量取值一定時,因變量的取值帶有一定的隨機性,則這兩個變量之間的關系叫相關關系.由于
相關關系的不確定性,在尋找變量之間相關關系的過程中,統計發揮著非常重要的作用.我們可以通過收
集大量的數據,在對數據進行統計分析的基礎上,發現其中的規律,對它們的關系作出判斷.
注意:相關關系與函數關系是不同的,相關關系是一種非確定的關系,函數關系是一種確定的關系,
而且函數關系是一種因果關系,但相關關系不一定是因果關系,也可能是伴隨關系.
2、散點圖
將樣本中的?個數據點(4%)(,=1,2,…,〃)描在平面直角坐標系中,所得圖形叫做散點圖.根據散點圖
中點的分布可以直觀地判斷兩個變量之間的關系.
(1)如果散點圖中的點散布在從左下角到右上角的區域內,對于兩個變量的這種相關關系,我們將
它稱為正相關,如圖(1)所示;
(2)如果散點圖中的點散布在從左上角到右下角的區域內,對于兩個變量的這種相關關系,我們將
它稱為負相關,如圖(2)所小.
(1)(2)
3、相關系數
若相應于變量X的取值毛,變量y的觀測值為y(i則變量%與y的相關系數
〃__n__
Z(占一%)(%-y)X占%-nxy
?t=——I=,通常用「來衡量x與y之間的線性關系的強弱,r
忙(…茂(…尸、如,一小忙兒一方
vi=li=lVz=lVi=l
的范圍為一
(1)當r>0時,表示兩個變量正相關;當r<0時,表示兩個變量負相關.
(2)m越接近i,表示兩個變量的線性相關性越強;團越接近o,表示兩個變量間幾乎不存在線性
相關關系.當卜|=1時,所有數據點都在一條直線上.
(3)通常當0.75時,認為兩個變量具有很強的線性相關關系.
【診斷自測】如圖,為某組數據的散點圖,由最小二乘法計算得到回歸直線4的方程為=相關
系數為4,決定系數為若經過殘差分析后去掉點P,剩余的點重新計算得到回歸直線4的方程為
.則下列結論一定正確的是(
D.4>0,
C.bx<b2馬v°
知識點2:線性回歸
1、線性回歸
線性回歸是研究不具備確定的函數關系的兩個變量之間的關系(相關關系)的方法.
對于一組具有線性相關關系的數據(為,》),(X2,以),…,(羽,如),其回歸方程)=加+。的求法為
I__〃____
nx
Z(%-x)(yi-y)Z%%-y
/=歸=-----------=-4---------------------------
£(七一龍)2之七2一/
Z=1Z=1
a=y—bx
其中,X=—,y=-'\\y.,(X,y)稱為樣本點的中心.
2、殘差分析
對于預報變量y,通過觀測得到的數據稱為觀測值y,通過回歸方程得到的y稱為預測值,觀測值減
去預測值等于殘差,4稱為相應于點(4口)的殘差,即有自=%-凡.殘差是隨機誤差的估計結果,通過對
殘差的分析可以判斷模型刻畫數據的效果以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差
分析.
(1)殘差圖
通過殘差分析,殘差點?后)比較均勻地落在水平的帶狀區域中,說明選用的模型比較合適,其中這
樣的帶狀區域的寬度越窄,說明模型擬合精確度越高;反之,不合適.
(2)通過殘差平方和。=之(/_%)2分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;
i=\
反之,不合適.
(3)相關指數
Z(y-£)2
用相關指數來刻畫回歸的效果,其計算公式是:叱=1—上」二.
£u-y)2
4=1
代越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.
【診斷自測】將某保護區分為面積大小相近的多個區域,用簡單隨機抽樣的方法抽取其中6個區域,統計
這些區域內的某種水源指標訪和某植物分布的數量y(,=i,2,…,6),得到樣本(4/),且其相關系數r=與,
16
記y關于X的線性回歸方程為y=a+bx.經計算可知:x=9,XX;=550,士(y-9『=256,則%.
i=lz=l
-£(%-元)(%-刃£(王-丁)(%-9)
參考公式?^=--------------,r=,'='^=―,
1V/=1V1=1
知識點3:非線性回歸
解答非線性擬合問題,要先根據散點圖選擇合適的函數類型,設出回歸方程,通過換元將陌生的非線
性回歸方程化歸轉化為我們熟悉的線性回歸方程.
求出樣本數據換元后的值,然后根據線性回歸方程的計算方法計算變換后的線性回歸方程系數,還原
后即可求出非線性回歸方程,再利用回歸方程進行預報預測,注意計算要細心,避免計算錯誤.
1、建立非線性回歸模型的基本步驟:
(1)確定研究對象,明確哪個是解釋變量,哪個是預報變量;
(2)畫出確定好的解釋變量和預報變量的散點圖,觀察它們之間的關系(是否存在非線性關系);
(3)由經驗確定非線性回歸方程的類型(如我們觀察到數據呈非線性關系,一般選用反比例函數、
二次函數、指數函數、對數函數、幕函數模型等);
(4)通過換元,將非線性回歸方程模型轉化為線性回歸方程模型;
(5)按照公式計算線性回歸方程中的參數(如最小二乘法),得到線性回歸方程;
(6)消去新元,得到非線性回歸方程;
(7)得出結果后分析殘差圖是否有異常.若存在異常,則檢查數據是否有誤,或模型是否合適等.
【診斷自測】某人新房剛裝修完,為了監測房屋內空氣質量的情況,每天在固定的時間測一次甲醛濃度
(單位:mg/m3),連續測量了10天,所得數據繪制成散點圖如下:用y,表示第,…,10)天測得的甲
101010
醛濃度,令z,=ln%,經計算得£>,=12.8,£『=385,,氏=60.
i=li=li=\
7上甲醛濃度Mmg/n?)
6
5
4
3
2
1
IIIIIII]]II______
°12345678910天數
⑴由散點圖可知,>與i可用指數型回歸模型進行擬合,請利用所給條件求出回歸方程;(系數精確到o.oi)
(2)已知房屋內空氣中的甲醛濃度的安全范圍是低于0.08mg/m3,則根據(1)中所得回歸模型,該新房裝
修完第幾天開始達到此標準?(參考數據:ln0.08a-2.53)
a'(%一元Xy-歹)^x^.-nxy
附:,=3~n=與,a=y-bx.
方(%-元)2,片_衣2
1=1i=\
知識點4:獨立性檢驗
1、分類變量和列聯表
(1)分類變量:
變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.
(2)列聯表:
①定義:列出的兩個分類變量的頻數表稱為列聯表.
②2x2列聯表.
一般地,假設有兩個分類變量X和匕它們的取值分別為{不,三}和{必,8},其樣本頻數列聯表
(稱為2x2列聯表)為
總計
多aba+b
九2Cdc+d
總計a+cb+dn=a+b+c+d
從2x2列表中,依據,^與,的值可直觀得出結論:兩個變量是否有關系.
a+bc+d
2、等高條形圖
(1)等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖表示
列聯表數據的頻率特征.
(2)觀察等高條形圖發現^與」二相差很大,就判斷兩個分類變量之間有關系.
a+bc+a
3、獨立性檢驗
計算隨機變量/=-----^ad-bcf-------利用/的取值推斷分類變量X和y是否獨立的方法稱為
(a+b)(c+d)(a+c)(Z?+d)
了獨立性檢驗.
oc0.100.050.0100.0050.001
2.7063.8416.6357.87910.828
【診斷自測】近年中國新能源汽車進入高速發展時期.專家預測2024年中國汽車總銷售量將超過3100萬輛,
繼續領跑全球.為了了解廣大消費者購買新能源汽車意向與年齡是否具有相關性,某汽車APP采用問卷調
查形式對400名消費者進行調查,數據顯示這400人中中老年人共有150人,且愿意購買新能源車的人數
是愿意購買燃油車的2倍;青年中愿意購買新能源車的人數是愿意購買燃油車的4倍.
購車意向
年齡段合計
愿意購買新能源車愿意購買燃油車
青年
中老年
合計
(1)完善2x2列聯表,請根據小概率值a=0.01的獨立性檢驗,分析消費者對新能源車和燃油車的意向購買
與年齡是否有關;
(2)采用分層隨機抽樣從愿意購買新能源車的消費者中抽取9人,再從這9人中隨機抽取4人,求這4人中
青年人數的期望.
2n^ad-bcX
附:”(a+b)(c+d)(a+c)(b+d)'n=a+b+c+d.
a0.050.010.001
Xa3.8416.63510.828
解題方法總結
常見的非線性回歸模型
(1)指數函數型_y=ca"(。>0且4W1,C>0)
兩邊取自然對數,Iny=In(cct',即Iny=lnc+xlna,
\y'=\ny
令,,原方程變為y=lnc+31na,然后按線性回歸模型求出Ina,Inc.
[x=x
(2)對數函數型y=61nx+a
令11一:,原方程變為了=法,+°,然后按線性回歸模型求出在,?.
[X=lnx
(3)籍函數型丁="〃
兩邊取常用對數,lgy=lg(G;〃),即lgy=〃lgx+lga,
y'Tgy
令,I,原方程變為V=n/+lga,然后按線性回歸模型求出〃,Iga.
x=lgx
(4)二次函數型丁=-2+.
令],原方程變為y'=fo/+a,然后按線性回歸模型求出心心
[x=x
(5)反比例函數型y=a型
x
丁二y
令1,原方程變為V=-a,然后按線性回歸模型求出心?.
%'=—
、%
題型洞察
題型一:變量間的相關關系
【典例1-1】已知5個成對數據(x,y)的散點圖如下,若去掉點。(4,3),則下列說法正確的是()
/(1,4)
,.5(2,3.5)
.?£>(4,3)
C(3,2.5)
_______________
Ox
A,變量x與變量y呈正相關B.變量x與變量y的相關性變強
C.殘差平方和變大D.樣本相關系數廠變大
【典例1-2]已知4表示變量無與y之間的相關系數,4表示變量”與v之間的相關系數,且4=0.836,
=-0.958,貝U()
A.變量x與y之間呈正相關關系,且無與y之間的相關性強于a與v之間的相關性
B.變量尤與y之間呈負相關關系,且x與y之間的相關性強于“與v之間的相關性
C.變量〃與v之間呈負相關關系,且尤與y之間的相關性弱于a與v之間的相關性
D.變量a與v之間呈正相關關系,且x與y之間的相關性弱于〃與v之間的相關性
【方法技巧】
判定兩個變量相關性的方法
(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關;點的分布從左上角到右下角,兩個
變量負相關.
(2)樣本相關系數:當廠>0時,正相關;當K0時,負相關;川越接近于1,相關性越強.
(3)經驗回歸方程:當g>0時,正相關;當信0時,負相關.
【變式1-1】某校學生科研興趣小組為了解1~12歲兒童的體質健康情況,隨機調查了20名兒童的相關數
據,分別制作了肺活量、視力、肢體柔韌度、BMI指數和身高之間的散點圖,則與身高之間具有正相關關
系的是()
視
力
身
O高
⑷
肢BK/
指a
體
數
柔I
韌
度
O)身高O*身高
A.肺活量B.視力C.肢體柔韌度D.BMI指數
【變式1-2]對變量x,y由觀測數據得散點圖1;對變量",v由觀測數據得散
點圖2.々表示變量x,y之間的線性相關系數,4表示變量",v之間的線性相關系數,則下列說法正確的
是()
A.變量x與y呈現正相關,且團>閆B.變量x與y呈現負相關,且閆
C.變量〃與v呈現正相關,且田〉⑻D.變量M與v呈現負相關,且值|〈人|
【變式1-3](2024.江西南昌?三模)如圖對兩組數據x,>和v,"分別進行回歸分析,得到散點圖如圖,
并求得線性回歸方程分別是y=+q和"=%>,+/,并對變量X,了進行線性相關檢驗,得到相關系數4,
對變量*“進行線性相關檢驗,得到相關系數4,則下列判斷正確的是()
A.々>0B.<0C.H|<|^|D.rx+r2<0
【變式1-4](2024?遼寧葫蘆島?一模)己知變量x與y的回歸直線方程為y=3x-l,變量y與Z負相關,則
A.X與y負相關,x與Z負相關B.x與y正相關,x與z正相關
C.x與>負相關,x與z正相關D.x與y正相關,x與z負相關
題型二:一元線性回歸模型
【典例2-1】(2024?四川成都?模擬預測)已知關于x的一組數據:
X1m345
y0.50.6n1.31.4
根據表中數據得到的線性回歸直線方程為9=028X+0.16,則,7-0.28m的值
【典例2-2】(2024?四川綿陽?三模)根據統計,某蔬菜基地西紅柿畝產量的增加量八百千克)與某種液體
肥料每畝的使用量x(千克)之間的對應數據的散點圖如圖所示.
本”百千克
7
6
5
4
3
。24568x/千克
(1)從散點圖可以看出,可用線性回歸方程擬合>與x的關系,請計算樣本相關系數『并判斷它們的相關程
度;
(2)求y關于X的線性回歸方程夕=去+m并預測液體肥料每畝的使用量為12千克時西紅柿畝產量的增加
量.
£(%一)(%-刃-S(^-^)(x-y)八
附.力=_[皂「=£=3---------------------,a=y-bxt
【方法技巧】
求經驗回歸方程的步驟
川甘算出x,y,左》或自(x,-x)(y,-y),
(步驟一
廠:官@-1)2的值
0
(步驟二H利用公式計算系數點》;
0二二二二二二二二二二二二二
(步驟三H寫出經驗回歸方程9=標+]
【變式2-11某中醫藥企業根據市場調研與模擬,得到研發投入x(億元)與產品收益y(億元)的數據統
計如下:
研發投入X(億元)12345
產品收益y(億元)3791011
⑴計算X,y的相關系數乙并判斷是否可以認為研發投入與產品收益具有較高的線性相關程度?(若
0.3<|r|<0.75,則線性相關程度一般;若|川>0.75,則線性相關程度較高)
(2)求出,關于*的線性回歸方程,并預測若想收益超過20(億元),則需研發投入至少多少億元?(結果保
留一位小數)
汽a-x)(yf-y)
參考公式:回歸直線的斜率和截距的最小二乘法估計公式,相關系數「的公式分別為3=J----------------
f(七-方2
1=1
z(%-5)(%-歹)
555
參考數據:5>廠制2=10,Z(K-刃2=40,2(%-君(%-9)=19.
i=li=li=l
【變式2-2](2024.河南周口.模擬預測)直播帶貨是扶貧助農的一種新模式,這種模式是利用主流媒體的
公信力,聚合銷售主播的力量助力打通農產品產銷鏈條,切實助力農民增收.我國南方某蜜桔種植縣通過
網絡平臺直播銷售蜜桔,其中每箱蜜桔重5千克,單價為40元/箱,己知最近5天單日直播總時長尤(即所
有主播的直播時長之和,單位:小時)與蜜桔的單目銷售量y(單位:百箱)之間的統計數據如下表:
直播總時長工89111215
單日銷售量y6763808085
可用線性回歸模型擬合y與x之間的關系.
(1)試求變量y與尤的線性回歸方程y=bx+a;
(2)若每位主播每天直播的時間不超過4小時,要使每天直播帶貨銷售蜜桔的總金額超過60萬元,則至少
要請幾位主播進行直播?
(3)直播帶貨大大提升銷量的同時,也增加了壞果賠付的成本.該蜜桔平均每箱按80個計算,若客戶在收
到貨時有壞果,則每個壞果要賠付1元.現有甲、乙兩款包裝箱,若采用甲款包裝箱,成本為MIMIM5)
-1
,i=。
32
元/箱,且每箱壞果的個數X服從尸(X=i)=<g),i=l,2,3,4,5;若采用乙款包裝箱,成本為十元/箱,且
0,i=6,…,80
[9.八
——,1=0
16
每箱壞果的個數y服從尸c=o=<g[m,i=1,2,
3.請運用概率統計的相關知識分析,選擇哪款包裝箱獲
0,i=4,5,…,8(
得的利潤更大?
,^(x,-x)(x-y)§
5
附:",a-y-bx,=4218,ZX:=635.
21=1
E(X,.-X)0
Z-1
【變式2-3](2024?全國?模擬預測)氮氧化物是一種常見的大氣污染物,它是由氮和氧兩種元素組成的化
合物,有多種不同的形式.下圖為我國2014年至2022年氮氧化物排放量(單位:萬噸)的折線圖,其中,
年份代碼1?9分別對應年份2014?2022.
年氮氧化物排放量y
(1)是否可用線性回歸模型擬合>與/的關系?請用折線圖和相關系數加以說明;
(2)是否可用題中數據擬合得到的線性回歸模型預測2023年和2033年的氮氧化物排放量?請說明理由.
£(—)(%-9)_
附:相關系數廠二十^1---------------,JI?=3.87.
ZU-n2Z(x-y)2
i=lz=l
題型三:非線性回歸
【典例3-1](多選題)(2024?湖北武漢?二模)在對具有相關關系的兩個變量進行回歸分析時,若兩個變量
不呈線性相關關系,可以建立含兩個待定參數的非線性模型,并引入中間變量將其轉化為線性關系,再利
用最小二乘法進行線性回歸分析.下列選項為四個同學根據自己所得數據的散點圖建立的非線性模型,且散
點圖的樣本點均位于第一象限,則其中可以根據上述方法進行回歸分析的模型有()
,x+c.
A.y=qx+c2xB.y=-------
X+C2
c.y=cx+ln(x+c2)D.
【典例3-2]已知變量x和,之間的關系可以用模型y=來擬合.設z=lny,若根據樣本數據計算可得
1=3.5工=0.9,且x與z的線性回歸方程為z=0.6x+a,則—.(參考數據:
lnO.3?-1.2,lnO.25?-1.4)
【方法技巧】
換元法變成一元線性回歸模型
【變式3-1】紅蜘蛛是柚子的主要害蟲之一,能對柚子樹造成嚴重傷害,每只紅蜘蛛的平均產卵數>(個)
和平均溫度“°C)有關,現收集了以往某地的7組數據,得到下面的散點圖及一些統計量的值.
…為自然對數的底數)哪一個更適合作為平均產
(給出判斷即可,不必說明理由)
⑵由(1)的判斷結果及表中數據,求出,關于x的回歸方程.(計算結果精確到0.1)
-丁)(y-y)國
附:回歸方程中5=去+&花=『-----------=號--------,a=y-bx
支(%-可2夕-戒2
1=11=1
【變式3-2】設某幼苗從觀察之日起,第x天的高度為山川,測得的一些數據如下表所示:
第X/p>
高度*m0479111213
作出這組數據的散點圖發現:>(cm)與x(天)之間近似滿足頭系式y+其中。,匕均為大于。的
常數.
(1)試借助一元線性回歸模型,根據所給數據,用最小二乘法對。,匕作出估計,并求出》關于x的經驗回歸
方程;
(2)在作出的這組數據的散點圖中,甲同學隨機圈取了其中的4個點,記這4個點中幼苗的高度大于]的點
的個數為八其中亍為表格中所給的幼苗高度的平均數,試求隨機變量4的分布列和數學期望.
附:對于一組數據(匕,4),(右,心),…,(v“,H),其回歸直線方程衣=C+用,的斜率和截距的最小二乘
估計分別為6=上,-------,&=4一雨.
Ei
i=l
【變式3-3】紅鈴蟲(Pectinophoragossypiella)是棉花的主要害蟲之一,其產卵數與溫度有關.現收集到
一只紅鈴蟲的產卵數y(個)和溫度x(℃)的8組觀測數據,制成圖1所示的散點圖.現用兩種模型①
>=eto+\②y=c/+d分別進行擬合,由此得到相應的回歸方程并進行殘差分析,進一步得到圖2所示的
殘差圖.
產卵數”個
1殘差
140
2030
0020
80107
——?->
601至20萬、巡26近,&Z2_34就度
40-10
20-20'O
。???1??1?1A-3O
182022242628303234溫度x/C
一模型①9-模型②
圖1產卵數散點圖
圖2兩種模型的殘差圖
根據收集到的數據,計算得到如下值:
8888
XZ?之&-元)Z(Zj-z)(%r)支(口-刃(―)
i=l1=1Z=11=1
252.964616842268850.470308
]8_|8
表中Zj=lny;z=_22Z/;tt=xf;t
O<=13i=l
(1)根據殘差圖,比較模型①、②的擬合效果,哪種模型比較合適?
(2)根據(1)中所選擇的模型,求出,關于,的回歸方程.
附:對于一組數據(以,匕),(牡,彩),…(◎,,/.),其回歸直線0=戊+公。的斜率和截距的最小二乘估計分別為,
、£(例一萬)(匕一U)
6=旦:-----------,a=v-Pm
f(0,一5了
1=1
【變式3-4](2024.福建南平.模擬預測)某大型商場的所有飲料自動售賣機在一天中某種飲料的銷售量了
(單位:瓶)與天氣溫度x(單位:。C)有很強的相關關系,為能及時給飲料自動售賣機添加該種飲料,
該商場對天氣溫度X和飲料的銷售量>進行了數據收集,得到下面的表格:
X10152025303540
y41664256204840968192
經分析,可以用y=。?2&作為,關于,的經驗回歸方程.
(1)根據表中數據,求>關于x的經驗回歸方程(結果保留兩位小數);
(2)若飲料自動售賣機在一天中不需添加飲料的記1分,需添加飲料的記2分,每臺飲料自動售賣機在一天
中需添加飲料的概率均為;,在商場的所有飲料自動售賣機中隨機抽取3臺,記總得分為隨機變量X,求
X的分布列與數學期望.
參考公式及數據:對于一組數據(4,乂),(吃,%),…,(%,乂),經驗回歸方程夕=標+占的斜率和截距的最小
二乘估計公式分別為A=J----------------,a=y-bx-,x=25,^(x,.-x)2=700
1=1
【變式3-5]在國家積極推動美麗鄉村建設的政策背景下,各地根據當地生態資源打造了眾多特色紛呈的
鄉村旅游勝地.某人意圖將自己位于鄉村旅游勝地的房子改造成民宿用于出租,在旅游淡季隨機選取100
天,對當地已有的六間不同價位的民宿進行跟蹤,統計其出租率y1l0°天中?的天數],設民宿租金為X
(單位:元/日),得到如圖的數據散點圖.
卜出租率
1
9
8-.(88,0.91)
7
6二.(128,072)
5
4->(188,0.51)
3_.(288,0.32)
2
1-.(388,0.2)
-*(488,0.16)
100200300400500600租金
(1)若用“出租率”近似估計旅游淡季民宿每天租出去的概率,求租金為388元的那間民宿在淡季內的3天中
至少有2天閑置的概率.
⑵(i)根據散點圖判斷,、=云+。與丫=加+”哪個更適合此模型(給出判斷即可,不必說明理由)?根
據判斷結果求經驗回歸方程.
(ii)若該地一年中旅游淡季約為280天,在此期間無論民宿是否出租,每天都要付出9.9%x的固定成本,
若民宿出租,則每天需要再付出10%x的日常支出成本.試用(i)中模型進行分析,旅游淡季民宿租金定
為多少元時,該民宿在這280天的收益W達到最大.
n
附:記Z,=1叫,X?261,3,5=0.47,z=5,4,一元)(%-力=-221,
1=1
55152
之(七一元)2=121333.3,之卜,一項其一歹卜一0.99,力(z「可、2.2,e?148,e?164,e-?181.
i=li=li=l
【變式3-6](2024?全國?模擬預測)近三年的新冠肺炎疫情對我們的生活產生了很大的影響,當然也影響
著我們的旅游習慣,鄉村游、近郊游、周邊游熱鬧了許多,甚至出現“微度假”的概念.在國家有條不紊的
防疫政策下,旅游又重新回到了老百姓的日常生活中.某鄉村抓住機遇,依托良好的生態環境、厚重的民
族文化,開展鄉村旅游.通過文旅度假項目考察,該村推出了多款套票文旅產品,得到消費者的積極回
應.該村推出了六條鄉村旅游經典線路,對應六款不同價位的旅游套票,相應的價格x與購買人數y的數
據如下表.
旅游線路奇山秀水游古村落游慢生活游親子游采摘游舌尖之旅
套票型號ABCDEF
價格X阮394958677786
經數據分析、描點繪圖,發現價格X與購買人數y近似滿足關系式、=*(,>。力>0),即
lny=blnx+lna(q>0,b>0),對上述數據進行初步處理,其中匕=ln^,vvz.=In,i-\,2,6.
6666
附:①可能用到的數據:2>叱=75.3,Z匕=24.6,2>=18.3,^^=101.4.
Z=1?=1?=11=1
②對于一組數據(匕,%),(彩,叫),…,其回歸直線4=薪+&的斜率和截距的最小二乘估計值分
nn
Z(匕一/)(叱一日)£匕叱一〃麗
另!J為公=――,a=w-bv-
t(匕-琦曲2-疝2
4=1;=1
(1)根據所給數據,求y關于尤的回歸方程.
(2)按照相關部門的指標測定,當套票價格XC[49,81]時,該套票受消費者的歡迎程度更高,可以被認定為
“熱門套票現有三位游客,每人從以上六款套票中購買一款旅游,購買任意一款的可能性相等.若三人
買的套票各不相同,記三人中購買“熱門套票”的人數為X,求隨機變量X的分布列和期望.
題型四:列聯表與獨立性檢驗
【典例4-1】觀察下圖的等高條形圖,其中最有把握認為兩個分類變量x,>之間沒有關系的是()
【典例4-2】(2024?上海金山?二模)為了考察某種藥物預防疾病的效果,進行動物試驗,得到如下圖所示
列聯表:
疾病
藥物合計
未患病患病
服用m50-m50
未服用80-mm-3050
合計8020100
取顯著性水平a=0.05,若本次考察結果支持“藥物對疾病預防有顯著效果”,則2(加24O,〃zeN)的最小
值為_____
n{ad-be)2
(參考公式:/=;參考值:>3.841)?0.05)
(a+b)(c+d)(a+c)(b+d)
【方法技巧】
獨立性檢驗的一般步驟
(1)根據樣本數據制成2x2列聯表.
(2)根據公式/=-----Mad-bc#-------計算.
(a+Z7)(c+d)(a+c)(b+d)
(3)比較爐與臨界值的大小關系,作統計推斷.
【變式4-1](2024?四川成都?模擬預測)在學校食堂就餐成為了很多學生的就餐選擇.學校為了解學生食
堂就餐情況,在校內隨機抽取了100名學生,其中男生和女生人數之比為1:1,現將一周內在食堂就餐超過
8次的學生認定為“喜歡食堂就餐”,不超過8次的學生認定為“不喜歡食堂就餐”.“喜歡食堂就餐”的人數比
“不喜歡食堂就餐”人數多20人,“不喜歡食堂就餐”的男生只有10人.
男生女生合計
喜歡食堂就餐
不喜歡食堂就餐10
合計100
(1)將上面的列聯表補充完整,并依據小概率值a=0.001的獨立性檢驗,分析學生喜歡食堂就餐是否與性別
有關:
⑵用頻率估計概率,從該校學生中隨機抽取10名,記其中“喜歡食堂就餐”的人數為X.事件“X=k”的概
率為P(X=Q,求隨機變量X的期望和方差.
rt(ad-be)2
參考公式:/=其中“=a+6+c+d.
(a+b)(c+d)(a+c)(i>+d)
a0.10.050.010.0050.001
%2.7063.8416.6357.87910.828
【變式4-2](2024?高三?河南焦作?開學考試)交通強國,鐵路先行,每年我國鐵路部門都會根據運輸需求
進行鐵路調圖,一鐵路線/上有自東向西依次編號為1,2,21的21個車站.
(1)為調查乘客對調圖的滿意度,在編號為10和11兩個站點多次乘坐列車尸的旅客中,隨機抽取100名旅
客,得出數據(不完整)如下表所示:
車站編號滿意不滿意合計
102840
113
合計85
完善表格數據并計算分析:依據小概率值a=0.001的獨立性檢驗,在這兩個車站中,能否認為旅客滿意程
度與車站編號有關聯?
(2)根據以往調圖經驗,列車尸在編號為8至14的終到站每次調圖時有;的概率改為當前終到站的西側一站,
2
有]的概率改為當前終到站的東側一站,每次調圖之間相互獨立.已知原定終到站編號為11的列車P經歷
了3次調圖,第3次調圖后的終到站編號記為X,求X的分布列及均值.
2n^ad-bcX
附:”(a+b)(c+1)(a+c)(b+1)'其中〃=a+6+c+d.
a0.10.010.001
Xa2.7066.63510.828
【變式4-3]2024年7月26日,第33屆夏季奧林匹克運動會在法國巴黎正式開幕.人們在觀看奧運比賽的
同時,開始投入健身的行列.某興趣小組為了解成都市不同年齡段的市民每周鍛煉時長情況,隨機從抽取
200人進行調查,得到如下列聯表:
周平均鍛煉時長
年齡合計
周平均鍛煉時間少于4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 虛擬現實藝術治療在創傷后應激中的應用-洞察闡釋
- 輪軌界面振動傳遞路徑分析-洞察闡釋
- 社交媒體與編輯互動-洞察闡釋
- 高價值貨物運輸全險合同保險單
- 倉儲物流保險合同范本
- 菜鳥驛站快遞業務分部轉讓合同模板
- 數字領導力與組織適應性-洞察闡釋
- 車輛運輸合同附帶貨物損失鑒定與賠償規范協議
- 信托產品財產保全及擔保服務協議
- 上市公司財務數據保密及員工保密協議
- 人保農險理賠試題
- Machine-Cmk-設備能力指數Cmk分析表
- 心理健康教育特色學校建設路徑
- 2025年全國保密教育線上培訓考試試題庫【完整版】附帶答案詳解
- (二模)2025年5月濟南市高三高考針對性訓練英語試卷(含答案解析)
- 修腳師勞動合同(新標準版)6篇
- TCHSA-012-2023-兒童口腔疾病治療中靜脈鎮靜技術規范
- 福建農信招聘筆試真題2024
- 三方合伙開店協議合同
- 2025年新疆中考第一次模擬化學試題(含答案)
- ISO27001:2022信息安全管理體系全套文件+表單
評論
0/150
提交評論