




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
專題52統(tǒng)計(jì)案例
【題型歸納目錄】
題型一:變量間的相關(guān)關(guān)系
題型二:線性回歸
題型三:非線性回歸
題型四:獨(dú)立性檢驗(yàn)
題型五:誤差分析
【考點(diǎn)預(yù)測(cè)】
知識(shí)點(diǎn)一、變量間的相關(guān)關(guān)系
1、變量之間的相關(guān)關(guān)系
當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫相關(guān)關(guān)系.由于
相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計(jì)發(fā)揮著非常重要的作用.我們可以通過收
集大量的數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對(duì)它們的關(guān)系作出判斷.
注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,
而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.
2、散點(diǎn)圖
將樣本中的n個(gè)數(shù)據(jù)點(diǎn)(x,,%)(i=1,2,)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖.根據(jù)散點(diǎn)圖
中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.
(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它
稱為正相關(guān),如圖(1)所??;
(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它
稱為負(fù)相關(guān),如圖(2)所不.
y
???????
,??
,*
o5;o
(1)(2)
3、相關(guān)系數(shù)
若相應(yīng)于變量X的取值X,,變量y的觀測(cè)值為y(1<i<ri),則變量x與y的相關(guān)系數(shù)
n__
E(X]-x)(%-y)^x^-nxy
?2L,通常用廠來衡量x與y之間的線性關(guān)系的強(qiáng)弱,r
唇廠孩唇:-方
的范圍為一.
(1)當(dāng)r>0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)廠<0時(shí),表示兩個(gè)變量負(fù)相關(guān).
(2)W越接近1,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);H越接近0,表示兩個(gè)變量間幾乎不存在線性相
關(guān)關(guān)系.當(dāng)加=1時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.
(3)通常當(dāng)|廠|>0.75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.
知識(shí)點(diǎn)二、線性回歸
1、線性回歸
線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.
對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(尤1,yi),(%2,J2),...,(X",y"),其回歸方程y=加+。的求法為
〃__“__
£-尤)(yt-v)£X:yt-nxy
b=^—^---------------------T--------------------
一彳了一屋
i=li=\
a=y-bx
其中,X=~txi,y=-tyi'(x,y)稱為樣本點(diǎn)的中心.
n/=in,=i
2、殘差分析
對(duì)于預(yù)報(bào)變量y,通過觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值y,通過回歸方程得到的y稱為預(yù)測(cè)值,觀測(cè)值減去
預(yù)測(cè)值等于殘差,自稱為相應(yīng)于點(diǎn)(七,y)的殘差,即有=殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對(duì)殘
差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分
析.
U)殘差圖
通過殘差分析,殘差點(diǎn)&,自)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這樣
的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.
(2)通過殘差平方和。=£(?-%)2分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;
;=|
反之,不合適.
(3)相關(guān)指數(shù)
Z(y-y,-)2
用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:R2=I--=1'".
Z(2)2
/=!
代越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.
知識(shí)點(diǎn)三、非線性回歸
解答非線性擬合問題,要先根據(jù)散點(diǎn)圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線
性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.
求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計(jì)算方法計(jì)算變換后的線性回歸方程系數(shù),還原
后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報(bào)預(yù)測(cè),注意計(jì)算要細(xì)心,避免計(jì)算錯(cuò)誤.
1、建立非線性回歸模型的基本步驟:
(1)確定研究對(duì)象,明確哪個(gè)是解釋變量,哪個(gè)是預(yù)報(bào)變量;
(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);
(3)由經(jīng)驗(yàn)確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、二
次函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)、幕函數(shù)模型等);
(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;
(5)按照公式計(jì)算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;
(6)消去新元,得到非線性回歸方程;
(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.
知識(shí)點(diǎn)四、獨(dú)立性檢驗(yàn)
1、分類變量和列聯(lián)表
(1)分類變量:
變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.
(2)列聯(lián)表:
①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.
②2x2列聯(lián)表.
一般地,假設(shè)有兩個(gè)分類變量X和匕它們的取值分別為{xl,尤2}和{yl,y2],其樣本頻數(shù)列聯(lián)表(稱
為2x2列聯(lián)表)為
%為總計(jì)
%aba+b
x2Cdc+d
總計(jì)a+cb+da+b+c+d
從2x2列表中,依據(jù)‘二與工的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.
a+bc+d
2、等高條形圖
(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖表示
列聯(lián)表數(shù)據(jù)的頻率特征.
(2)觀察等高條形圖發(fā)現(xiàn),二與上相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.
a+bc+d
3、獨(dú)立性檢驗(yàn)
(1)定義:利用獨(dú)立性假設(shè)、隨機(jī)變量K2來確定是否有一定把握認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法
稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn).
(2)公式:K2=---------------------------------,其中〃=a+O+c+d為樣本容量.
(a+b)(c+d)(a+c)(b+d)
(3)獨(dú)立性檢驗(yàn)的具體步驟如下:
①計(jì)算隨機(jī)變量K?的觀測(cè)值%,查下表確定臨界值即:
2
P(K>k0)0.50.400.250.150.100.050.0250.0100.0050.001
k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828
②如果左2%,就推斷“x與y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過/(片?%);否則,就認(rèn)為在犯
錯(cuò)誤的概率不超過°(片?片)的前提下不能推斷“乂與/有關(guān)系”.
(2)兩個(gè)分類變量X和y是否有關(guān)系的判斷標(biāo)準(zhǔn):
統(tǒng)計(jì)學(xué)研究表明:
當(dāng)Q43.841時(shí),認(rèn)為X與Y無關(guān);
當(dāng)3.841時(shí),有95%的把握說X與Y有關(guān);
當(dāng)片>6.635時(shí),有99%的把握說X與/有關(guān);
當(dāng)片>10.828時(shí),有99.9%的把握說X與¥有關(guān).
【方法技巧與總結(jié)】
常見的非線性回歸模型
(1)指數(shù)函數(shù)型〉=。優(yōu)(。>0且awl,c>0)
兩邊取自然對(duì)數(shù),Iny=In[cax),即Iny=lnc+xlna,
令[y,'=lny,原方程變?yōu)閥=lnc+尤'Ina,然后按線性回歸模型求出In。,Inc.
[x=X
(2)對(duì)數(shù)函數(shù)型y=+a
令=y,原方程變?yōu)閥'=bx'+a,然后按線性回歸模型求出6,a.
[x=Inx
(3)塞函數(shù)型y=ax〃
兩邊取常用對(duì)數(shù),lgy=lg(ax〃),即lgy=mgx+lga,
令,原方程變?yōu)閥'=nr'+lga,然后按線性回歸模型求出”,Iga.
[x=Igx
(4)二次函數(shù)型y=區(qū)2+。
令:,原方程變?yōu)閥'=6x'+a,然后按線性回歸模型求出6,?.
[X=X
(5)反比例函數(shù)型y=a+9型
y'=y
令,1,原方程變?yōu)閥'=6x'+“,然后按線性回歸模型求出6,a.
X=—
、X
【題型歸納目錄】
題型一:變量間的相關(guān)關(guān)系
題型二:線性回歸
題型三:非線性回歸
題型四:獨(dú)立性檢驗(yàn)
題型五:誤差分析
【典例例題】
題型一:變量間的相關(guān)關(guān)系
例1.(2022?上海嘉定?高三階段練習(xí))通過抽樣調(diào)研發(fā)現(xiàn),當(dāng)?shù)氐谌径鹊尼t(yī)院心腦血管疾病的人數(shù)和便利
店購(gòu)買冷飲的人數(shù)的相關(guān)系數(shù)很高,甲認(rèn)為這是巧合,兩者其實(shí)沒有關(guān)系:乙認(rèn)為冷飲的某種攝入成分導(dǎo)
致了疾??;丙認(rèn)為病人對(duì)冷飲會(huì)有特別需求:丁認(rèn)為兩者的相關(guān)關(guān)系是存在的,但不能視為因果,請(qǐng)判斷
哪位成員的意見最可能成立()
A.甲B.乙C.丙D.丁
例2.(2022?四川?成都七中高三階段練習(xí)(理))某統(tǒng)計(jì)部門對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析后,獲得如圖所示的
散點(diǎn)圖.
35
30
25
20
15
10
5
V5101520253035
相關(guān)系數(shù)為八
35f-----------------------------
30-.
25-
20-
15-.,
io-.?
5-J*,
5101520253035
相關(guān)系數(shù)為「3相關(guān)系數(shù)為&
下面關(guān)于相關(guān)系數(shù)的比較,正確的是)
A.B.r2<r^<rx<r3C.D.
例3.(2022?上海交大附中高三階段練習(xí))某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動(dòng)物數(shù)量有
所增加.為調(diào)查該地區(qū)某種野生動(dòng)物的數(shù)量,將其分成面積相近的200個(gè)地塊,從這些地塊中用簡(jiǎn)單隨機(jī)抽
樣的方法抽取20個(gè)作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(4%)?=1,2,…,20),其中天和力分別表示第,個(gè)樣區(qū)的
2020
植物覆蓋面積(單位:公頃)和這種野生動(dòng)物的數(shù)量(單位:頭),并計(jì)算得£七=60,2%=1200,
Z=1Z=1
20_220_20
=80,X(X-y)2=9000,£卜廠尤)(%->)=800.
z=li=\i=l
(1)估計(jì)該地區(qū)這種野生動(dòng)物的數(shù)量;
⑵求樣本(%,%)?=1,2,…,20)的相關(guān)系數(shù).(精確到0.01)
變式1.(2022?陜西?寶雞市陳倉(cāng)高級(jí)中學(xué)高三開學(xué)考試(理))對(duì)兩個(gè)變量無,y進(jìn)行線性相關(guān)檢驗(yàn),得線性
相關(guān)系數(shù)〃=0.8995,對(duì)兩個(gè)變量a,v進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)-0.9568,則下列判斷正確
的是()
A.變量x與y正相關(guān),變量“與v負(fù)相關(guān),變量尤與y的線性相關(guān)性較強(qiáng)
B.變量x與y負(fù)相關(guān),變量〃與v正相關(guān),變量x與y的線性相關(guān)性較強(qiáng)
C.變量x與y正相關(guān),變量〃與v負(fù)相關(guān),變量〃與v的線性相關(guān)性較強(qiáng)
D.變量尤與y負(fù)相關(guān),變量"與v正相關(guān),變量"與v的線性相關(guān)性較強(qiáng)
變式2.(2022?全國(guó)?高三專題練習(xí))甲、乙、丙、丁四位同學(xué)各自對(duì)兩變量的線性相關(guān)性做試驗(yàn),分別求
得樣本相關(guān)系數(shù)/,如下表:
甲乙丙T
r0.20-0.95-0.120.85
則試驗(yàn)結(jié)果中蒼丁兩變量有更強(qiáng)線性相關(guān)性的是()
A.甲B.乙C.丙D.丁
變式3.(2022.江蘇.南京市第一中學(xué)高三階段練習(xí))某網(wǎng)絡(luò)電視劇已開播一段時(shí)間,其每日播放量有如下統(tǒng)
計(jì)表:
開播天數(shù)X(單
12345
位:天)
當(dāng)天播放量y
335910
(單位:百萬
次)
(1)請(qǐng)用線性回歸模型擬合y與x的關(guān)系,并用相關(guān)系數(shù)加以說明;
(2)假設(shè)開播后的兩周內(nèi)(除前5天),當(dāng)天播放量y與開播天數(shù)尤服從(1)中的線性關(guān)系.若每百萬播放量
可為制作方帶來0.7萬元的收益,且每開播一天需支出1萬元的廣告費(fèi),估計(jì)制作方在該劇開播兩周內(nèi)獲得
的利潤(rùn).
參考公式:/,石二口七------------,a=y-bx.
歸x"歸y"自…
555_____
參考數(shù)據(jù):^xiyi=110,2%;=55,=224,7110-10.5.
i=li=li=l
注:①一般地,相關(guān)系數(shù)r的絕對(duì)值在0.95以上(含0.95)認(rèn)為線性相關(guān)性較強(qiáng);否則,線性相關(guān)性較弱.
②利潤(rùn)=收益一廣告費(fèi).
題型二:線性回歸
例4.(2022.重慶南開中學(xué)高三階段練習(xí))重慶位于北半球亞熱帶內(nèi)陸地區(qū),其氣候特征恰如幾句俗諺:春
早氣溫不穩(wěn)定,夏長(zhǎng)酷熱多伏旱,秋涼綿綿陰雨天,冬暖少雪云霧多.尤其是10月份,晝夜溫差很大,某
數(shù)學(xué)興趣小組欲研究晝夜溫差大小與患感冒人數(shù)多少之間的關(guān)系,他們分別到氣象局與某醫(yī)院抄錄了2021
年10月某六天的晝夜溫差情況與因患感冒而就診的人數(shù),得到如下資料:
日期第一日第三日第五日第四日第二日第六日
晝夜溫差X(℃)47891214
就診人數(shù)y(個(gè))%%%%)6
66_2
其中:%eN*,i=\,2,3,4,5,6,參考數(shù)據(jù):=2658,=258,7258?16.
i=li=l'
(D根據(jù)散點(diǎn)圖可以認(rèn)為x與y之間存在線性相關(guān)關(guān)系,且相關(guān)系數(shù)r=三,請(qǐng)用最小二乘法求出線性回歸
方程y=6x+a(?,b用分?jǐn)?shù)表示);
(2)分析數(shù)據(jù)發(fā)現(xiàn):第六日就診人數(shù)%=3。,第一日就診患者中有3個(gè)小孩,其他患者全是大人,現(xiàn)隨機(jī)的
Q
從第一日所有就診患者中選出2人,若2人中至少有一個(gè)小孩的概率為二;
①求%的值;
②若%<%<%<為,求%,為,>4,%的值(只寫結(jié)果,不要求過程).
2(%-磯%
(參考公式:J————a=y-b'X,
Z")
i=\
例5.(2022?全國(guó)?高三專題練習(xí))已知龍,丁的取值如表:
X0134
ya4.34.86.7
若X,y具有線性相關(guān)關(guān)系,且回歸方程為9=0.95x+2.6,則。=
例6.(2022?河北衡水?高三階段練習(xí))已知一組樣本數(shù)據(jù)(多,yj,(々,坊),…,(%,%)"22,占,巧,...,
乙不相等),若這組數(shù)據(jù)的樣本相關(guān)系數(shù)為T,則在這組樣本數(shù)據(jù)的散點(diǎn)圖中,所有樣本點(diǎn)(4》)(1=1,
2,〃)所在的曲線可能是()
A.y=-2x+3B.y=x+3C.y=-x1+3D.y=?+3
變式4.(2022?全國(guó)?高三專題練習(xí)(文))給出下列說法:①回歸直線夕=嬴+&恒過樣本點(diǎn)的中心丘,7),
且至少過一個(gè)樣本點(diǎn);②兩個(gè)變量相關(guān)性越強(qiáng),則相關(guān)系數(shù)⑺就越接近1;③將一組數(shù)據(jù)的每個(gè)數(shù)據(jù)都加
一個(gè)相同的常數(shù)后,方差不變;④在回歸直線方程3=2-0.5x中,當(dāng)解釋變量x增加一個(gè)單位時(shí),預(yù)報(bào)變量
亍平均減少0.5個(gè)單位.其中說法正確的是()
A.①②④B.②③④C.①③④D.②④
變式5.(2022?全國(guó)?高三專題練習(xí))對(duì)于數(shù)據(jù)組(專切[=1,2,3,...,“),如果由線性回歸方程得到的對(duì)應(yīng)于自
變量者的估計(jì)值是力,那么將稱為相應(yīng)于點(diǎn)(乙,%)的殘差.某工廠為研究某種產(chǎn)品產(chǎn)量無(噸)與
所需某種原材料丫噸)的相關(guān)性,在生產(chǎn)過程中收集4組對(duì)應(yīng)數(shù)據(jù)(x,y)如下表所示:
X3456
y2.534m
根據(jù)表中數(shù)據(jù),得出,關(guān)于x的線性回歸方程為y=0.7x+〃,據(jù)此計(jì)算出樣本點(diǎn)(4,3)處的殘差為一0.15,
則表中m的值為()
A.3.3B.4.5C.5D.5.5
變式6.(2022.全國(guó)?高三專題練習(xí))已知兩個(gè)變量工和,之間有線性相關(guān)關(guān)系,經(jīng)調(diào)查得到如下樣本數(shù)據(jù),
X34567
y3.52.41.1-0.2-1.3
根據(jù)表格中的數(shù)據(jù)求得同歸方程亍=%+&,則下列說法正確的是()
A.a>0,b>0B.a>0,b<0
C.a<0,b>0D.a<0,b<0
變式7.(2022.全國(guó)?高三專題練習(xí))為研究某種細(xì)菌在特定環(huán)境下,隨時(shí)間變化的繁殖情況,得到如下實(shí)驗(yàn)
數(shù)據(jù):
天數(shù)X(天)3456
繁殖個(gè)數(shù)y(千個(gè))2.5344.5
由最小二乘法得>與x的線性回歸方程為3=0.7x+&,則當(dāng)x=7時(shí),繁殖個(gè)數(shù)》的預(yù)測(cè)值為()
A.4.9B.5.25
C.5.95D.6.15
變式8.(2022?北京師大附中高三階段練習(xí)(文))為了規(guī)定工時(shí)定額,需要確定加工某種零件所需的時(shí)間,
為此進(jìn)行了5次試驗(yàn),得到5組數(shù)據(jù):(工,%),(孫力),(毛,%),(%,%),(%,%),由最小二乘法求得回歸直線
方程為y=0.67x+54.9.若己知占+々+%+%+%=15°,則%+%+%+%+%=
A.75B.155.4C.375D.466.2
變式9.(2022?廣東?順德一中高三階段練習(xí))據(jù)一組樣本數(shù)據(jù)(%,%),(々,為),…,(%,%),求得經(jīng)驗(yàn)回歸
方程為a=L5x+0.5,且;=3.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個(gè)樣本點(diǎn)(122.2)和(4.8,7.8)誤差較大,去除后
重新求得的經(jīng)驗(yàn)回歸直線/的斜率為1.2,則()
A.去除兩個(gè)誤差較大的樣本點(diǎn)后,丁的估計(jì)值增加速度變快
B.去除兩個(gè)誤差較大的樣本點(diǎn)后,重新求得的回歸方程一定過點(diǎn)(3,4)
C.去除兩個(gè)誤差較大的樣本點(diǎn)后,重新求得的回歸方程為a=L2x+L4
D.去除兩個(gè)誤差較大的樣本點(diǎn)后,相應(yīng)于樣本點(diǎn)(2,3.75)的殘差為0.05
變式10.(2022.全國(guó)?高三專題練習(xí))新冠肺炎疫情發(fā)生以來,中醫(yī)藥全面參與疫情防控救治,做出了重要
貢獻(xiàn).某中醫(yī)藥企業(yè)根據(jù)市場(chǎng)調(diào)研與模擬,得到研發(fā)投入億元)與產(chǎn)品收益y(億元)的數(shù)據(jù)統(tǒng)計(jì)如下:
研發(fā)投入X(億元)12345
產(chǎn)品收益y(億元)3791011
(1)計(jì)算X,y的相關(guān)系數(shù)r,并判斷是否可以認(rèn)為研發(fā)投入與產(chǎn)品收益具有較高的線性相關(guān)程度?(若
0.3<|r|<0.75,則線性相關(guān)程度一般,若|川>0.75,則線性相關(guān)程度較高)
(2)求出y關(guān)于x的線性回歸方程,并預(yù)測(cè)研發(fā)投入20(億元)時(shí)產(chǎn)品的收益.
555
2
參考數(shù)據(jù):£(尤,-可2=10,E(x-y)=4o,^(x,-x)(z-y)=i9.
z=li=li=l
附:相關(guān)系數(shù)公式:r=「,回歸直線方程的斜率A=J-----------------,截距
Vi=lVz=li-l
d=y-bx.
變式11.(2022.全國(guó)?模擬預(yù)測(cè)(文))2020年,國(guó)慶“遇上”中秋,中國(guó)人把這個(gè)“超長(zhǎng)黃金周”過出了年味.
假期期間,全國(guó)各大旅游景點(diǎn)、車站、機(jī)場(chǎng)人頭攢動(dòng)的景象也吸引了世界的目光.外國(guó)媒體、專家和網(wǎng)友“實(shí)
名羨慕”,這一派熱鬧景象證明了抗疫的成功,也展示了中國(guó)經(jīng)濟(jì)復(fù)蘇的勁頭.抗疫的成功離不開國(guó)家強(qiáng)大的
醫(yī)療衛(wèi)生體系,下表是某省2013年至2019年醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)》(單位:萬個(gè)):
年份2013201420152016201720182019
年份代號(hào),1234567
醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)y4.24.34.54.74.84.84.9
(1)求y關(guān)于f的線性回歸方程、=命+&(a,3保留兩位小數(shù));
(2)規(guī)定若某年的實(shí)際醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)與估計(jì)值的差的絕對(duì)值不超過500個(gè),則稱該年是“吻合”年.利用(1)
的結(jié)果,假設(shè)2020年該省醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)的估計(jì)值為實(shí)際值,現(xiàn)從2013年至2020年這8年中任選3年,
其中“吻合,,年的個(gè)數(shù)為X,求X的分布列與數(shù)學(xué)期望.
7
參考數(shù)據(jù):工4%=1322,7=4.6.
Z=1
參考公式:線性回歸方程y=中斜率和截距的最小二乘估計(jì)公式分別為:b=「----------,
)
Ef=l"
a=y—bt.
變式12.(2022?全國(guó)?高三專題練習(xí))在我國(guó)抗疫期間,素有“南抖音,北快手”之說的小視頻除了給人們帶
來生活中的快樂外,更在于傳遞了一種正能量,為抗疫起到了積極的作用,但一個(gè)優(yōu)秀的作品除了需要有
很好的素材外,更要有制作上的技術(shù)要求,某同學(xué)學(xué)習(xí)利用“快影”軟件將已拍攝的素材進(jìn)行制作,每次制作
分三個(gè)環(huán)節(jié)來進(jìn)行,其中每個(gè)環(huán)節(jié)制作合格的概率分別為3:,三4,:2,只有當(dāng)每個(gè)環(huán)節(jié)制作都合格才認(rèn)為一
453
次成功制作,該小視頻視為合格作品.
(1)求該同學(xué)進(jìn)行3次制作,恰有一次合格作品的概率;
(2)若該同學(xué)制作10次,其中合格作品數(shù)為X,求X的數(shù)學(xué)期望與方差;
(3)該同學(xué)掌握技術(shù)后制作的小視頻被某廣告公司看中,聘其為公司做廣告宣傳,決定試用一段時(shí)間,每
天制作小視頻(注:每天可提供素材制作個(gè)數(shù)至多40個(gè)),其中前7天制作合格作品數(shù)》與時(shí)間f如下表:(第
f天用數(shù)字t表示)
時(shí)間(,)1234567
合格作品數(shù)(V)3434768
其中合格作品數(shù)(V)與時(shí)間")具有線性相關(guān)關(guān)系,求,關(guān)于「的線性回歸方程(精確到0.01),并估算第14天
能制作多少個(gè)合格作品(四舍五入取整)?
.£占%一“
(參考公式》=號(hào)------=上———7^,6=3-威,參考數(shù)據(jù):1^=163.)
七年-wx-一;=1
z=li=\
題型三:非線性回歸
例7.(2022.廣東.順德一中高三階段練習(xí))在國(guó)家大力發(fā)展新能源汽車產(chǎn)業(yè)的政策下,我國(guó)新能源汽車的產(chǎn)
銷量高速增長(zhǎng).已知某地區(qū)2014年底到2021年底新能源汽車保有量的數(shù)據(jù)統(tǒng)計(jì)表如下:
年份(年)20142015201620172018201920202021
年份代碼X12345678
保有量W千輛1.952.924.386.589.8715.0022.5033.70
888
參考數(shù)據(jù):9=12.1]=2.1,£x;=204,=613.7,£必=92.4,,其中
z=li=lf=l
J=Iny,1g2P0.30,lg3?0.48,1gee0.43.
人力千輛
35
30
25
20
15
10
5
O12345678
(1)根據(jù)統(tǒng)計(jì)表中的數(shù)據(jù)畫出散點(diǎn)圖(如圖),請(qǐng)判斷9=&與5;=e&+<5哪一個(gè)更適合作為y關(guān)于x的經(jīng)驗(yàn)
回歸方程(給出判斷即可,不必說明理由),并根據(jù)你的判斷結(jié)果建立y關(guān)于龍的經(jīng)驗(yàn)回歸方程:
(2)假設(shè)每年新能源汽車保有量按(1)中求得的函數(shù)模型增長(zhǎng),且傳統(tǒng)能源汽車保有量每年下降的百分比相
同.若2021年底該地區(qū)傳統(tǒng)能源汽車保有量為500千輛,預(yù)計(jì)到2026年底傳統(tǒng)能源汽車保有量將下降10%.
試估計(jì)到哪一年底新能源汽車保有量將超過傳統(tǒng)能源汽車保有量.
參考公式:對(duì)于一組數(shù)據(jù)(%,V/),(%,嶺),…,(""M),其經(jīng)驗(yàn)回歸直線£=/"+&的斜率和截距的最小
Z(M;-M)(v;-V)Zujvi-nu-V
二乘估計(jì)公式分別為B=上匕--------=%---------,a=v-^u-,;
22
Z(w;-M)工uf-nu
1=1i=l
例8.(2022?全國(guó)?高三專題練習(xí))2020年的“金九銀十”變成“銅九鐵十”,全國(guó)各地房?jī)r(jià)“跳水”嚴(yán)重,但某地
二手房交易卻“逆市”而行.下圖是該地某小區(qū)2019年11月至2020年H月間,當(dāng)月在售二手房均價(jià)(單位:
萬元/平方米)的散點(diǎn)圖.(圖中月份代碼1至13分別對(duì)應(yīng)2019年H月至2020年11月)()
A當(dāng)月在手二手房
L°4-均儕....
1.02-???*
1.00-??
0.98-?*
0.96-
?
0.94-
°12345678910111213月份代碼x
根據(jù)散點(diǎn)圖選擇、=。+6?和'=。+〃111萬兩個(gè)模型進(jìn)行擬合,經(jīng)過數(shù)據(jù)處理得到的兩個(gè)回歸方程分別為
y=0.9369+0.0285石和y=0.9554+0.0306Inx,并得到以下一些統(tǒng)計(jì)量的值:
)=0.9369+0.0285&y=0.9554+0.03061nx
R20.9230.973
注:£是樣本數(shù)據(jù)中關(guān)的平均數(shù),亍是樣本數(shù)據(jù)中了的平均數(shù),則于列說法不一定成立的是()
A.當(dāng)月在售二手房均價(jià)y與月份代碼x呈正相關(guān)關(guān)系
B.根據(jù)>=0.9369+0.02856可以預(yù)測(cè)2021年2月在售二手房均價(jià)約為1.0509萬元/平方米
C.曲線y=0.9369+0.02854與y=0.9554+0.0306Inx的圖形經(jīng)過點(diǎn)(x,y)
D.y=0.9554+0.0306Inx回歸曲線的擬合效果好于_y=0.9369+0.0285Vx
例9.(2022?全國(guó)?高三專題練習(xí))一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關(guān),現(xiàn)收集了6組觀測(cè)數(shù)據(jù),y(單位:
個(gè))與溫度x(單位:℃)得到樣本數(shù)據(jù)(8%)(i=l,2,3,4,5,6),令z,=ln/,并將(4馬)繪制成
如圖所示的散點(diǎn)圖.若用方程y=ae"對(duì)y與x的關(guān)系進(jìn)行擬合,則()
z八
4■
3-??
2-?,,
1-,
——I——I——I——I——I——I-
20212223242526x
A.a>l,b>0B.a>l,b<0
C.Ovavl,b>0D.0<a<l,b<0
變式13.(2022?全國(guó)?高三專題練習(xí))用模型y=a*M(a>0)擬合一組數(shù)據(jù)時(shí),令z=lny,將其變換后得到
h
回歸直線方程z=2x+a,則一=()
a
A.eB.—C.—D.2
e2
變式14.(2022?全國(guó)?高三專題練習(xí))在一組樣本數(shù)據(jù)(4丹),(巧,%),匕,(天,為)的散點(diǎn)圖中,若所有
7
樣本點(diǎn)(4%)(,=1,2,L,7)都在曲線y=aln(%-1895)+12.15附近波動(dòng),經(jīng)計(jì)算T895)=210.77,
z=i
77
=73.50,^ln(x,.-1895)=23.10,則實(shí)數(shù)。=()
Z=1Z=1
A.一0.5B.0.5C.-iD.1
變式15.(2022?全國(guó)?高三專題練習(xí))如圖是一組實(shí)驗(yàn)數(shù)據(jù)構(gòu)成的散點(diǎn)圖,以下函數(shù)中適合作為》與無的回
歸方程的類型是()
2x
A.y=ax+bB.y=ax+cc.y=b\ogax+cD.y=ba+c
變式16.(2022?全國(guó)?高三專題練習(xí))如圖是一組實(shí)驗(yàn)數(shù)據(jù)構(gòu)成的散點(diǎn)圖,以下函數(shù)中適合作為丫與x的回
歸方程的類型是()
?
x
x
A.y=ax+bB.y=ax"+cC.y=b\ogax+cD.y=ba+c
變式17.(多選題)(2022?全國(guó)?高三專題練習(xí))在對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行回歸分析時(shí),若兩個(gè)變量
不呈線性相關(guān)關(guān)系,可以建立含兩個(gè)待定參數(shù)的非線性模型,并引入中間變量將其轉(zhuǎn)化為線性關(guān)系,再利
用最小二乘法進(jìn)行線性回歸分析.下列選項(xiàng)為四個(gè)同學(xué)根據(jù)自己所得數(shù)據(jù)的散點(diǎn)圖建立的非線性模型,且散
點(diǎn)圖的樣本點(diǎn)均位于第一象限,則其中可以根據(jù)上述方法進(jìn)行回歸分析的模型有()
A.y-cxx+c2x
C.y=q+ln(x+c2)
變式18.(2022?全國(guó)?高三專題練習(xí))我國(guó)為全面建設(shè)社會(huì)主義現(xiàn)代化國(guó)家,制定了從2021年到2025年的“十
四五”規(guī)劃.某企業(yè)為響應(yīng)國(guó)家號(hào)召,匯聚科研力量,加強(qiáng)科技創(chuàng)新,準(zhǔn)備增加研發(fā)資金.現(xiàn)該企業(yè)為了了
解年研發(fā)資金投入額x(單位:億元)對(duì)年盈利額》(單位:億元)的影響,研究了“十二五”和“十三五”規(guī)
劃發(fā)展期間近10年年研發(fā)資金投入額占和年盈利額%的數(shù)據(jù).通過對(duì)比分析,建立了兩個(gè)函數(shù)模型:①
y=a+歐;②y=其中a、夕、彳、t均為常數(shù),e為自然對(duì)數(shù)的底數(shù).令%=X;,”=In%G=1,2,…,10),
經(jīng)計(jì)算得如下數(shù)據(jù):
1010
XS(x-y)2u
Z=1Z=1
26215652680
10°101010
£(x,.-x)(v,.-v)
V力%-7)ZU-7)2
?=1Z=1i=li=\
5.36112501302.612
(1)請(qǐng)從相關(guān)系數(shù)的角度,分析哪一個(gè)模型擬合程度更好?
(2)根據(jù)(1)的選擇及表中數(shù)據(jù),建立y關(guān)于尤的回歸方程;(系數(shù)精確到o.oi)
(3)若希望2021年盈利額y為250億元,請(qǐng)預(yù)測(cè)2021年的研發(fā)資金投入額了為多少億元.(結(jié)果精確到0.01)
變式19.(2022.全國(guó)?高三專題練習(xí))在疫情防控常態(tài)化的背景下,山東省政府各部門在保安全,保穩(wěn)定的
前提下有序恢復(fù)生產(chǎn),生活和工作秩序,五一期間,文旅部門在落實(shí)防控舉措的同時(shí),推出了多款套票文
旅產(chǎn)品,得到消費(fèi)者的積極回應(yīng).下面是文旅部門在某地區(qū)推出六款不同價(jià)位的旅游套票,每款的套票價(jià)
格x(單位:元)與購(gòu)買人數(shù)y(單位:萬人)的數(shù)據(jù)如下表:
旅游類別城市展館科技游鄉(xiāng)村特色游齊魯紅色游登山套票游園套票觀海套票
套票價(jià)格X(元)394958677786
購(gòu)買數(shù)量y(萬人)16.718.720.622.524.125.6
在分析數(shù)據(jù)、描點(diǎn)繪圖中,發(fā)現(xiàn)散點(diǎn)(匕,①集中在一條直線附近,其中”=1叫,co,.=lny;
6666
附:①可能用到的數(shù)據(jù):?>叫=753£匕=246?>產(chǎn)1832>;=101.4.
i=\i=\i=\z=l
②對(duì)于一組數(shù)據(jù)(匕,sj,?,①2),…,3,3”),其回歸直線質(zhì)=加+<5的斜率和截距的最小二乘估計(jì)值分別
£vimi-rivm
^b=—..................,a=m-bv
”-怖2
,=i
(1)根據(jù)所給數(shù)據(jù),求y關(guān)于龍的回歸方程;
ee
(2)按照文旅部門的指標(biāo)測(cè)定,當(dāng)購(gòu)買數(shù)量y與套票價(jià)格x的比在區(qū)間-,-上時(shí),該套票受消費(fèi)者的歡迎
程度更高,可以被認(rèn)定為“熱門套票”,現(xiàn)有三位同學(xué)從以上六款旅游套票中,購(gòu)買不同的三款各自旅游.記
三人中購(gòu)買“熱門套票”的人數(shù)為X,求隨機(jī)變量X的分布列和期望.
變式20.(2022.全國(guó)?高三專題練習(xí))數(shù)據(jù)顯示,中國(guó)在線直播用戶規(guī)模及在線直播購(gòu)物規(guī)模近幾年都保持
高速增長(zhǎng)態(tài)勢(shì),下表為2017—2021年中國(guó)在線直播用戶規(guī)模(單位:億人),其中2017年—2021年對(duì)應(yīng)的
代碼依次為1—5.
年份代碼尤12345
市場(chǎng)規(guī)模y3.984.565.045.866.36
參考數(shù)據(jù):歹=5.16,V=1.68,^v,.y,.=45.10,其中匕=嘉.
1=1
參考公式:對(duì)于一組數(shù)據(jù)(qyj,(v2,%),…,(匕,%),其回歸直線5=加+力的斜率和截距的最小二乘
2匕%一〃藥
估計(jì)公式分別為3=嚀--------,a=y-bv.
2—2
匕一次
Zz=i
(1)由上表數(shù)據(jù)可知,可用函數(shù)模型9=+d擬合y與x的關(guān)系,請(qǐng)建立y關(guān)于x的回歸方程(6,g的值
精確到0.01);
(2)已知中國(guó)在線直播購(gòu)物用戶選擇在品牌官方直播間購(gòu)物的概率為p,現(xiàn)從中國(guó)在線直播購(gòu)物用戶中隨機(jī)抽
取4人,記這4人中選擇在品牌官方直播間購(gòu)物的人數(shù)為X,若P(X=3)=尸(X=4),求X的分布列與期
望.
變式21.(2022?湖南.長(zhǎng)沙市明德中學(xué)高三開學(xué)考試)近期國(guó)內(nèi)疫情反復(fù),對(duì)我們的學(xué)習(xí)生活以及對(duì)各個(gè)行
業(yè)影響都比較大,某房地產(chǎn)開發(fā)公司為了回籠資金,提升銷售業(yè)績(jī),讓公司旗下的某個(gè)樓盤統(tǒng)一推出了為
期10天的優(yōu)惠活動(dòng),負(fù)責(zé)人記錄了推出活動(dòng)以后售樓部到訪客戶的情況,根據(jù)記錄第一天到訪了12人次,
第二天到訪了22人次,第三天到訪了42人次,第四天到訪了68人次,第五天到訪了132人次,第六天到
訪了202人次,第七天到訪了392人次,根據(jù)以上數(shù)據(jù),用x表示活動(dòng)推出的天數(shù),y表示每天來訪的人次,
繪制了以下散點(diǎn)圖.
八川人次)
400
350
300
250
200
150
100
50
O
⑴請(qǐng)根據(jù)散點(diǎn)圖判斷,以下兩個(gè)函數(shù)模型y=a+法與y=(c,d均為大于零的常數(shù))哪一個(gè)適宜作為
人次y關(guān)于活動(dòng)推出天數(shù)元的回歸方程類型?(給出判斷即可,不必說明理由);
(2)根據(jù)(1)的判斷結(jié)果及下表中的數(shù)據(jù),求y關(guān)于元的回歸方程,并預(yù)測(cè)活動(dòng)推出第8天售樓部來訪的入
17
次,參考數(shù)據(jù):其中匕=lg、,v=-Xvz.
'z=l
7
£%匕084
V1O
Z=1
1.8458.556.9
八z七/一〃孫
線性回歸方程:§=》%+金,其中B=t---------丁,金=丁一令%.
2X;-
i=l
(3)己知此樓盤第一天共有10套房源進(jìn)行銷售,其中6套正價(jià)房,4套特價(jià)房,設(shè)第一天賣出的4套房中特
價(jià)房的數(shù)量為久求4的分布列與數(shù)學(xué)期望.
題型四:獨(dú)立性檢驗(yàn)
例10.(2022?江蘇?南京市秦淮中學(xué)高三階段練習(xí))某校為引導(dǎo)學(xué)生學(xué)習(xí)黨史,校黨委宣傳組織了黨史知識(shí)
競(jìng)賽,對(duì)前來參賽的150名學(xué)生(男生100人,女生50人),成績(jī)不低于80分的學(xué)生為“黨史達(dá)人”,成績(jī)
低于80分的學(xué)生為“非黨史達(dá)人”,統(tǒng)計(jì)了他們的成績(jī)情況,結(jié)果如下:男生中有60人被評(píng)為“黨史達(dá)人”,
女生中有40人被評(píng)為“黨史達(dá)人”.
(1)完善列聯(lián)表,并判斷:是否有99%的把握認(rèn)為黨史成績(jī)優(yōu)秀與否與性別有關(guān)?
性別
黨史達(dá)人非黨史達(dá)人
是否為黨史達(dá)人
男生
女生
(2)如果用這150名學(xué)生中,男生和女生“黨史達(dá)人”的頻率分別代替該校男生和女生被評(píng)為“黨史達(dá)人”的概
率,且每位學(xué)生是否被評(píng)為“黨史達(dá)人”相互獨(dú)立,現(xiàn)從該校學(xué)生中隨機(jī)抽取3人(2男1女),設(shè)隨機(jī)變量X
表示“3人中黨史達(dá)人”的人數(shù),試求X的分布列和數(shù)學(xué)期望.
n(ad-bc)2
附:K2=n=a+b+c+d
(a+/?)(c+d)(a+c)(6+d)'
P(K2>k]0.100.050.0250.010.005
k2.7063.8415.0246.6357.879
例11.(2022?四川?樹德中學(xué)高三階段練習(xí)(文))根據(jù)分類變量x與y的觀察數(shù)據(jù),計(jì)算得至1」片=2.974.依
據(jù)下面給出的臨界值表,
0.500.400.250.150.100.050.0250.0100.005
k00.4550.7081.3232.0722.7063.8415.0246.6357.879
可知下列判斷中正確的是()
A.有95%的把握認(rèn)為變量x與y獨(dú)立
B.有95%的把握認(rèn)為變量x與y不獨(dú)立
C.變量x與y獨(dú)立,這個(gè)結(jié)論犯錯(cuò)誤的概率不超過10%
D.變量x與y不獨(dú)立,這個(gè)結(jié)論犯錯(cuò)誤的概率不超過10%
例12.(2022?浙江省蒼南中學(xué)高三階段練習(xí))在新高考改革中,浙江省新高考實(shí)行的是7選3的3+3模式,
即語數(shù)外三門為必考科目,然后從物理、化學(xué)、生物、政治、歷史、地理、技術(shù)(含信息技術(shù)和通用技術(shù))
7門課中選考3門.某校高二學(xué)生選課情況如下列聯(lián)表一和列聯(lián)表二(單位:人)
選物理不選物理總計(jì)
男生340110450
女生140210350
總計(jì)480320800
表一
選生物不選生物總計(jì)
男生150300450
女生150200
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)療APP的個(gè)性化服務(wù)與未來趨勢(shì)
- 醫(yī)療供應(yīng)鏈中的區(qū)塊鏈技術(shù)應(yīng)用與挑戰(zhàn)
- 藝術(shù)管理中的風(fēng)險(xiǎn)管理策略-全面剖析
- 高三數(shù)學(xué)知識(shí)點(diǎn)梳理計(jì)劃
- 公共管理領(lǐng)域領(lǐng)導(dǎo)力提升個(gè)人研修計(jì)劃
- 函數(shù)對(duì)象并行性能評(píng)估-全面剖析
- 細(xì)節(jié)層次圖像處理技術(shù)-全面剖析
- 虛擬環(huán)境下的生物實(shí)驗(yàn)研究-全面剖析
- 三年級(jí)語文經(jīng)典誦讀推廣計(jì)劃
- 線下演出市場(chǎng)2025年演出藝人形象塑造與公關(guān)策略研究報(bào)告
- 2024年1月福建省普通高中學(xué)業(yè)水平合格性考試地理試題(解析版)
- DB11-T 1832.7-2022 建筑工程施工工藝規(guī)程 第7部分:建筑地面工程
- 下水疏通施工合同模板
- 變革管理方案計(jì)劃
- 酒店消防疏散應(yīng)急預(yù)案
- 護(hù)理中醫(yī)院感染問題課件
- 異地就醫(yī)登記備案表
- 空間中的垂直學(xué)案高三數(shù)學(xué)一輪復(fù)習(xí)
- 跨境電子商務(wù)建設(shè)項(xiàng)目管理組織架構(gòu)
- 重慶江北國(guó)際機(jī)場(chǎng)有限公司招聘筆試題庫(kù)2024
- 大學(xué)生英語四級(jí)真題模擬試卷5份
評(píng)論
0/150
提交評(píng)論