




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第八章《成對數據的統計分析》章末復習提升與檢測
知識體系
E(x,-x)(y,-y)
樣本相關系數口;E-
成對數據的變量的相關關系:
,統計相關性
一元線性網歸模型
一元線性回歸模型參數的最小二乘估it:
成
數
X4據
,
A殘差分析
統
的一元線性回歸_b=------------------
2
Z(x-X)2
分
計「模型及其應用ZO-y.)
析
和1建立回歸模型決定系數-中------
斗。「刃2
1=1
2x2列聯表
圖形注,頻率分析
q獨立性檢驗)一
研究兩個分類變「、匕行高堆積條形圖
量之間的關系
算2=Mad-bcy
(fl+Z>)(c+J)(fl+c)(6+6/)
、能力整合
一、線性回歸分析
1.回歸分析是對具有相關關系的兩個變量進行統計分析的一種常用方法.其基本步驟為通過散點圖和經
驗選擇經驗回歸方程的類型,然后通過一定的規則確定出相應的經驗回歸方程,通過一定的方法進行檢驗,
最后應用于實際或對響應變量進行預測.
2.主要培養數學建模和數據分析的素養.
【例1】某村在推進鄉村振興的過程中,把做活鄉村產業作為強村富民的重要抓手,因地制宜推進茶葉種
植,成立了茶葉合作社.為了對茶葉在銷售旺季進行合理定價,合作社進行了市場調研,得到了銷售旺季
時銷量)‘(噸)關于售價x(元/公斤)的散點圖.
60
40
20
(x)
80
60
40
2()
。
⑴求)'關于X的線性回歸方程;
⑵該合作社2023年茶葉總產量為150噸,如果在銷售旺季時售價為250元/公斤,在銷售旺季沒能售出的,
年底以每公斤10。元的價格賣給批發商,則該合作社2023年的總銷售額為多少萬元?
公式及參考數據:了關于x的線性回歸方程為》=八+3其中J-----------,a^y-6x,滅=250,
£(若-才
/=!
3=110,XU-x)(x-y)=-56OO,^(A;-J)2=7000.
I;-l
【解題技法】解決回歸分析問題的一般步驟
(1)畫散點圖.根據已知數據畫出散點圖.
(2/I斷變量的相關性并求經臉回歸方程.通過觀察散點圖,直觀感知兩個變量是否具有相關關系.在此基
礎上,利用最小二乘法求3,a,然后寫出經驗回歸方程.
⑶回歸分析.畫殘差圖或計算代,進行殘差分析.
(4)實際應用.依據求得的經驗回歸方程解決實際問題.
【跟蹤訓練】
如組是某機構統計的某地區2016年至2022年生活垃圾無害化處理量),(單位:萬噸)的折線圖.
、
向
附
g
z1
y.810
魏n
,60
闌
陽n
宏n
也2n0
應.0O0
切).80a....■
防234567
年份代碼f
注:年份代碼1-7分別對應年份2016-2022.
求),關于,的回歸直線方程(系數精確到0.01),并預測2024年該地區生活垃圾無害化處理量.
參考數據:i>=9.32,=40.17,力(5據2=28,
/-??=|r=l
參考公式:回歸方程戶命+G中斜率和截距的最小乘估計公式分別為。=『-----------,a=y-bT.
2(—)2
r-1
二、獨立性檢驗
1.獨立性檢驗研究的問題是有多大把握認為兩個分類變量之間有關系.為此需先列出2X2列聯表,從表
格中可以直觀地得到兩個分類變量是否有關系.另外等高堆積條形圖能更直觀地反映兩個分類變量之間的
情況.獨立性檢驗的思想是可以先假設二者無關系,求隨機變量爐的值,若下大于臨界值,則拒絕假設,
否則,接受假設.
2.通過計算好的值,進而分析相關性結論的可信程度,提升數學運算、數據分析的素養.
【例2】(2023?甲卷(文))一項試驗旨在研究臭氧效應,試驗方案如下:選40只小白鼠,隨機地將其中
20只分配到試驗組,另外20只分配到對照組,試驗組的小白鼠飼養在高濃度臭氧環境,對照組的小白鼠
飼養在正常環境,一段時間后統計每只小白鼠體重的增加量(單位:g).試驗結果如下:
對照組的小白鼠體重的增加量從小到大排序為
25,218.820.221.322.523.225.826.527.530.1
26.634.334.835.635.635.836.237.340.543.2
試驗組的小白鼠體重的增加量從小到大排序為
27.89.211.412.413.215.516.518.018.819.2
28.820.221.622.823.623.925.128.232.336.5
(1)計算試驗組的樣本平均數;
(2)(i)求40只小白鼠體重的增加量的中位數加,再分別統計兩樣本中小于〃,與不小于機的數據的個
數,完成如下列聯表;
<m..in
對照組
試驗組
(ii)根據⑺中的列聯表,能否有95%的把握認為小白鼠在高濃度臭氧環境中與在正常環境中體重的增
加量有差異?
*n(ad-bc)2
(a+/?)(<?+d)(a+c)(b+d)
P(K\,k)0.1000.0500.010
k2.7063.8416.635
【解題技法】獨立性檢驗的一般步驟
(1)根據樣本數據制成2X2列聯表.
⑵根據公式/=(“+方Xc+"a+c)3+Q計算”的值?
(3)查表比較了與臨界值的大小關系,作出統計判斷.
【跟蹤訓練】
(2022?甲卷)甲、乙兩城之間的長途客車均由A和8兩家公司運營.為了解這兩家公司長途客車的運行
情況,隨機調查了甲、乙兩城之間的500個班次,得到下面列聯表:
準點班次數未準點班次
數
424020
B21030
(I)根據上表,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;
(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關?
/In(ad-be)2
(a+b)(c+d)(a+c)(b+d)
P(K2..k)0.1000.050().010
k2.7063.8416.635
三,數形結合思想在獨立性檢驗中的應用
1.數形結合思想就是在解決與幾何圖形有關的問題時,將圖形信息轉換成代數信息,利用數量特征,將
其轉化為代數問題;在進行回歸分析時,常利用散點圖、殘差圖等說明線性相關情況或模型的擬合效果.在
獨立性檢驗中,我們常用等高堆積條形圖直觀地反映數據的情況,從而可以粗略地判斷兩個分類變量是否
有關系.
2.主要培養數學抽象和數學運算的素養.
【例3】某機構為了了解患色盲是否與性別有關,隨機抽取了1000名成年人進行調查,在調查的480名
男性中有38名患色盲,520名女性中有6名患色盲,分別利用圖形和獨立性檢驗(〃=0.001)的方法來判斷
患色盲與性別是否有關.
【解題技法】解獨立性檢驗的應用問題的關注點
(1)兩個明確:①明確兩類主體;②明確研究的兩個問題.
(2)兩個準確:①準確畫出2X2列聯表;②準確理解爐.
【跟蹤訓練】
某電視傳媒公司為了解某地區電視觀眾對某類體育節目的收視情況,隨機抽取了100名觀眾進行調查.如
圖所示的是根據調查結果繪制的觀眾日均收看該體育節目時間的頻率分布直方圖.將日均收看該體育節目
時間不低于40分鐘的觀眾稱為“體育迷”.
(1根據已知條件完成下面的2X2列聯表,依據小概率值〃=0.05的獨立性檢驗,能否據此認為“體育迷”
與性別有關?
“體育迷”情況
性別合計
非體育迷體育迷
男
女1055
合計
(2雇上述調查所得到的頻率視為概率.現在從該地區大量電視觀眾中,采用隨機抽樣方法每次抽取1名觀
眾,抽取3次,記被抽取的3名觀眾中的“體育迷”人數為X,若每次抽取的結果是相互獨立的,求*的
分布列,均值E(X)和方差O(X).
a0.050.01
Xa3.8416.635
四、轉化與化歸思想在非線性回歸分析中的應用
1.轉化與化歸思想主要體現在非線性回歸分析中.在實際問題中,并非所有的變量關系均滿足線性關系,
故要選擇適當的函數模型去擬合樣本數據,再通過代數變換,把非線性問題線性化.
2.主要培養數學建模和數學運算的素養.
【例4】數獨是源自18世紀瑞士的一種數學游戲,玩家需要根據9x9盤面上的己知數字,推理出所有剩
余空格的數字,并滿足每一行、每一列、每一個粗線宮(3x3)內的數字均含1-9,不重復.數獨愛好者小明打
算報名參加“絲路杯〃全國數獨大賽初級組的比賽,賽前小明在某數獨4Pp上進行一段時間的訓練,每天的
解題平均速度八秒)與訓練天數天)有關,經統計得到如表的數據:
打天)1234567
八秒)990990450320300240210
(1)現用方舊作為回歸方程模型,請利用表中數據,求出該回歸方科
(2)請用第(1)題的結論預測,小明經過100天訓練后,每天解題的平均速度)’約為多少秒?
參考數據(其中4=一)
t士.7x7
?1.(1
18450.370.55
參考公式:對于一組數據(小匕),(〃2,匕),…,(〃“,匕),其回歸直線y=a+4"的斜率和截距的最小二乘
〃——
2%匕-mt-v
估計公式分別為:0=個-------1,a^v-Btr
2--―
I?”一〃〃
r-1
【解題技法】非線性化的回歸分析問題,畫出已知數據的散點圖,選擇跟散點圖擬合得酸好的函數模型
進行變量代換,作出變換后樣本點的散點圖,用線性回歸模型擬合.
【跟蹤訓練】
中國茶文化博大精深,已知茶水的口感與茶葉類型以及水溫有關.經驗表明,某種綠茶用85c的水泡制,
再等到茶水溫度降至60℃時飲用,可以產生最佳口感.某學習研究小組通過測量,得到了下面表格中的數
據(室溫是2。℃).
泡制時間x!min01234
水溫)/c8579747165
ln(y-20)4.24.14.03.93.8
(1)小組成員根據上面表格中的數據繪制散點圖,并根據散點圖分布情況,考慮到茶水溫度降到室溫(即
20C)就不能再降的事實,決定選擇函數模型),=履,+203之0)來刻畫.
①令z=ln(),-2O),求出z關于,的線性回歸方程;
②利用①的結論,求出y=kcx+20(x>O,c>0)中的Z:與。.
(2)你認為該品種綠茶用85℃的水大約泡制多久后飲用,可以產生最佳口感?
參考數據:log。,,。6=4.8,e如h09/2=66.7,竺^=0.6.參考公式:
667
AA£(內-可(馬-可a
z=bx+a,b=------------,ci=z-bx.
XUE
1=1
章末檢測
(時間:120分鐘,滿分:150分)
一、單項選擇題(本大題共8小題,每小題5分,共40分.在每小題給出的四個選項中,只有一項是符合
題目要求的)
1.為調查中學生近視情況,隨機抽取某校男生150名,女生140名,其中,男生中有80名近視,女生中
有70名近視.在檢驗這些中學生眼睛近視是否與性別有關時,最有說服力的方法是()
A.均值與方差B.排列與組合
C.概率D.獨立性檢驗
2.觀察下列散點圖,則①正相關,②負相關,③不相關,圖中的甲、乙、丙三個散點圖按順序相對應
的是().
???
????????:?????????
■:??:?三二三
OxoXOX
甲乙丙
A.①②③B.②①③C.①③②D.③①②
3.對兩個變量MN進行線性相關性檢驗,得線性相關系數,i=-09872,對兩個變量進行線性相關性檢
驗,得線性相關系數弓=09384,則下列判斷正確的是()
A.變量x與變量》正相關,變量”與變量I,負相關,變量x與變量的線性相關性更強
B.變量上與變量)負相關,變量”與變量V正相關,變量V與變量〉的線性相關性更強
C.變量x與變量)'正相關,變量〃與變量-負相關,變量〃與變量V的線性相關性更強
D.變量X與變量)'負相關,變量〃與變量,正相關,變量〃與變量V的線性相關性更強
4.獨立性檢驗中,假設:變量x與變量丫沒有關系,則在上述假設成立的情況下,估算概率
P(/C2>6.635)?0.01,表示的意義是
A.變量X與變量丫有關系的概率為1%
B.變量X與變量V沒有關系的概率為99.9%
C.變量X與變量y沒有關系的概率為99%
D.變量X與變量y有關系的概率為99%
5.某考察團對全國10大城市進行職工人均工資水平X(千元)與居民人均消費水平y(千元)統計調查
發現,y與x具有相關關系,回歸方程為S,=0.66x+1.562.若某城市居民人均消費水平為7.675(千元),估
計該城市人均消費額占人均工資收入的百分比約為()
A.83%B.72%C.67%D.66%
6.某科研機構為了研究中年人禿頭是否與患有心臟病有關,隨機調查了一些中年人的情況,具體數據如
下表所示:
有心臟病無心臟病
禿發20300
不禿發5450
根據表中數據得叱=衛巴吧竺士幽^15.968,由K210.828斷定禿發與患有心臟病有關,那么
25x750x320x455
這種判斷出錯的可能性為
附表:
P心))0.100.050.0250.0100.0050.001
2.7063.8415.0246.6357.87910.828
A.0.1B.0.05
C.0.01D.0.001
7.相關變量X)’的散點圖如圖所示,現對這兩個變量進行線性相關分析,方案一:根據圖中所有數據,
得到線性回歸方程.V=〃x+q,相關系數為、方案二:剔除點(1。,21),根據剩下數據得到線性回歸直線
方程:y=相關系數為弓.則()
斗
51015x
A.B.Ov&vqvl
C.-1<彳<4<。D.-1</;</j<0
8.用模型>'=。*擬合一組數據組(4yj(,=l,2,3,?,,7),其中百+9++七=7,設z=ln),,得變換后
的線性回歸方程為2=%+4,則),2??=()
A.e70B.e3sC.70D.35
二、多項選擇題(本大題共3小題,每小題6分,共18分.在每小題給出的四個選項中,有多個選項是符
合題目要求的,全部選對的得6分,選對但不全的得3分,有選錯的得U分)
9.下列說法正確的是()
A.在兩個變量、與y的列聯表中,當1。以一尻I越大,兩個變量有關聯的可能性越大
B.若所有樣本點都在經驗回歸方程;,=去+G上,則變量間的相關系數是-1
C.決定系數后越接近1,擬合效果越好
D.獨立性檢驗一定能給出明確的結論
10.已知在最小二乘法原理下,具有相關關系的變量X,),之間的線性回歸方程為k-0九+10.3,且變量
x,y之間的相關數據如表所示,則下列說法錯誤的是()
X681012
y6m32
A.變量X,)’之間呈正相關關系
B.可以預測,當x=20時,y=3.7
C.可求得表中,〃=4.7
D.由表格數據知,該回歸直線必過點(9,4)
11.某大學為了解學生對學校食堂服務的滿意度,隨機調查了50名男生和50名女生,每名學生對食堂的
服務給出滿意或不滿意的評價,得到如下列聯表.經計算/=4.762,則可以推斷出().
、3
A.該學校男生對食堂服務滿意的概率的估計值為:
B.該學校男生比女生對食堂服務更滿意
C.依據a=0.05的獨立性檢驗,可以認為男、女生對該食堂服務的評價有差異
D.依據a=0.01的獨立性檢驗,可以認為男、女生對該食堂服務的評價有差異
三、填空題(本大題共3小題,每小題5分,共15分.把答案填在題中橫線上)
12.某車間為了規定工時定額,需要確定加工零件所花費的時間,為此進行了5次試驗.根據收集到的數
據?如表),由最小二乘法求得經驗回歸方程j=0.67x+54.9.
零件數”個1020304050
加工時間62■758189
j/min
現發現表中有一個數據看不清,請你推斷出該數據的值為.
13.對某臺機器購置后的運營年限x(x=1,2,3,…)與當年利潤y的統計分析知具備線性相關關系,經驗回歸
方程為;=10.47—1.3x,估計該臺機器使用年最合算.
14.某部門通過隨機調查89名工作人員的休閑方式是讀書還是健身,得到的數據如下表:
單位:人
休閑方式
性別合
讀書健身
計
女243155
男82634
合計325789
在犯錯誤的概率不超過________的前提下認為性別與休閑方式有關系.
四、解答題(本大題共5小題,共77分.解答時應寫出必要的文字說明、證明過程或演算步驟)
15.(本小題滿分13分)冶煉某種金屬可以用舊設備或新設名,為了檢驗用這兩種設備生產的產品中所含
雜質的關系,調查結果如表所示.
所含雜質
設備雜質
雜質高
低
舊設備37121
新設備22202
16.(本小題滿分15分)在改革開放40年成就展上某地區某農產品近幾年的產量統計表:
年份201420152016201720182019
年份代碼工123456
年產量(萬噸)6.66.777.17.27.4
(1)根據表中數據,建立)‘關于x的線性回歸方程$,=去+6.
(2)根據線性回歸方程預測2020年該地區該農產品的年產量.
17.(本小題滿分15分)電視傳媒公司為了了解某地區電視觀眾對某類體育節目的收視情況,隨機抽取了
1皿名觀眾進行調查,其中女性有55名.下面是根據調查結果繪制的觀眾日均收看該體育節目時間的頻
率分布直方圖:
頻率
將日均收看該體育節目時間不低于40分鐘的觀眾稱為“體育迷”,已知“體育迷”中有10名女性.
單位:人
是否為體育迷
性別合計
非體育迷體育迷
男
女
合計
⑴根據已知條件完成2X2列聯表,并據此資料你是否認為“體育迷”與性別有關?
⑵將日均收看該體育項目不低于50分鐘的觀眾稱為“超級體育迷”,己知“超級體育迷”中有2名女性,
若從“超級體育迷”中任意選取2人,求至少有1名女性觀眾的概率.
______n(ad-bc)2______
附:參考公式:/=〃》+
(a+b)(c+d)(a+c)(b+d)'=a+c+d.
a0.050.01
Xa3.8416.635
18.(本小題滿分17分)互聯網使我們的生活日益便捷,網絡外賣也開始成為不少人日常生活中不可或缺
的一部分,某市一調查機構針對該市市場占有率較高的甲,乙兩家網絡外賣企業(以下稱外賣甲、外賣乙)
的經營情況進行了調查,調查結果如下表:
1日2日3日4日5日
外賣甲日接單x(百單)529811
外賣乙日接單(百單)2310515
(1)試根據表格中這五天的日接單量情況,從統計的角度說明這兩家外賣企業的經營狀況;
(2)據統計表明,》與X之間具有線性相關關系.
①請用相關系數,?對與工之間的相關性強弱進行判斷;(若1川〉0.75,則可認為y與1有較強的線性相
關關系,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 綠色能源管理協議
- 公管保研面試題庫及答案
- 地鐵筆試題目及答案詳解
- 2025年心理健康教育專業考試試題及答案
- 地方方言考試試題及答案
- 2025年心理健康教育考試試題及答案
- 德語素質考試試題及答案
- 2025年土木工程施工與管理考試卷及答案總結
- 2025年文秘專業職稱考試試卷及答案
- 德邦面試筆試題目及答案
- DBJD25-67-2019甘肅省建筑與裝飾工程預算定額地區基價不含稅下冊
- 2024-2025學年部編版一年級下學期期末語文試卷(含答案)
- 2025年河北省青縣事業單位公開招聘衛生崗考前沖刺題帶答案
- 2025年中考化學復習新題速遞之科學探究題(2025年4月)
- 2025年團組織活動入團考試試題及答案
- 2025年全國保密教育線上培訓考試試題庫附答案(完整版)含答案詳解
- 2024-2025粵教粵科版科學一年級下冊期末考試卷附答案
- 北京市東城區2023-2024學年五年級下學期語文期末試卷(含答案)
- 千與千尋模板電影分享
- GB/T 37507-2025項目、項目群和項目組合管理項目管理指南
- 完整的離婚協議書打印電子版(2025年版)
評論
0/150
提交評論