第八章 成對數據的統計分析 章末小結及測試(原卷版)人教版高中數學精講精練選擇性必修三_第1頁
第八章 成對數據的統計分析 章末小結及測試(原卷版)人教版高中數學精講精練選擇性必修三_第2頁
第八章 成對數據的統計分析 章末小結及測試(原卷版)人教版高中數學精講精練選擇性必修三_第3頁
第八章 成對數據的統計分析 章末小結及測試(原卷版)人教版高中數學精講精練選擇性必修三_第4頁
第八章 成對數據的統計分析 章末小結及測試(原卷版)人教版高中數學精講精練選擇性必修三_第5頁
已閱讀5頁,還剩21頁未讀 繼續免費閱讀

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

【公眾號:該學習了】第八章成對數據的統計分析章末小結及測試考法一相關系數【例1-1】(2024·山西運城)對變量,有觀測數據,得散點圖1;對變量,有觀測數據,得散點圖2.表示變量,之間的樣本相關系數,表示變量,之間的樣本相關系數,則(

)A. B.C. D.【例1-2】(2024·湖南)某騎行愛好者在專業人士指導下對近段時間騎行鍛煉情況進行統計分析,統計每次騎行期間的身體綜合指標評分與騎行用時(單位:小時)如下表:身體綜合指標評分12345用時小時)9.58.87.876.1由上表數據得到的正確結論是(

)參考數據:參考公式:相關系數.A.身體綜合指標評分與騎行用時正相關B.身體綜合指標評分與騎行用時的相關程度較弱C.身體綜合指標評分與騎行用時的相關程度較強D.身體綜合指標評分與騎行用時的關系不適合用線性回歸模型擬合【例1-3】(2024陜西漢中)大學生劉銘去某工廠實習,實習結束時從自己制作的某種零件中隨機選取了10個樣品,測量每個零件的橫截面積(單位:)和耗材量(單位:),得到如下數據:樣本號12345678910總和零件的橫截面積0.030.050.040.070.070.040.050.060.060.050.52耗材量0.240.400.230.550.500.340.350.450.430.413.9并計算得.(1)估算劉銘同學制作的這種零件平均每個零件的橫截面積以及平均一個零件的耗材量;(2)求劉銘同學制作的這種零件的橫截面積和耗材量的樣本相關系數(精確到0.01);(3)劉銘同學測量了自己實習期制作的所有這種零件的橫截面積,并得到所有這種零件的橫截面積的和為,若這種零件的耗材量和其橫截面積近似成正比,請幫劉銘計算一下他制作的零件的總耗材量的估計值.附:相關系數.【例1-4】(2023·河南·模擬預測)黨的二十大以來,國家不斷加大對科技創新的支持力度,極大鼓舞了企業持續投入研發的信心.某科技企業在國家一系列優惠政策的大力扶持下,通過不斷的研發和技術革新,提升了企業收益水平.下表是對2023年1~5月份該企業的利潤y(單位:百萬)的統計.月份1月2月3月4月5月月份編號x12345利潤y(百萬)712131924(1)根據統計表,求該企業的利潤y與月份編號x的樣本相關系數(精確到0.01),并判斷它們是否具有線性相關關系(,則認為y與x的線性相關性較強,,則認為y與x的線性相關性較弱.);(2)該企業現有甲、乙兩條流水線生產同一種產品.為對產品質量進行監控,質檢人員先用簡單隨機抽樣的方法從甲、乙兩條流水線上分別抽取了5件、3件產品進行初檢,再從中隨機選取3件做進一步的質檢,記抽到“甲流水線產品”的件數為,試求的分布列與期望.附:相關系數考法二線性回歸方程【例2-1】(2023山東濱州·期末)某學校一同學研究溫差(單位:℃)與本校當天新增感冒人數(單位:人)的關系,該同學記錄了5天的數據:5689121620252836由上表中數據求得溫差與新增感冒人數滿足經驗回歸方程,則下列結論不正確的是(

)A.與有正相關關系 B.經驗回歸直線經過點C. D.時,殘差為0.2【例2-2】(2024·全國·模擬預測)(多選)節約用電是低碳生活的重要組成部分,契合環保和社會可持續發展的原則,是推動“雙碳”目標實現的一場全社會的行動,離不開你我的共同參與.某企業從2019年開始加強節電管理,收效明顯.下表是該企業自2018年至2022年的用電量:年份2018年2019年2020年2021年2022年年份編號x12345用電量y(單位:)3.242.942.602.222.00根據表格數據計算得,.已知y與x具有線性相關關系,則下列說法中正確的是(

)(附:,)A.該企業2018年至2022年平均每年用電量為B.y與x正相關C.估計該企業2017年用電量為D.預測該企業2023年用電量為【例2-3】(2023山東日照)發展新能源汽車是我國從汽車大國邁向汽車強國的必由之路,是應對氣候變化推動綠色發展的戰略舉措.隨著國務院《新能源汽車產業發展規劃(2021—2035)》的發布,我國自主品牌汽車越來越具備競爭力.國產某品牌汽車對市場進行調研,統計了該品牌新能源汽車在某城市年前幾個月的銷售量(單位:輛),用表示第月份該市汽車的銷售量,得到如下統計表格:123456728323745475260(1)經研究,、滿足線性相關關系,求關于的線性回歸方程,并根據此方程預測該店月份的成交量(、按四舍五入精確到整數);(2)該市某店為感謝客戶,決定針對該品牌的汽車成交客戶開展抽獎活動,設“一等獎”、“二等獎”和“祝您平安”三種獎項,“一等獎”獎勵千元;“二等獎”獎勵千元;“祝您平安”獎勵紀念品一份.在一次抽獎活動中獲得“二等獎”的概率為,獲得一份紀念品的概率為,現有甲、乙兩個客戶參與抽獎活動,假設他們是否中獎相互獨立,求此二人所獲獎金總額(千元)的分布列及數學期望.參考數據及公式:,,.【例2-4】(2024重慶·階段練習)黨的十八大以來,全國各地區各部門持續加大就業優先政策實施力度,促進居民收入增長的各項措施持續發力,居民分享到更多經濟社會發展紅利,居民收入保持較快增長,收入結構不斷優化,隨著居民總收入較快增長,全體居民人均可支配收入也在不斷提升.下表為重慶市20142022年全體居民人均可支配收入,將其繪制成散點圖(如圖1),發現全體居民人均可支配收入與年份具有線性相關關系.(數據來源于重慶市統計局2023-05-06發布).年份201420152016201720182019202020212022全體居民人均可支配收入(元)183522011022034241532638628920308243380335666(1)設年份編號為(2014年的編號為1,2015年的編號為2,依此類推),記全體居民人均可支配收入為(單位:萬元),求經驗回歸方程(結果精確到0.01),并根據所求回歸方程,預測2023年重慶市全體居民人均可支配收入;(2)為進一步對居民人均可支配收入的結構進行分析,某分析員從20142022中任取3年的數據進行分析,將選出的人均可支配收入超過3萬的年數記為,求隨機變量的分布列與數學期望.參考數據:.參考公式:對于一組數據,其回歸直線方程的斜率和截距的最小二乘估計分別為.考法三獨立性檢驗【例3-1】(2023江蘇常州·期末)某單位為了調查性別與對工作的滿意程度是否具有相關性,隨機抽取了若干名員工,所得數據統計如下表所示,其中,且,若有的把握可以認為性別與對工作的滿意程度具有相關性,則的值是.對工作滿意對工作不滿意男女附:,其中.【例3-2】(2024河南省直轄縣級單位·期中)為了解患某疾病是否與性別有關,隨機地調查了50人,得到如下的列聯表:患該疾病不患該疾病總計男151025女52025總計203050則(填“有”或“沒有”)的把握認為患該疾病與性別有關.參考公式:,其中.參考數據:0.0500.0100.001k3.8416.63510.828【例3-3】(2024·山東淄博)為了解居民體育鍛煉情況,某地區對轄區內居民體育鍛煉進行抽樣調查.統計其中400名居民體育鍛煉的次數與年齡,得到如下的頻數分布表.

年齡次數[20,30)[30,40)[40,50)[50,60]每周0~2次70553659每周3~4次25404431每周5次及以上552010(1)若把年齡在的鍛煉者稱為青年,年齡在的鍛煉者稱為中年,每周體育鍛煉不超過2次的稱為體育鍛煉頻率低,不低于3次的稱為體育鍛煉頻率高,根據小概率值的獨立性檢驗判斷體育鍛煉頻率的高低與年齡是否有關聯;(2)從每周體育鍛煉5次及以上的樣本鍛煉者中,按照表中年齡段采用按比例分配的分層隨機抽樣,抽取8人,再從這8人中隨機抽取3人,記這3人中年齡在與的人數分別為,求ξ的分布列與期望;(3)已知小明每周的星期六、星期天都進行體育鍛煉,且兩次鍛煉均在跑步、籃球、羽毛球3種運動項目中選擇一種,已知小明在某星期六等可能選擇一種運動項目,如果星期六選擇跑步、籃球、羽毛球,則星期天選擇跑步的概率分別為,求小明星期天選擇跑步的概率.參考公式:附:α0.100.050.010.0050.0012.7063.8416.6357.87910.828【例3-4】(2024·江蘇徐州)某中學對該校學生的學習興趣和預習情況進行長期調查,學習興趣分為興趣高和興趣一般兩類,預習分為主動預習和不太主動預習兩類,設事件A:學習興趣高,事件B:主動預習.據統計顯示,,,.(1)計算和的值,并判斷A與B是否為獨立事件;(2)為驗證學習興趣與主動預習是否有關,該校用分層抽樣的方法抽取了一個容量為的樣本,利用獨立性檢驗,計算得.為提高檢驗結論的可靠性,現將樣本容量調整為原來的倍,使得能有99.5%的把握認為學習興趣與主動預習有關,試確定的最小值.附:,其中.0.100.050.0100.0050.001k2.7063.8416.6357.87910.828考法四非線性回歸方程【例4-1】(2023山東·開學考試)為研究某池塘中水生植物的覆蓋水塘面積(單位:)與水生植物的株數(單位:株)之間的相關關系,收集了4組數據,用模型去擬合與的關系,設與的數據如表格所示:得到與的線性回歸方程,則(

)346722.54.57A.-2 B.-1 C. D.【例4-2】(2024山東聊城·階段練習)今年剛過去的4月份是“全國消費促進月”,各地拼起了特色經濟”,帶動消費復蘇、市場回暖.“小餅烤爐加蘸料,靈魂燒烤三件套”,最近,淄博燒烤在社交媒體火爆出圈,吸引全國各地的游客坐著高鐵,直奔燒烤店,而多家店鋪的營業額也在近一個月內實現了成倍增長.因此某燒烤店老板考慮投入更多的人工成本,現有以往的服務人員增量x(單位:人)與年收益增量y單位:萬元)的數據如下:服務人員增量x/人234681013年收益增量y/萬元13223142505658據此,建立了y與x的兩個回歸模型:

模型①:由最小二乘公式可求得與的一元線性經驗回歸方程為;模型②:由散點圖(如圖)的樣本點分布,可以認為樣本點集中在曲線的附近.對數據進行初步處理后,得到了一些統計的量的值:,,,,其中,(1)根據所給的統計量,求模型②中關于的經驗回歸方程(精確到0.1);(2)根據下列表格中的數據,比較兩種模型的決定系數,并選擇擬合精度更高的模型,預測服務人員增加25人時的年收益增量.回歸模型模型①模型②回歸方程182.479.2附:樣本的最小二乘估計公式為,,刻畫樣本回歸效果的決定系數【例4-3】(2024吉林長春·階段練習)《中共中央國務院關于全面推進鄉村振興加快農業農村現代化的意見》,這是21世紀以來第個指導“三農”工作的中央一號文件.文件指出,民族要復興,鄉村必振興,要大力推進數字鄉村建設,推進智慧農業發展.某鄉村合作社借助互聯網直播平臺進行農產品銷售,眾多網紅主播參與到直播當中,在眾多網紅直播中,統計了名網紅直播的觀看人次和農產品銷售量的數據,得到如圖所示的散點圖.(1)利用散點圖判斷,和哪一個更適合作為觀看人次和銷售量的回歸方程類型;(只要給出判斷即可,不必說明理由)(2)對數據作出如下處理:得到相關統計量的值如表:其中令,.根據(1)的判斷結果及表中數據,求(單位:千件)關于(單位:十萬次)的回歸方程,并預測當觀看人次為萬人時的銷售量;參考數據和公式:,附:對于一組數據、、、,其回歸線的斜率和截距的最小二乘估計分別為:,.考法五綜合運用【例5-1】(2023遼寧沈陽·期末)(多選)對兩個變量和進行回歸分析,則下列結論正確的為()A.回歸直線至少會經過其中一個樣本點B.殘差平方和越小的模型,擬合的效果越好C.建立兩個回歸模型,模型的相關系數,模型的相關系數,則模型的擬合度更好D.以模型去擬合某組數據時,為了求出回歸方程,設,將其變換后得到線性方程,則的值分別為【例5-2】(2024·河南南陽)(多選)下列說法中,正確的是(

)A.設有一個經驗回歸方程為,變量增加1個單位時,平均增加2個單位B.已知隨機變量,若,則C.兩組樣本數據和的方差分別為.若已知且,則D.已知一系列樣本點的經驗回歸方程為,若樣本點與的殘差相等,則【例5-3】(2023浙江湖州·期末)(多選)下列結論中正確的是(

)A.在列聯表中,若每個數據均變為原來的2倍,則的值不變B.已知隨機變量服從正態分布,若,則C.在一組樣本數據的散點圖中,若所有樣本點都在直線上,則這組樣本數據的樣本相關系數為0.9D.分別拋擲2枚相同的硬幣,事件表示為“第1枚為正面”,事件表示為“兩枚結果相同”,則事件是相互獨立事件單選題1.(2023湖北)調查某種群花萼長度和花瓣長度,所得數據如圖所示,其中相關系數,下列說法正確的是(

)A.花瓣長度和花萼長度沒有相關性B.花瓣長度和花萼長度呈現負相關C.花瓣長度和花萼長度呈現正相關D.若從樣本中抽取一部分,則這部分的相關系數一定是2.(2023陜西西安)如圖是某地在50天內感染新冠病毒的累計病例y(單位:萬人)與時間x(單位:天)的散點圖,則下列最適宜作為此模型的回歸方程類型的是(

A. B.C. D.3.(2024高三·全國·專題練習)下列命題中①散點圖可以直觀地判斷兩個變量是否具有線性相關關系;②回歸直線就是散點圖中經過樣本數據點最多的那條直線;③回歸分析和獨立性檢驗沒有什么區別;④回歸直線一定經過樣本中心點.其中正確的命題個數為()A. B. C. D.4.(2024天津)中國茶文化博大精深、茶水的口感與茶葉的類型和水的溫度有關,某數學建模小組建立了茶水冷卻時間和茶水溫度的一組數據,經過分析,提出了四種回歸模型,①②③④四種模型的殘差平方和的值分別是.則擬合效果最好的模型是(

)A.模型① B.模型② C.模型③ D.模型④5.(2024河北)集校為了解本校高一男生身高和體重的相關關系,在該校高一年級隨機抽取了7名男生,測量了他們的身高和體重得下表:身高(單位:167173175177178180181體重(單位:90545964677276由表格制作成如圖所示的散點圖:

由最小二乘法計算得到經驗回歸直線的方程為,其相關系數為;經過殘差分析,點對應殘差過大,把它去掉后,再用剩下的6組數據計算得到經驗回歸直線的方程為,相關系數為.則下列選項正確的是(

)A.B.C.D.【答案】A6.(2023高二下·全國·課時練習)經統計,用于數學學習的時間(單位:小時)與成績(單位:分)近似于線性相關關系.對某小組學生每周用于數學的學習時間與數學成績進行數據收集如下:x1516181922y10298115115120由樣本中樣本數據求得回歸直線方程為,則點與直線的位置關系是(

)A. B.C. D.與的大小無法確定7.(2024天津)有人調查了某高校14名男大學生的身高及其父親的身高,得到如下數據表:編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182利用最小二乘法計算的兒子身高關于父親身高的回歸直線為.根據以上信息進行的如下推斷中,正確的是(

)A.當時,,若一位父親身高為,則他兒子長大成人后的身高一定是B.父親身高和兒子身高是正相關,因此身高更高的父親,其兒子的身高也更高C.從回歸直線中,無法判斷父親身高和兒子身高是正相關還是負相關D.回歸直線的斜率可以解釋為父親身高每增加,其兒子身高平均增加8.(2024四川綿陽)有一散點圖如圖所示,在5個數據中去掉后,給出下列說法:①相關系數r變大;②相關指數變大;③殘差平方和變小;④變量x與變量y的相關性變強.其中正確說法的個數為(

)A.1個 B.2個 C.3個 D.4個多選題9.(2024·湖南邵陽)下列命題中,說法正確的有(

)A.設隨機變量,則B.成對樣本數據的線性相關程度越強,樣本相關系數越接近于1C.決定系數越大,表示殘差平方和越小,即模型的擬合效果越好D.基于小概率值的檢驗規則是:當時,我們就推斷不成立,即認為和不獨立,該推斷犯錯誤的概率不超過;當時,我們沒有充分證據推斷不成立,可以認為和獨立10.(2023山西·期末)下列說法正確的是(

)A.設隨機變量的均值為,是不等于的常數,則相對于的偏離程度小于相對于的偏離程度(偏離程度用差的平方表示)B.若一組數據,,…,的方差為0,則所有數據都相同C.用決定系數比較兩個回歸模型的擬合效果時,越大,殘差平方和越小,模型擬合效果越好D.在對兩個分類變量進行獨立性檢驗時,如果列聯表中所有數據都擴大為原來的10倍,在相同的檢驗標準下,再去判斷兩變量的關聯性時,結論不會發生改變11.(2023江蘇常州)已知由樣本數據組成的一個樣本,根據最小二乘法求得線性回歸方程為且,去除兩個異常數據和后,得到新的線性回歸直線的斜率為3,則下列結論中正確的是(

)A.相關變量,具有正相關關系B.去除異常數據后,新的平均數C.去除異常數據后的線性回歸方程為D.去除異常數據后,隨值增加,的值增加速度變大12.(2023浙江寧波)某電商平臺為了對某一產品進行合理定價,采用不同的單價在平臺試銷,得到的數據如下表所示:單價x/元88.599.510銷量y/萬件8985807868根據以上數據得到與具有較強的線性關系,若用最小二乘估計得到經驗回歸方程為,則(

)A.相關系數 B.點一定在經驗回歸直線上C. D.時,對應銷量的殘差為填空題13.(2024江西·開學考試)商家為了解某品牌取暖器的月銷售量Y(臺)與月平均氣溫之間的關系,隨機統計了某4個月該品牌取暖器的月銷售量與當月平均氣溫,其數據如下表;平均氣溫()10741月銷售量(臺)26375582由表中數據算出線性回歸方程中的,當平均氣溫為時,此品牌取暖器的月銷售量為臺(結果保留整數).14.(2024·山西呂梁)某市2018年至2022年新能源汽車年銷量(單位:百臺)與年份代號的數據如下表:年份20182019202020212022年份代號01234年銷量1015203035若根據表中的數據用最小二乘法求得關于的回歸直線方程為,據此計算相應于樣本點的殘差為.15.(2024江蘇·課時練習)在研究兩個變量的相關關系時,觀察散點圖發現樣本點集中于某一條指數曲線的周圍.令,求得線性回歸方程為,則該模型的非線性回歸方程為.16(2023江蘇·單元測試)為了調查患慢性氣管炎是否與吸煙有關,調查了100名50歲以下的人,調查結果如下表:患慢性氣管炎未患慢性氣管炎合計吸煙20m40不吸煙n5560合計2575100根據列聯表數據,求得χ2=(保留3位有效數字),根據下表,有的把握認為患慢性氣管炎與吸煙有關.附:P(χ2≥x0)0.0500.0100.001x03.8416.63510.828χ2=.解答題17.(2023·全國·模擬預測)新冠病毒奧密克戎毒株開始流行后,為了控制新冠肺炎疫情,杭州某高中開展了每周核酸檢測工作.周一至周五,每天中午13:30開始,安排位師生進行核酸檢測,教職工每天都要檢測,用五天時間實現全員覆蓋.(1)該校教職工有人,高二學生有人,高三學生有人.①用分層抽樣的方法,求高一學生每天的檢測人數.②高一年級共個班,該年級每天進行核酸檢測的學生有兩種安排方案.方案一:集中來自部分班級;方案二:分散來自所有班級.你認為哪種方案更合理?給出理由.(2)學校開展核酸檢測的第一周,周一至周五核酸檢測用時記錄如下表.第天用時①計算變量和的相關系數(精確到),并說明兩變量的線性相關程度;②根據①中的計算結果,判定變量和是正相關還是負相關,并給出可能的原因.參考數據和公式:,相關系數.18.(2024·貴州貴陽)某學校為學生開設了一門模具加工課,經過一段時間的學習,擬舉行一次模具加工大賽,學生小明、小紅打算報名參加大賽.賽前,小明、小紅分別進行了為期一周的封閉強化訓練,下表記錄了兩人在封閉強化訓練期間每天加工模具成功的次數,其中小明第7天的成功次數忘了記錄,但知道,(,分別表示小明、小紅第天的成功次數).第一天第二天第三天第四天第五天第六天第七天序號1234567小明成功次數162020253036小紅成功次數16222526323535(1)求這7天內小明成功的總次數不少于小紅成功的總次數的概率;(2)根據小明這7天內前6天的成功次數,求其成功次數關于序號的線性回歸方程,并估計小明第七天成功次數的值.參考公式:回歸方程中斜率與截距的最小二乘估計公式分別為:,.參考數據:;.19.(2023山東菏澤·期末)2023年9月23日第19屆亞運會在杭州開幕,本屆亞運會共設40個競賽大項,包括31個奧運項目和9個非奧運項目.為研究不同性別學生對杭州亞運會項目的了解情況,某學校進行了一次抽樣調查,分別抽取男生和女生各50名作為樣本,設事件“了解亞運會項目”,“學生為女生”,據統計,.(1)根據已知條件,填寫列聯表,并依據的獨立性檢驗,能否認為該校學生對亞運會項目的了解情況與性別有關?(2)現從該校了解亞運會項目的學生中,采用分層隨機抽樣的方法隨機抽取9名學生,再從這9名學生中隨機抽取4人,設抽取的4人中男生的人數為,求的分布列和數學期望.附:,.0.0500.0100.0013.8416.63510.82820(2023·貴州貴陽)為了研究某種細菌隨天數x變化的繁殖個數y,收集數據如下:天數x123456繁殖個數y612254995190(1)在圖中作出繁殖個數y關于天數x變化的散點圖,并由散點圖判斷(a,b為常數)與(,為常數,且,)哪一個適宜作為繁殖個數y關于天數x變化的回歸方程類型?(給出判斷即可,不必說明理由)(2)對于非線性回歸方程(,為常數,且,),令,可以得到繁殖個數的對數z關于天數x具有線性關系及一些統計量的值.3.5062.833.5317.50596.5712.09①證明:“對于非線性回歸方程,令,可以得到繁殖個數的對數z關于天數x具有線性關系(即,β,α為常數)”;②根據(1)的判斷結果及表中數據,建立y關于x的回歸方程(系數保留2位小數).附:對于一組數據,,…,,其回歸直線方程的斜

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論