(新高考)高考數學一輪復習講義+鞏固練習9.3《成對數據的統計分析》(原卷版)_第1頁
(新高考)高考數學一輪復習講義+鞏固練習9.3《成對數據的統計分析》(原卷版)_第2頁
(新高考)高考數學一輪復習講義+鞏固練習9.3《成對數據的統計分析》(原卷版)_第3頁
(新高考)高考數學一輪復習講義+鞏固練習9.3《成對數據的統計分析》(原卷版)_第4頁
(新高考)高考數學一輪復習講義+鞏固練習9.3《成對數據的統計分析》(原卷版)_第5頁
已閱讀5頁,還剩10頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

§9.3成對數據的統計分析考試要求1.了解樣本相關系數的統計含義.2.理解一元線性回歸模型和2×2列聯表,會運用這些方法解決簡單的實際問題.3.會利用統計軟件進行數據分析.知識梳理1.變量的相關關系(1)相關關系:兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.(2)相關關系的分類:正相關和負相關.(3)線性相關:一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,我們稱這兩個變量線性相關.2.樣本相關系數(1)r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2)).(2)當r>0時,稱成對樣本數據正相關;當r<0時,稱成對樣本數據負相關.(3)|r|≤1;當|r|越接近1時,成對樣本數據的線性相關程度越強;當|r|越接近0時,成對樣本數據的線性相關程度越弱.3.一元線性回歸模型(1)我們將eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))稱為Y關于x的經驗回歸方程,其中eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2),,\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x).))(2)殘差:觀測值減去預測值,稱為殘差.4.列聯表與獨立性檢驗(1)關于分類變量X和Y的抽樣數據的2×2列聯表:XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d(2)計算隨機變量χ2=eq\f(nad-bc2,a+bc+da+cb+d),利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗.α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.828常用結論1.經驗回歸直線過點(eq\x\to(x),eq\x\to(y)).2.求eq\o(b,\s\up6(^))時,常用公式eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2).3.回歸分析和獨立性檢驗都是基于成對樣本觀測數據進行估計或推斷,得出的結論都可能犯錯誤.思考辨析判斷下列結論是否正確(請在括號中打“√”或“×”)(1)散點圖是判斷兩個變量相關關系的一種重要方法和手段.()(2)經驗回歸直線eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))至少經過點(x1,y1),(x2,y2),…,(xn,yn)中的一個點.()(3)樣本相關系數的絕對值越接近1,成對樣本數據的線性相關程度越強.()(4)若分類變量X,Y關系越密切,則由觀測數據計算得到的χ2的觀測值越小.()教材改編題1.實驗測得四組(x,y)的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的經驗回歸方程為()A.eq\o(y,\s\up6(^))=x+1 B.eq\o(y,\s\up6(^))=x+2C.eq\o(y,\s\up6(^))=2x+1 D.eq\o(y,\s\up6(^))=x﹣12.(多選)下列關于成對樣本數據的統計分析的判斷中正確的有()A.若樣本相關系數r=0,則說明成對樣本數據沒有相關性B.樣本相關系數r越大,成對樣本數據的線性相關性越強C.用最小二乘法求得的一元線性回歸模型的殘差和一定是0D.決定系數R2越大,殘差平方和越小,模型的擬合效果越好3.(多選)為了解閱讀量多少與幸福感強弱之間的關系,一個調查機構根據所得到的數據,繪制了如下所示的2×2列聯表(個別數據暫用字母表示):幸福感強幸福感弱合計閱讀量多m1872閱讀量少36n78合計9060150計算得:χ2≈12.981,參照下表:α0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828對于下面的選項,正確的為()A.根據小概率值α=0.010的獨立性檢驗,可以認為“閱讀量多少與幸福感強弱無關”B.m=54C.根據小概率值α=0.005的獨立性檢驗,可以在犯錯誤的概率不超過0.5%的前提下認為“閱讀量多少與幸福感強弱有關”D.n=52題型一成對數據的相關性例1(1)對變量x,y有觀測數據(xi,yi)(i=1,2,…,10),得散點圖如圖1,對變量u,v有觀測數據(ui,vi)(i=1,2,…,10),得散點圖如圖2.由這兩個散點圖可以判斷()圖1圖2A.變量x與y正相關,u與v正相關B.變量x與y正相關,u與v負相關C.變量x與y負相關,u與v正相關D.變量x與y負相關,u與v負相關(2)(多選)下列有關經驗回歸分析的說法中正確的有()A.經驗回歸直線必過點(eq\x\to(x),eq\x\to(y))B.經驗回歸直線就是散點圖中經過樣本數據點最多的那條直線C.當樣本相關系數r>0時,兩個變量正相關D.如果兩個變量的相關性越弱,則|r|就越接近于0教師備選1.在一組樣本數據(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=eq\f(1,2)x+1上,則這組樣本數據的樣本相關系數為()A.﹣1B.0C.eq\f(1,2)D.12.(多選)下列選項中正確的是()A.經驗回歸分析中,R2的值越大,說明殘差平方和越小B.若一組觀測數據(x1,y1),(x2,y2),…,(xn,yn)滿足yi=bxi+a+ei(i=1,2,…,n),若ei恒為0,則R2=1C.經驗回歸分析是對具有相關關系的兩個變量進行統計分析的一種常用方法D.畫殘差圖時,縱坐標為殘差,橫坐標一定是編號思維升華判定兩個變量相關性的方法(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關;點的分布從左上角到右下角,兩個變量負相關.(2)樣本相關系數:當r>0時,正相關;當r<0時,負相關;|r|越接近于1,相關性越強.(3)經驗回歸方程:當eq\o(b,\s\up6(^))>0時,正相關;當eq\o(b,\s\up6(^))<0時,負相關.跟蹤訓練1(1)已知變量x和y滿足關系y=﹣0.1x+1,變量y與z正相關.下列結論中正確的是()A.x與y正相關,x與z負相關 B.x與y正相關,x與z正相關C.x與y負相關,x與z負相關 D.x與y負相關,x與z正相關(2)對四組數據進行統計,獲得如圖所示的散點圖,關于其樣本相關系數的比較,正確的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3題型二回歸模型命題點1一元線性回歸模型例22021年2月25日,在全國脫貧攻堅總結表彰大會上,習近平總書記莊嚴宣告:我國脫貧攻堅戰取得全面勝利.目前,河南省53個貧困縣已經全部脫貧摘帽,退出貧困縣序列.2016年起,我省某貧困地區創新開展產業扶貧,響應第三產業的扶貧攻堅政策,經濟收入逐年增加.該地的經濟收入變化及構成比例如圖所示:年份2016年2017年2018年2019年2020年年份代號x12345經濟收入y(單位:百萬元)59141720(1)根據以上圖表,試分析:與2016年相比,2020年第三產業與種植業收入變化情況;(2)求經濟收入y關于x的經驗回歸方程,并預測2025年該地區的經濟收入.命題點2非線性回歸模型例3全球化時代,中國企業靠什么在激烈的競爭中成為世界一流企業呢?由人民日報社指導,《中國經濟周刊》主辦的第十八屆中國經濟論壇在人民日報社舉行,就中國企業如何提升全球行業競爭力進行了研討.數據顯示,某企業近年加大了科技研發資金的投入,其科技投入x(百萬元)與收益y(百萬元)的數據統計如下:科技投入x1234567收益y19202231405070根據數據特點,甲認為樣本點分布在指數型曲線y=2bx+a的周圍,據此他對數據進行了一些初步處理.如下表:eq\x\to(z)eq\i\su(i=1,7,x)eq\o\al(2,i)eq\i\su(i=1,7,x)iyieq\i\su(i=1,7,x)izieq\i\su(i=1,7,)(yi﹣eq\x\to(y))2eq\i\su(i=1,7,)(yi﹣eq\o(yi,\s\up6(^)))2514012391492134130其中zi=log2yi,eq\x\to(z)=eq\f(1,7)eq\i\su(i=1,7,z)i.(1)請根據表中數據,建立y關于x的經驗回歸方程(系數精確到0.1);(2)①乙認為樣本點分布在直線y=mx+n的周圍,并計算得經驗回歸方程為eq\o(y,\s\up6(^))=8.25x+3,以及該回歸模型的決定系數Req\o\al(2,乙)=0.893,試比較甲、乙兩人所建立的模型,誰的擬合效果更好?②由①所得的結論,計算該企業欲使收益達到1億元,科技投入的費用至少要多少百萬元?(精確到0.1)附:決定系數:R2=1﹣eq\f(\i\su(i=1,n,)vi-\o(v,\s\up6(^))i2,\i\su(i=1,n,)vi-\x\to(v)2).參考數據:log25≈2.3.教師備選1.下表是關于某設備的使用年限x(單位:年)和所支出的維修費用y(單位:萬元)的統計表.x23456y3.44.25.15.56.8由上表可得經驗回歸方程eq\o(y,\s\up6(^))=0.81x+eq\o(a,\s\up6(^)),若規定:維修費用y不超過10萬元,一旦大于10萬元時,該設備必須報廢.據此模型預測,該設備使用年限的最大值約為()A.7B.8C.9D.102.用模型y=cekx擬合一組數據時,為了求出經驗回歸方程,設z=lny,其變換后得到經驗回歸方程為z=0.5x+2,則c等于()A.0.5B.e0.5C.2D.e2思維升華求經驗回歸方程的步驟跟蹤訓練2為實施鄉村振興,科技興農,某村建起了田園綜合體,并從省城請來專家進行技術指導.根據統計,該田園綜合體西紅柿畝產量的增加量y(千克)與某種液體肥料每畝使用量x(千克)之間的對應數據如下.x(千克)24568y(千克)300400400400500(1)由上表數據可知,可用經驗回歸模型擬合y與x的關系,請計算樣本相關系數r并加以說明(若|r|>0.75,則線性相關程度很高,可用經驗回歸模型擬合);(2)求y關于x的經驗回歸方程,并預測當液體肥料每畝使用量為15千克時,西紅柿畝產量的增加量約為多少千克?參考數據:eq\r(10)≈3.16.題型三列聯表與獨立性檢驗例4甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質量情況統計如下表:一級品二級品合計甲機床15050200乙機床12080200合計270130400(1)甲機床、乙機床生產的產品中一級品的頻率分別是多少?(2)依據小概率值α=0.01的獨立性檢驗,能否以此推斷甲機床的產品質量與乙機床的產品質量有差異?教師備選1.為了解某大學的學生是否愛好體育鍛煉,用簡單隨機抽樣方法在校園內調查了120位學生,得到如下2×2列聯表:男女合計愛好ab73不愛好c25合計74則a﹣b﹣c等于()A.7B.8C.9D.102.(多選)某醫療研究機構為了了解免疫與注射疫苗的關系,進行一次抽樣調查,得到數據如表1.免疫不免疫合計注射疫苗101020未注射疫苗63440合計164460(表1)α0.100.0500.0100.001xα2.7063.8416.63510.828(表2)則下列說法中正確的是()A.χ2≈8.35B.P(χ2≥6.635)≈0.001C.依據小概率值α=0.01的獨立性檢驗,我們認為免疫與注射疫苗有關系D.依據小概率值α=0.001的獨立性檢驗,我們認為免疫與注射疫苗有關系思維升華獨立性檢驗的一般步驟(1)根據樣本數據制成2×2列聯表.(2)根據公式χ2=eq\f(nad-bc2,a+ba+cb+dc+d)計算.(3)比較χ2與臨界值的大小關系,作統計推斷.跟蹤訓練3為進一步保護環境,加強治理空氣污染,某市環保監測部門對市區空氣質量進行調研,隨機抽查了市區100天的空氣質量等級與當天空氣中SO2的濃度(單位:μg/m3),整理數據得到下表:SO2的濃度空氣質量等級[0,50](50,150](150,475]1(優)28622(良)5783(輕度污染)3894(中度污染)11211若某天的空氣質量等級為1或2,則稱這天“空氣質量好”;若某天的空氣質量等級為3或4,則稱這天“空氣質量不好”,根據上述數據,回答以下問題.(1)估計事件“該市一天的空氣質量好,且SO2的濃度不超過150”的概率;(2)完成下面的2×2列聯表,SO2的濃度空氣質量[0,150](150,475]合計空氣質量好空氣質量不好合計(3)根據(2)中的列聯表,依據小概率值α=0.01的獨立性檢驗,能否據此推斷該市一天的空氣質量與當天SO2的濃度有關?課時精練1.如表是2×2列聯表,則表中的a,b的值分別為()y1y2合計x1a835x2113445合計b4280A.27,38B.28,38C.27,37D.28,372.根據如表樣本數據:x23456y42.5﹣0.5﹣2﹣3得到的經驗回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),則()A.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))>0B.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))<0C.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))>0D.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))<03.某種產品的廣告費支出x與銷售額y(單位:萬元)之間的關系如表:x24568y3040605070y與x的經驗回歸方程為eq\o(y,\s\up6(^))=6.5x+17.5,當廣告支出6萬元時,隨機誤差的殘差為()A.﹣5 B.﹣5.5C.﹣6 D.﹣6.54.蟋蟀鳴叫可以說是大自然優美、和諧的音樂,殊不知蟋蟀鳴叫的頻率x(每分鐘鳴叫的次數)與氣溫y(單位:℃)存在著較強的線性相關關系.某地觀測人員根據如表的觀測數據,建立了y關于x的經驗回歸方程eq\o(y,\s\up6(^))=0.25x+k,則下列說法不正確的是()x(次數/分鐘)2030405060y(℃)2527.52932.536A.k的值是20B.變量x,y呈正相關關系C.若x的值增加1,則y的值約增加0.25D.當蟋蟀52次/分鳴叫時,該地當時的氣溫預測值為33.5℃5.(多選)下列說法正確的是()A.設有一個經驗回歸方程eq\o(y,\s\up6(^))=3﹣5x,變量x增加一個單位時,y平均增加5個單位B.若兩個具有線性相關關系的變量的相關性越強,則樣本相關系數r的值越接近于1C.在殘差圖中,殘差點分布的水平帶狀區域越窄,說明模型的擬合精度越高D.在一元線性回歸模型中,決定系數R2越接近于1,說明回歸的效果越好6.(多選)2021年5月18日,《佛山市第七次全國人口普查公報》發布.公報顯示,佛山市常住人口為9498863人.為了進一步分析數據特征,某數學興趣小組先將近五次人口普查數據作出散點圖(橫坐標為人口普查的序號,第三次普查記為1,…,第七次普查記為5,縱坐標為當次人口普查佛山市人口數(單位:萬人),再利用不同的函數模型作出回歸分析,如圖,以下說法正確的是()A.佛山市人口數與普查序號呈正相關關系B.散點的分布呈現出很弱的線性相關特征C.經驗回歸方程2的擬合效果更好D.應用經驗回歸方程1可以預測第八次人口普查時佛山市人口會超過1400萬人7.某車間為了提高工作效率,需要測試加工零件所花費的時間,為此進行了5次試驗,這5次試驗的數據如下表:零件數x(個)1020304050加工時間y(min)62a758189若用最小二乘法求得經驗回歸方程為eq\o(y,\s\up6(^))=0.67x+54.9,則a的值為________.8.某駕駛員培訓學校為對比了解“科目二”的培訓過程采用大密度集中培訓與周末分散培訓兩種方式的效果,調查了105名學員,統計結果為:接受大密度集中培訓的55個學員中有45名學員一次考試通過,接受周末分散培訓的學員一次考試通過的有30個.根據統計結果,認為“能否一次考試通過與是否集中培訓有關”犯錯誤的概率不超過________.附:χ2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d;α0.050.0250.0100.001xα3.8415.0246.63510.8289.機動車行經人行橫道時,應當減速慢行:遇行人正在通過人行橫道,應當停車讓行,俗稱“禮讓行人”.如表是某市一主干路口監控設備所抓拍的1﹣5月份駕駛員不“禮讓行人”行為統計數據:月份12345違章駕駛員人數1201051009580(1)請利用所給數據求違章人數y與月份x之間的經驗回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),并預測該路口10月份的不“禮讓行人”違章駕駛員人數;(2)交警從這5個月內通過該路口的駕駛員中隨機抽查70人,調查駕駛員不“禮讓行人”行為與駕齡的關系,如表所示:不禮讓行人禮讓行人駕齡不超過1年2416駕齡1年以上1614依據小概率值α=0.1的獨立性檢驗,能否據此判斷“禮讓行人”行為與駕齡有關?10.現代物流成為繼勞動力、自然資源外影響企業生產成本及利潤的重要因素.某企業去年前八個月的物流成本和企業利潤的數據(單位:萬元)如表所示:月份12345678物流成本x8383.58086.58984.57986.5利潤y114116106122132114m132殘差eq\o(ei,\s\up6(^))=yi﹣eq\o(yi,\s\up6(^))0.20.61.8﹣3﹣1﹣4.6﹣1根據最小二乘法估計公式求得經驗回歸方程為eq\o(y,\s\up6(^))=3.2x﹣151.8.(1)求m的值,并利用已知的經驗回歸方程求出8月份對應的殘差值eq\o(e,\s\up6(^))8;(2)請先求出一元線性回歸模型eq\o(y,\s\up6(^))=3.2x﹣151.8的決定系數R2(精確到0.0001);若根據非線性回歸模型y=267.76lnx﹣1069.2求得解釋變量(物流成本)對于響應變量(利潤)的決定系數Req\o\al(2,0)=0.9057,請說明以上兩種模型哪種模型擬合效果更好?(3)通過殘差分析,懷疑殘差絕對值最大的那組數據有誤,經再次核實后發現其真正利潤應該為116萬元.請重新根據最小二乘法的思想與公式,求出新的經驗回歸方程.附(修正前的參考數據):eq\i\su(i=1,8,x)iyi=78880,eq\i\su(i=1,8,x)eq\o\al(2,i)=56528,eq\x\to(x)=84,eq\i\su(i=1,8,)(yi﹣eq\x\to(y))2=904.11.某中學調查了高一年級學生的選科傾向,隨機抽取300人,其中選考物理的有220人,選考歷史的有80人,統計各選科人數如表,則下列說法正確的是()選擇科目選考類別思想政治地理化學生物物理類80100145115歷史類50453035α0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828A.物理類的學生中選擇政治的比例比歷史類的學生中選擇政治的比例高B.物理類的學生中選擇地理的比例比歷史類的學生中選擇地理的比例高C.根據小概率值α=0.1的獨立性檢驗,我們認為選擇生物與選考類別無關D.根據小概率值α=0.1的獨立性檢驗,我們認為選擇生物與選考類別有關12.已知變量y與x的一組數據如表所示,根據數據得到y關于x的經驗回歸方程為eq\o(y,\s\up6(^))=ebx﹣1.x1234ye2e3e5e6若eq\o(y,\s\up6(^))=e13,則x等于()A.6B.7C.8D.913.(多選)下列選項中,正確的是()A.對于回歸分析,樣本相關系數r的絕對值越小,說明擬合效果越好B.以模型y=c·ekx去擬合一組數據時,為了求出經驗回歸方程,設z=lny,將其變換后得到經驗回歸方程eq\o(z,\s\up6(^))=0.3x+4,則c,k的值分別是e4和0.3C.經驗回歸方程eq\o(y,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論