一卷練透08+成對數據的統計分析(回歸分析和獨立性檢驗)(解析版)_第1頁
一卷練透08+成對數據的統計分析(回歸分析和獨立性檢驗)(解析版)_第2頁
一卷練透08+成對數據的統計分析(回歸分析和獨立性檢驗)(解析版)_第3頁
一卷練透08+成對數據的統計分析(回歸分析和獨立性檢驗)(解析版)_第4頁
一卷練透08+成對數據的統計分析(回歸分析和獨立性檢驗)(解析版)_第5頁
已閱讀5頁,還剩29頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

一卷練透08成對數據的統計分析(回歸分析和獨立性檢驗)一、選擇題:本題共8小題,每小題5分,共40分.在每小題給出的四個選項中,只有一項是符合題目要12023下·山西太原·高二統考期中)某市對機動車單雙號限行進行了調查,在參加調查的2748名有車人中有1760名持反對意見,2652名無車人中有1400名持反對意見,在運用這些數據說明“擁有車輛”與“反對機動車單雙號限行”是否相關時,用下列哪種方法最有說服力()A.平均數B.方差C.獨立性檢驗D.回歸直線方程【答案】【答案】C【分析】根據在參加調查的2748名有車人中有1760名持反對意見,2652名無車人中有1400名持反對意見,求出K2的值判斷.【詳解】解:由在參加調查的2748名有車人中有1760名持反對意見,2652名無車人中有1400名持反對意見,所以有99%的把握認為“擁有車輛”與“反對機動車單雙號限行”有關,故利用獨立性檢驗方法最有說服力,22023下·寧夏固原·高二校考期中)下面是一個2×2列聯表,則表中a,c處的值分別為()y1y2總計x1a257321bc總計d49【答案】【答案】C【分析】根據2×2列聯表求解.試卷第2頁,共18頁32023下·山西運城·高二統考期中)下列說法錯誤的是()A.決定系數R2越大,模型的擬合效果越好B.若變量x和y之間的樣本相關系數為r=—0.999,則變量x和y之間的負相關很強C.殘差平方和越小的模型,擬合的效果越好D.在經驗回歸方程=—2x+0.8中,當解釋變量x每增加1個單位時,響應變量平均增加2個單位【答案】【答案】D【分析】根據相關系數、決定系數、殘差平方和及經驗回歸方程的知識逐項判斷即可.【詳解】對于A,決定系數R2越大,模型的擬合效果越好,故A正確;對于B,若變量x和y之間的樣本相關系數為r=—0.999,則變量x和y之間的負相關很強,故B正確;對于C,殘差平方和越小的模型,擬合的效果越好,故C正確;對于D,在經驗回歸方程=—2x+0.8中,當解釋變量x每增加1個單位時,響應變量平均減少2個單位,故D錯誤.故選:D.42023下·山東濱州·高二校聯考期中)有一散點圖如圖所示,在5個數據(x,y)中去掉D(3,10)后,下列說法正確的是()A.相關系數r變小B.殘差平方和變小C.變量x,y負相關D.解釋變量x與預報變量y的相關性變弱【答案】【答案】B【分析】根據散點圖的分布以及相關性的相關定義,結合選項即可逐一求解.【詳解】對于A,去掉D(3,10)后,相關性變強,相關系數r變大,對于B,殘差平方和變小,故B正確,試卷第3頁,共18頁對于對于C,散點的分布是從左下到右上,故變量x,y正相關,故C錯誤,對于D,解釋變量x與預報變量y的相關性變強,故D錯誤,52023下·山西運城·高二統考期中)某校為了研究學生的性別和對待某一活動的態度(支持與不支持)的關系,運用2×2列聯表進行獨立性檢驗.整理所得數據后發現,若依據a=0.010的獨立性檢驗,則認為學生性別與是否支持該活動無關;若依據a=0.025的獨立性檢驗,則認為學生性別與是否支持該活動有關,則X2的值可能為()a0.100.050.0250.0100.0050.001xa2.7063.8415.0246.6357.87910.828A.4.238B.4.972C.6.687D.6.069【答案】【答案】D【分析】依據a的取值,得出X2的取值范圍,判斷即可.2的值可能為6.069.故選:D.62023下·山東青島·高二校考期中)根據變量Y和x的成對樣本數據,由一元線性回歸模型2得到經驗回歸模型=x+,求得殘差圖.對于以下四幅殘差圖,滿足一元線性回歸模型中對隨機誤差假設的是()B.【答案】D【答案】D試卷第4頁,共18頁【分析】根據一元線性回歸模型中對隨機誤差的假定進行判斷【分析】根據一元線性回歸模型中對隨機誤差的假定進行判斷.【詳解】根據一元線性回歸模型中對隨機誤差e的假定,殘差應是均值為0、方差為σ2的隨機變量的觀測值.對于A選項,殘差與x有線性關系,故A錯誤;對于B選項,殘差的方差不是一個常數,隨著觀測時間變大而變小,故B錯;對于C選項,殘差與x有非線性關系,故C錯;對于D選項,殘差比較均勻地分布在以取值為0的橫軸為對稱軸的水平帶狀區域內,故D正確.故選:D.72023下·廣西桂林·高二校考期中)某學校想了解該校學生對于某項運動的愛好是否與性別有關,通過隨機抽查110名學生,得到如下2×2列聯表:性別態度總計喜歡該項運動不喜歡該項運動男40女203050總計50由公式算得:K2≈7.82.下列結論正確的是()k0P0.010.005A.有99.9%的把握認為“愛好該項運動與性別有關”B.有99.9%的把握認為“愛好該項運動與性別無關”C.有99%的把握認為“愛好該項運動與性別無關”D.有99%的把握認為“愛好該項運動與性別有關”【答案】【答案】D【分析】對比臨界值表,根據獨立性檢驗的思想直接判斷即可.【詳解】∵K2≈7.82>6.635,K2≈7.82<10.828,:有99%的把握認為“愛好該項運動與性別有關”.試卷第5頁,共18頁故選:故選:D.82023下·黑龍江大慶·高二大慶實驗中學校考期中)云計算是信息技術發展的集中體現,近年來,我國云計算市場規模持續增長.已知某科技公司2018年至2022年云計算市場規模數據,且市場規模y與年份代碼x的關系可以用模型y=c1ecx(其中e為自然對數的底數)擬合,設z=lny,得到數據統計表如下:年份2018年2019年2020年2021年2022年年份代碼x12345云計算市場規模y/千萬元7.42036.6z=lny22.43.03.64.0由上表可得經驗回歸方程z=0.52x+a,則2025年該科技公司云計算市場規模y的估計值為()A.e5.08B.e5.6C【答案】【答案】B【分析】求出x、z的值,代入回歸方程求出a的值,可得出z關于x的回歸方程,然后在回歸方程中令x=8可得出z的值,即可求得y的值,即可得解.【詳解】由題意可得將代入回歸方程z=0.52x+a可得a=3-3×0.52=1.44,所以,z關于x的回歸方程為z=0.52x+1.44,當x=8時,z=0.52×8+1.44=5.6=二、選擇題:本題共3小題,每小題6分,共18分.在每小題給出的選項中,有多項符合題目要求.全部選對的得6分,部分選對的得部分分,有選錯的得0分.92023下·福建泉州·高二校考期中)如圖是調查某地區男、女中學生喜歡數學的等高堆積條形圖,陰影部分表示喜歡數學的百分比,從圖可以看出()試卷第6頁,共18頁A.性別與喜歡數學無關B.女生中喜歡數學的百分比為80%C.男生比女生喜歡數學的可能性大些D.男生不喜歡數學的百分比為40%【答案】【答案】CD【分析】根據等高堆積條形圖即可結合選項求解.【詳解】由圖可知,女生喜歡數學的占20%,男生喜歡數學的占60%,男生不喜歡數學的百分比為40%,故B錯誤,D正確;顯然性別與喜歡數學有關,故A錯誤;男生比女生喜歡數學的可能性大些,故C正確.故選:CD.102023下·浙江寧波·高二效實中學校考期中)市物價部門對5家商場的某商品一天的線上銷售量及其價格進行調查,5家商場的售價x(元)和銷售量y(件)之間的一組數據如表所示:價格x99.5銷售量y865按公式計算,y與x的回歸直線方程是:=-3.2x+,相關系數r=0.986,則下列說法正確的是()A.=40B.變量x,y線性正相關C.相應于點(9.5,10)的殘差約為-0.4D.當x=8時,y的估計值為14.4【答案】【答案】AD【分析】對選項A由樣本中心在回歸方程上求參數;對選項B由相關系數的意義及回歸方程的斜率符號判斷;對選項C利用殘差的定義求殘差;對選項D將8代入回歸方程求估計值.【詳解】由表格知所以8=-3.2×10+,可得=40,A正確;由相關系數r=0.986且回歸方程斜率為負,則變量x,y線性負相關且相關性較強,B錯誤;試卷第7頁,共18頁由由=-3.2×9.5+40=9.6,故殘差為10-9.6=0.4,C錯誤;由=-3.2×8+40=14.4,D正確;故選:AD.112023下·山西運城·高二統考期中)某校為了解學生對2022卡塔爾世界杯的關注度(關注或不關注對本校學生隨機做了一次調查,結果顯示被調查的男、女生人數相同,其中有的男生“關注”,有的女生“關注”,若依據小概率值α=0.001的獨立性檢驗,認為學生對世界杯的關注度與性別有關聯,則調查的總人數可能為()參考公式α0.1000.0500.0250.0100.001xα2.7063.8415.0246.63510.828【答案】【答案】BCD【分析】首先根據男、女生人數相等,結合比例,列出2×2列聯表,再計算X2,列不等式即可求解.【詳解】設男、女生人數均為n,可得如下2×2列聯表:對卡塔爾世界杯關注對卡塔爾世界杯關注對卡塔爾世界杯不關注對卡塔爾世界杯不關注合計合計男生男生5n6n6nn女生女生2n3n3nn合計合計n222n為6的倍數,則2n為12的倍數,則BCD滿足題意.故選:BCD試卷第8頁,共18頁三、填空題:本題共3小題,每小題5分,共15分.122023下·江蘇南通·高二統考期中)某工廠為研究某種產品的產量x(噸)與所需某種原材料的質量y(噸)的相關性,在生產過程中收集4組對應數據(x,y),如表所示.(殘差=觀測值-預測值)x3456y2.534m根據表中數據,得出y關于x的經驗回歸方程為=0.7x+.據此計算出在樣本(4,3)處的殘差為—0.15,則表中m的值為.【答案】【答案】4.5【分析】根據殘差求得x=4時的預測值,從而求得,再利用樣本中心一定在回歸直線上,即可求得答案.則有3.15=0.7×4+,:=0.35,故答案為:4.5132023下·重慶沙坪壩·高二重慶一中校考期中)有兩個分類變量x和y,其中一組觀測值為如下的2×2列聯表:y1y2總計x1a30總計3040其中a,10a均為大于3的整數,則a=時,在犯錯誤的概率不超過0.01的前提下為“x和y之間有關系試卷第9頁,共18頁P(K2)0.005k【答案】【答案】6【分析】由題意,計算K2,列出不等式求出a的取值范圍,再根據題意求得a的值.【詳解】由題意知:K2≥6.635,故答案為:6.142023下·吉林長春·高二長春市實驗中學校考期中)針對“中學生追星問題”,某校團委對“學生性別和中學生追星是否有關”作了一次調查,其中女生人數是男生人數的,男生追星的人數占男生人數的,女生追星的人數占女生人數的,若根據小概率值α=0.05的獨立性檢驗,判斷中學生追星與性別有關,則男生至少有人.參考數據及公式如下:0.0500.0100.001k03.8416.63510.828【答案】【答案】30【分析】設男生人數為x,依題意可得列聯表;根據表格中的數據,代入求觀測值的公式,求出觀測值同臨界值進行比較,列不等式即可得出結論.【詳解】設男生人數為x,依題意可得列聯表如下:喜歡追星喜歡追星不喜歡追星不喜歡追星總計總計男生男生xx3xx女生女生xx2總計總計根據小概率值根據小概率值Q=0.05的獨立性檢驗,判斷中學生追星與性別有關,則K2>3.841,由題知x應為6的整數倍,:根據小概率值Q=0.05的獨立性檢驗,判斷中學生追星與性別有關,則男生至少有30人,故答案為:30.四、解答題:本題共5小題,共77分.解答應寫出文字說明、證明過程或演算步驟.152023上·湖南衡陽·高二衡陽市八中校考階段練習)新冠肺炎疫情發生以來,中醫藥全面參與疫情防控救治,做出了重要貢獻.某中醫藥企業根據市場調研與模擬,得到研發投入x(億元)與產品收益y(億元)的數據統計如下:研發投入x(億元)12345產品收益y(億元)379(1)計算x,y的相關系數r,并判斷是否可以認為研發投入與產品收益具有較高的線性相關程度?(若0.3<r<0.75,則線性相關程度一般,若r>0.75,則線性相關程度較高)(2)求出y關于x的線性回歸方程,并預測若想收益超過50(億元)則需研發投入至少多少億元?(結果保留一位小數)參考數據.附:相關系數公式回歸直線方程的斜率截距.【答案】【答案】(1)r=0.95,線性相關程度較高(2)回歸直線方程為y=1.9x+2.3;至少投資25.1億元【分析】(1)通過計算相關系數r來進行判斷.(2)先計算回歸直線方程,并由此作出預測.所以所以線性相關程度較高.所以得所以至少投資25.1億元.162023下·黑龍江大興安嶺地·高二大興安嶺實驗中學校考期中)為了有針對性地提高學生體育鍛煉的積極性,某中學隨機抽取了80名學生,按照性別和體育鍛煉情況整理為如下列聯表:性別鍛煉合計不經常經常男生202040女生2440合計4436(1)依據α=0.05的獨立性檢驗,能否認為性別因素會影響學生鍛煉的經常性;(2)若列聯表中的所有樣本觀測數據都變為原來的10倍,再做第(1)問,得到的結論還一樣嗎?請說明理②臨界值表α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828【答案】【答案】(1)不能(2)不一樣,理由見解析【分析】(1)根據列聯表中的數據,求得X2,再與臨界值表對照下結論;(2)根據數據,求得X2,再與臨界值表對照即可.【詳解】(1)解:零假設為H0:性別與鍛煉的經常根據列聯表中的數據,經計算得到根據小概率值α=0.05的獨立性檢驗,沒有充分證據推斷H0不成立,因此可以認為H0成立,即不能認為性別因素會影響學生鍛煉的經常性.根據小概率值α=0.05的獨立性檢驗,我們推斷H0不成立,因此可以認為性別因素會影響學生鍛煉的經常性,此推斷犯錯誤的概率不大于0.05,得到的結論不一樣.172023下·河南駐馬店·高二統考期中)流行性感冒(簡稱流感)是流感病毒引起的急性呼吸道感染,是一種傳染性強、傳播速度快的疾病.其主要通過空氣中的飛沫、人與人之間的接觸或與被污染物品的接觸傳播.流感每年在世界各地均有傳播,在我國北方通常呈冬春季流行,南方有冬春季和夏季兩個流行高峰.兒童相對免疫力低,在幼兒園、學校等人員密集的地方更容易被傳染.某幼兒園將去年春季該園患流感的小朋友按照年齡與人數統計,得到如下數據:年齡(x)23456患病人數(y)2120(1)求y關于x的線性回歸方程;(2)計算變量x,y的相關系數r(計算結果精確到0.01并回答是否可以認為該幼兒園去年春季患流感人數與年齡負相關很強?【答案】【答案】(1)y=-2.8x+27.2(2)-0.98,該幼兒園去年春季患流感人數與年齡負相關很強【分析】(1)計算相關數據代入公式求解;(2)計算相關系數r并判斷相關性強弱.Σ(xi-x)(yi-y)=(-2)×5+(-1)×4+0×(-1)+1×(-2)+2×=y-x=16-(-2.8)×4=27.2,所以y與x之間線性回歸方程為y=-2.8x+27.2.因為r<0且非常接近-1,所以該幼兒園去年春季患流感人數與年齡負相關很強.182023上·四川攀枝花·高二統考期末)攀枝花屬于亞熱帶季風氣候區,水果種類豐富.其中,“紅格臍橙”已經“中華人民共和國農業部2010年第1364號公告”予以登記,根據其種植規模與以往的種植經驗,產自該果園的單個“紅格臍橙”的果徑(最大橫切面直徑,單位:mm)在正常環境下服從正態分布N(68,36).(1)一顧客購買了10個該果園的“紅格臍橙”,求會買到果徑小于56mm的概率;(2)為了提高利潤,該果園每年投入一定的資金,對種植、采摘、包裝、宣傳等環節進行改進.如圖是2013年至2022年(單位:萬元)與年利潤增量y(單位:萬元)的散點圖:該果園為了預測2023年投資金額為20萬元時的年利潤增量,建立了y關于x的兩個回歸模型;模型①:由最小二乘公式可求得y與x的線性回歸方程:=2.50x-2.50;模型②:由圖中樣本點的分布,可以認為樣本點集中在曲線:=blnx+a的附近.對投資金額x做交換,(i)根據所給的統計量,求模型②中y關于x的回歸方程;(ⅱ)根據下列表格中的數據,比較兩種模型的相關指數R2,并選擇擬合精度更高、更可靠的模型,預測投資金額為20萬元時的年利潤增量(結果保留兩位小數回歸模型模型①模型②回歸方程=2.50x-2.50=blnx+a102.2836.19相關指數參考數據:0.977210≈0.7940,0.998710≈0.9871,ln2≈0.6931,ln5≈1.6094.【答案】【答案】(1)0.2060;(2)(ⅰ)=25lnx-32;(ⅱ)模型②刻畫的擬合效果更好,當x為42.89萬元.【分析】(1)由正態分布的對稱性結合3σ法則求解;(2)(ⅰ)由已知數據利用最小二乘法求解模型②中y關于x的回歸方程;(ⅱ)由已知表格中的數據,可得模型①的R2小于模型②,說明模型②刻畫的擬合效果更好,再由(ⅰ)中求得線性回歸方程求解.由正態分布曲線的對稱性可知設一顧客購買了10個該果園的“紅格臍橙”,其中果徑小于56mm的有ξ個,ξ~B(10,0.0228),故P(ξ≥1)=1-P(ξ=0)=1-(1-0.0228)10=1-0.977210=0.2060,∴一顧客購買了10個該果園的“紅格臍橙”,會買到果徑小于56mm的概率為0.2060;∴模型②中y關于x的線性回歸方程為=25lnx-32;∴模型①的R2小于模型②,說明模型②刻畫的擬合效果更好.當x=20時,模型②的年利潤增量的預測值為:192023上·江西·高二江西省宜豐中學校聯考階段練習)紅蜘蛛是柚子的主要害蟲之一,能對柚子樹造成嚴重傷害,每只紅蜘蛛的平均產卵數y(個)和平均溫度x(℃)有關,現收集了以往某地的7組數據,得到下面的散點圖及一些統計量的值.(1)根據散點圖判斷,y=bx+a與y=cedx(其中e=2.718…為自然對數的底數)哪一個更適合作為平均產卵數y(個)關于平均溫度x(℃)的回歸方程類型給出判斷即可,不必說明理由)(2)由(1)的判斷結果及表中數據,求出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論