2015年春高中數學(北師大版)選修2-3第三章統計案例(3課時)_第1頁
2015年春高中數學(北師大版)選修2-3第三章統計案例(3課時)_第2頁
2015年春高中數學(北師大版)選修2-3第三章統計案例(3課時)_第3頁
2015年春高中數學(北師大版)選修2-3第三章統計案例(3課時)_第4頁
2015年春高中數學(北師大版)選修2-3第三章統計案例(3課時)_第5頁
已閱讀5頁,還剩33頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

知識點[來源:ZXXK][來源:][來源:學。科。網Z。X。X。K]Z.X.X.K求[來源:Z|xx|k][來源:學§科§網Z§X§X§K][來源:ZXXK][來源:學.科.網Z.X.X.K][來源:][來源:Z*xx*k]層次要求領域目標要求回歸分析的基本思想及其初步應用通過典型案例的探究,進一步了解回歸的基本思想、方法及初步應用在《數學》(必修3)概率統計的基礎上,通過典型案例進一步介紹回歸分析的基本思想、方法及其初步應用;通過典型案例介紹獨立性檢驗的基本思想、方法及其初步應用,認識統計方法在決策中的作用獨立性檢驗的基本思想及其初步應用在具體情境中,通過典型案例的探究,了解獨立性檢驗(只要求2×2列聯表)的基本思想、方法及初步應用1.在學習回歸分析內容時,應首先回顧必修課程中的相關內容,復習如何畫散點圖,如何利用最小二乘法求線性回歸方程,并關注本章內容和必修課程中相關內容的區別與聯系.認識和體會進行相關性檢驗的必要性,了解如何求線性相關系數r,并能對兩個隨機變量進行回歸分析.在此基礎上,會將非線性回歸問題轉化為線性回歸問題來解決.2.通過具體實例,了解獨立性檢驗的基本思想,能夠根據實際問題列出2×2列聯表,求出χ2的值,并能根據求得的值判斷兩個變量是否相關.3.帶著如下問題閱讀教材:(1)為什么要引入線性相關系數?(2)如何將非線性回歸模型轉化為線性回歸模型?(3)獨立性檢驗的基本思想、方法是什么?(4)哪種類型的數據可以進行獨立性檢驗,哪種類型的數據可進行回歸分析?第1課時回歸分析1.會對兩個變量的相關關系進行分析、判斷.2.了解回歸分析的基本思想,會對兩個變量的具體問題進行回歸分析.3.掌握運用最小二乘法建立回歸模型的基本步驟和方法.重點:熟練掌握回歸分析,建立回歸模型,求各相關指數的步驟.難點:如何求回歸直線方程以及對相關系數r的理解和運用.我們每個人都有自己的身高和體重,那么如果把身高和體重分別作為變量,它們能夠構成函數關系嗎?問題1:散點圖在考慮兩個量的關系時,為了對變量之間的關系有一個大致的了解,人們通常將變量所對應的點描出來,這些點就組成了變量之間的一個圖,通常稱這種圖為變量之間的散點圖.問題2:相關關系與線性回歸相關關系:對于兩個變量,當自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關系稱為相關關系.相關關系分為線性相關和非線性相關.

函數關系中的兩個變量間是一種確定性關系,相關關系是一種非確定性關系.

線性回歸:對具有相關關系的兩個變量進行統計分析的一種常用方法.

問題3:線性相關系數r=稱為兩個變量數據(xi,yi)(i=1,2,…,n)的線性相關系數.r用來刻畫兩個變量的線性回歸效果:當r>0時,表明兩個變量正相關;當r<0時,表明兩個變量負相關;r的絕對值越接近于0時,表明兩個變量之間越不存在線性相關關系.

問題4:線性回歸分析的步驟對于一組具有線性相關關系的數據:(x1,y1),(x2,y2),…,(xn,yn).(1)畫散點圖:看散點圖是否呈條狀分布.

(2)求回歸直線方程(最小二乘法):

b=,=xi,=yi,其中(,)為樣本中心點,回歸直線方程必經過樣本中心點(,),得a=

b;

(3)得出相關結論:回歸直線方程為y=a+bx,利用回歸直線方程進行預測.

“一只蝴蝶在巴西扇動翅膀,有可能會在美國的德克薩斯州引起一場龍卷風.”這就是洛倫茲1979年12月在華盛頓的“美國科學促進會”上的一次演講中提出的“蝴蝶效應”.這次演講給人們留下了極其深刻的印象.從此以后,所謂“蝴蝶效應”之說就不脛而走,名聲遠揚.“蝴蝶效應”之所以令人著迷、令人激動、發人深省,不但在于其大膽的想象力和迷人的美學色彩,而且在于其深刻的科學內涵和內在的哲學魅力.1.下列關系不屬于相關關系的是().A.父母的身高與子女的身高B.人的身高與體重C.居民的收入與消費D.正方體的表面積和體積【解析】相關關系是一種非確定性關系,而D項是確定的關系,為函數關系,故選D.【答案】D2.設兩個變量x與y之間具有線性相關關系,相關系數是r,回歸方程為y=a+bx,那么必有().A.b與r符號相同B.a與r符號相同C.b與r符號相反D.aD與r符號相反【解析】因為b與r的分母均為正,且分子相同,所以b與r同號.【答案】A3.某醫院用光電比色檢驗尿汞時,得到尿汞含量x(毫克/升)與消化系數y的一組數據如下表:尿汞含量x246810消化系數y64138205285260若x與y具有線性相關關系,則回歸直線方程是.

【解析】利用公式b==26.95,a=b=28.7,從而回歸直線方程為y=26.95x+28.7.【答案】y=26.95x+28.74.某10名同學的數學、物理、語文成績如下表:數學13612512287108113111709474物理107919276938582787873語文861141041091001061121049599試分別研究他們的數學成績與物理成績的關系、數學成績與語文成績的關系,你能發現什么規律?【解析】可求出物理成績與數學成績的相關系數r≈0.87>0.75,從而認為物理成績與數學成績之間具有很強的線性相關關系.而由語文成績與數學成績的相關系數|r|≈0.092遠小于0.75,說明語文成績與數學成績不具有線性相關關系.因此,數學成績好的同學,一般來說物理成績也較好,它們之間的聯系較緊密,而數學成績好的同學,語文成績可能好也可能差,它們之間的關系不大.相關關系的判斷與分析有下列關系:①人的年齡與他(她)擁有的財富之間的關系;②曲線上的點與該點的坐標之間的關系;③蘋果的產量與氣候之間的關系;④森林中的同一種樹木,其斷面直徑與高度之間的關系;⑤學生與他(她)的學號之間的關系.其中有相關關系的是(填寫你認為正確的序號).

【方法指導】根據相關關系的概念進行判斷.【解析】序號關系理由①相關關系人的年齡和他(她)的財富有一定的關系,一般中年人財富多,年輕人少,少兒基本沒有②函數關系曲線上的點與其坐標一一對應,是確定的③相關關系氣候能影響蘋果的產量④相關關系同一種樹木,其斷面直徑和高度之間有一定的關系,但不確定⑤對應關系確定的一一對應關系【答案】①③④【小結】相關關系是一種非確定性關系,是指兩個變量之間有關系,但是兩者之間的關系還受其他因素的影響,只是影響大小的問題.回歸直線過樣本中心點(,)的性質的應用觀察兩個相關變量的如下數據:x1234554321y0.923.13.95.154.12.92.10.9則兩個變量間的回歸直線方程為().A.y=0.5x1B.y=xC.y=2x+0.3D.y=xD+1【方法指導】根據回歸直線方程y=a+bx經過樣本中心點(,)可計算出結果.【解析】∵=0,=0,回歸直線方程經過樣本中心點(,),代入所給選項中檢驗,可知,只有y=x符合條件.【答案】B先判定相關性,再求回歸直線方程某種圖書每冊的成本費y(元)與印刷冊數x(千冊)有關,經統計得到數據如下:x123510203050100200y10.155.524.082.852.111.621.411.301.211.15檢驗每冊書的成本費y與印刷冊數的倒數之間是否有線性相關關系?如果有,求出y對x的回歸方程.【方法指導】本題是非線性回歸分析問題,不妨設變量u=,題意要求對u與y作相關性檢驗,如果它們具有線性相關關系,就可以進一步求出y對u的回歸直線方程,這時,再回代u=,就得到了y對x的回歸曲線方程.【解析】將上表數據列表分析如下:i12345678910xi123510203050100200421yi10.155.524.082.852.111.621.411.301.211.1531.4149251004009002500100004000053939103.0330.4716.658.124.452.621.991.691.461.32171.8xiyi10.1511.0412.2414.2521.132.442.365121230559.48∴=42.1,=1772.41,=3.14,n=10,10=1321.94,可以求得r=0.9998,由r=0.9998>0.75,因此變量y與之間具有較強的線性相關關系.∵b====0.02,∴a=b=3.14(0.02)×42.1=3.98.∴y與x的回歸方程為y=3.980.02x.[問題]當x=1時,由回歸方程得y=3.96,而實際上y=10.15,為什么有這么大的偏差?上述回歸方程是y與x的回歸方程嗎?[結論]因為y與之間具有較強的線性相關關系,而y與x之間沒有明顯的線性相關關系,故應先通過變量變換(即換元),令u=,并通過對u與y作相關性檢驗,求出y對u的回歸直線方程,最后再回代u=,得到y對x的回歸方程.于是正確解如下:首先作變量變換,令u=,則題目所給數據變成如下表所示的數據:ui10.50.330.20.10.050.030.020.010.005yi10.155.524.082.852.111.621.411.301.211.15可以求得r≈0.9998>0.75,因此變量y與u之間具有較強的線性相關關系,并且b≈8.973,a=b≈1.125,最后回代u=可得y=+1.125.因此y與x的回歸方程為y=+1.125.【小結】本題中y與x之間不具有線性相關關系,因而是非線性回歸分析問題,對此類回歸分析問題,應先求線性相關系數r,利用r來判斷兩個變量之間是否具有線性相關關系.當|r|>0.75時,認為有很強的線性相關關系,可以求回歸直線方程,并可用求得的回歸直線方程來預測變量的取值;當|r|<0.75時,認為兩個變量之間線性相關關系不顯著,這時求回歸直線方程沒有多大的實際價值,要采用變量變換(即換元法)轉化為線性回歸問題求解.由施肥量x與水稻產量y試驗數據的關系,畫出散點圖,并指明相關性.施化肥量x15202530354045水稻產量y330345365405445450455【解析】散點圖為:通過圖像可知是正相關.已知x、y的取值如表所示,若從散點圖分析,y與x線性相關,且y=0.95x+a,求a的值.x01234y2.24.34.84.86.7【解析】由表中數據得=2,=4.56,由于線性回歸方程一定經過樣本中心點(,),即(2,4.56),在回歸直線方程y=bx+a中,代入點(2,4.56)得a=b=4.560.95×2=2.66.10名同學在高一和高二的數學成績如下表:x74717268767367706574y76757170767965776272其中x為高一數學成績,y為高二數學成績.(1)y與x是否具有相關關系;(2)如果y與x具有相關關系,求回歸直線方程.【解析】(1)由已知表格中的數據,利用計算器進行計算得=71,=72.3,xiyi=51467,=50520,=52541.則r==≈0.78.由0.78>0.75認為x與y之間具有線性相關關系.(2)y與x具有線性相關關系,設回歸直線方程為y=a+bx,則b==≈1.22,a=b=72.31.22×71=14.32,所以y關于x的回歸直線方程為y=1.22x14.32.1.對相關系數r,下列說法正確的是().A.r越大,兩變量的線性相關程度越大B.r越小,兩變量的線性相關程度越大C.|r|越大,兩變量的線性相關程度越大;|r|越小,兩變量的線性相關程度越小D.|r|≤1,且|r|越接近1,兩變量的線性相關程度越大;|r|越接近0,兩變量的線性相關程度越小【解析】由兩個變量的相關系數公式r=可知,相關程度的強弱與|r|和1的接近程度有關,|r|越接近1,兩變量的線性相關程度越大,|r|越接近0,兩變量的線性相關程度越小.【答案】D2.工人月工資y(元)關于勞動生產率x(千元)的回歸方程為y=650+80x,下列說法正確的個數是().①勞動生產率為1000元,工資約為730元;②勞動生產率提高1000元,則工資約提高80元;③勞動生產率提高1000元,則工資約提高730元;④當月工資為810元,勞動生產率約為2000元.A.1B.2C.3D.4【解析】①②④正確,注意單位的一致性,故選C.【答案】C3.若預報體重y(kg)和身高x(cm)之間的線性回歸方程為y=0.849x85.712,如果要找到體重為41.638kg的人,(填“一定”或“不一定”)在身高為150cm的人群中.

【解析】體重不僅受身高的影響,還受其他因素的影響.【答案】不一定4.某個體服裝店經營某種服裝,一周內獲純利潤y(元)與該周每天銷售這種服裝的件數x之間的一組數據如下:x3456789y66697381899091已知=280,=45309,xiyi=3487.(1)求,;(2)一周內獲純利潤y與該周每天銷售件數x之間是否線性相關?如果線性相關,求出回歸直線方程.【解析】(1)=(3+4+5+6+7+8+9)=6,=(66+69+73+81+89+90+91)≈79.86.(2)根據已知=280,=45309,xiyi=3487,得相關系數r=≈0.973.由于0.973>0.75,所以純利潤y與每天銷售件數x之間具有顯著的線性相關關系.利用已知數據可求得回歸直線方程為y=4.746x+51.386.(2013年·湖南卷)四名同學根據各自的樣本數據研究變量x,y之間的相關關系,并求得回歸直線方程,分別得到以下四個結論:①y與x負相關且y=2.347x6.423;②y與x負相關且y=3.476x+5.648;③y與x正相關且y=5.437x+8.493;④y與x正相關且y=4.326x4.578.其中一定不正確的結論的序號是().A.①②B.②③C.③④D.①④【解析】由正相關、負相關的性質可知在①中,斜率為2.347>0,不可能負相關;在④中,斜率為4.326<0,不可能正相關,故①④一定不正確.選D.【答案】D

1.下列兩個變量之間的關系是相關關系的是().A.圓的面積與半徑B.球的體積與半徑C.角度與它的正弦值D.一個考生的數學成績與物理成績【解析】由題意知A表示圓的面積與半徑之間的關系S=πr2;B表示球的體積與半徑之間的關系V=πr2;C表示角度與它的正弦值y=sinα,以上所說的都是確定的函數關系,相關關系不是確定性的關系,故選D.【答案】D2.在對兩個變量x,y進行線性回歸分析時有下列步驟:①對所求出的回歸方程作出解釋;②收集數據(xi,yi),其中i=1,2,…,n;③求線性回歸方程;④求相關系數;⑤根據所搜集的數據繪制散點圖.如果根據可靠性要求能夠作出變量x,y具有線性相關結論,那么在下列操作順序中正確的是().A.①②⑤③④B.③②④⑤①C.②④③①⑤ D.②⑤④③①【解析】根據線性回歸分析思想可知,兩個變量x,y進行線性回歸分析時,應先收集數據(xi,yi),然后繪制散點圖,再求相關系數和線性回歸方程,最后對所求的回歸方程作出解釋,因此選D.【答案】D3.如圖所示有5組數據,去掉后,剩下的4組數據的線性相關性更強.

【解析】根據散點圖判定兩變量的線性相關性,樣本數據點越集中在某一直線附近,這兩變量的線性相關性越強,顯然去掉D(3,10)后,其余各點更能集中在某一直線附近,即線性相關性更強.【答案】D(3,10)4.一個工廠在某年里每月產品的總成本y(萬元)與該月產量x(萬件)之間由如下一組數據:x1.081.121.191.281.361.481.591.681.801.871.982.07y2.252.372.402.552.642.752.923.033.143.263.363.50(1)畫出散點圖;(2)檢驗相關系數r的顯著性水平;(3)求月總成本y與月產量x之間的回歸直線方程.【解析】i123456789101112xi1.081.121.191.281.361.481.591.681.801.871.982.07yi2.252.372.402.552.642.752.923.033.143.263.363.50xiyi2.432.6542.8563.2643.5904.074.6435.0905.6526.0966.6537.245=,=,=29.808,=99.2081,xiyi=54.243(1)畫出散點圖,如圖所示.(2)r==≈0.99>0.75,這說明每月產品的總成本y(萬元)與該月產量x(萬件)之間存在顯著的線性相關關系.(3)設回歸直線方程y=bx+a,利用計算a,b,得b≈1.215,a=b≈0.974,即回歸直線方程為y=1.215x+0.974.5.設一個回歸方程為y=35x,當變量x增加一個單位時().A.yB.y加3個單位 B.y平均減小5個單位C.y平均增加5個單位 D.y平均減小3個單位【解析】5是斜率的估計值,說明x每增加一個單位,y平均減少5個單位.【答案】B6.對于一組具有線性相關關系的數據(x1,y1),(x2,y2),…,(xn,yn),其回歸方程的截距為().A.a=y+bx B.a=+bC.a=ybx D.a=b【解析】回歸直線方程中的截距即為a,由公式=b+a得a=b,故選D.【答案】D7.許多因素都會影響貧窮,教育也許是其中之一,在研究這兩個因素的關系時收集了美國50個州的成年人受過9年或更少教育的百分比(x)和收入低于官方規定的貧困線的人數占本州人數的百分比(y)的數據,建立的回歸直線方程為y=0.8x+4.6,則成年人受過9年或更少教育的百分比(x)和收入低于官方的貧困線的人數占本州人數的百分比(y)之間的相關系數.(填“大于0”或“小于0”)

【解析】一個地區受過9年或更少教育的百分比每增加1%,收入低于官方規定的貧困線的人數占本州人數的百分比將增加0.8%左右.【答案】大于08.假設關于某設備的使用年限x和所支出的維修費用y(萬元)有如下的統計資料:使用年限x23456維修費用y2.23.85.56.57.0若由資料知y對x呈線性相關關系.試求:(1)線性回歸方程y=bx+a的回歸系數a,b;(2)估計使用年限為10年時的維修費用.【解析】(1)制表如下:i12345合計xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.34916253690=4,=5,=90,xiyi=112.3于是b===1.23,a=b=51.23×4=0.08.(2)由(1)知回歸直線方程為y=1.23x+0.08,當x=10時,y=1.23×10+0.08=12.3+0.08=12.38,即估計使用10年時的維修費用是12.38萬元.9.若y與x之間的一組數據如下:x01234y13556則擬合這5對數據的回歸直線一定經過的點是.

【解析】根據回歸直線y=bx+a一定過樣本中心點(,),且==2,==4,知點(2,4)一定在回歸直線上.【答案】(2,4)10.某工業部門進行一項研究,分析該部門的產量與生產費用之間的關系,從這個工業部門內隨機抽選了10個企業作樣本,有如下資料:產量x(千件)費用y(千元)4015042140481605517065150產量x(千件)費用y(千元)7916288185100165120190140185完成下列要求:(1)計算x與y的相關系數;(2)這兩個變量之間是否線性相關?若線性相關,求回歸直線方程y=bx+a.【解析】(1)制表如下:ixiyixiyi1401501600225006000242140176419600588034816023042560076804551703025289009350565150422522500975067916262412624412798788185774434225162808100165100002722516500912019014400361002280010140185196003422525900合計777165770903132938==77.7,==165.7,=70903,=,xiyi=r=≈0.808.即x與y的相關系數r≈0.808.(2)因為r>0.75.所以x與y之間具有很強的線性相關關系.則b=≈0.398,a=165.7×77.7b≈134.8,所以回歸直線方程為y=0.398x+134.8.第2課時回歸分析的應用1.根據線性回歸方程,對相關結論進行預測.2.理解從散點圖進行非線性回歸分析的意義,掌握如何將非線性回歸問題轉化為線性回歸問題的方法.3.了解在解決實際問題的過程中尋找更好的模型的方法.重點:根據線性回歸方程,對相關結論進行預測,探究非線性模型通過變換轉化為線性回歸模型的方法.難點:了解常用函數的圖像特點,選擇不同的模型建模,并通過相關指數對不同的模型進行比較.有關法律規定:香煙盒上必須印上“吸煙有害健康”的警示語,那么吸煙和健康之間有因果關系嗎?每一個吸煙者的健康問題都是由吸煙引起的嗎?你認為“健康問題不一定是由吸煙引起的,所以可以吸煙”的說法對嗎?要回答這個問題,我們先來一起學習本節的知識吧!問題1:刻畫回歸方程的擬合效果相關系數r=用來刻畫數組(xi,yi)中兩個變量的線性回歸效果,當|r|>0.75時,我們認為數組(xi,yi)中兩個變量有很強的線性相關關系;當|r|<0.75時,則認為兩個變量之間線性相關關系不顯著.

問題2:在回歸分析中,通過模型計算預測變量的值時,應注意的問題.(1)回歸方程只適用于我們所研究的樣本的總體;

(2)我們所建立的回歸方程一般都有時間性;

(3)樣本取值的范圍會影響回歸方程的適用范圍;

(4)不能期望回歸方程得到的預測值就是預測變量的精確值.

問題3:幾種能轉化為線性回歸模型的非線性回歸模型(1)冪函數曲線y=axb作變換u=lny,v=lnx,c=lna,得線性函數u=c+bv.

(2)指數曲線y=aebx作變換u=lny,c=lna,得線性函數u=c+bx.

(3)倒指數曲線y=a作變換u=lny,c=lna,v=,得線性函數u=c+bv.

(4)對數曲線y=a+blnx作變換u=y,v=lnx,得線性函數u=a+bv.

問題4:非線性回歸問題進行回歸分析的方法(1)若問題中已給出經驗公式,這時可以將解釋變量進行交換(換元),將變量的非線性關系轉化為線性關系,將問題化為線性回歸分析問題來解決.

(2)若問題中沒有給出經驗公式,需要我們畫出已知數據的散點圖,通過與各種函數(如指數函數、對數函數、冪函數等)的圖像作比較,選擇一種與這些散點擬合得最好的函數,然后采用適當的變量交換,將問題化為線性回歸分析問題來解決.

從以下幾個方面認識相關關系:(1)相關關系與函數關系不同.函數關系中的兩個變量間是一種確定性關系;相關關系是一種非確定性關系.(2)函數關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.相關關系在現實生活中大量存在,從某種意義上講,函數關系是一種理想的關系模型,而相關關系是一種更為一般的情況.因此研究相關關系,不僅可以使我們處理更為廣泛的數學應用問題,還可以使我們對函數關系的認識上升到一個新的高度.一般情況下,在尚未斷定兩個變量之間是否具有線性相關關系的情況下,應先進行相關性檢驗,在確認其具有線性相關關系后,再求其回歸直線方程;由部分數據得到的回歸直線,可以對兩個變量間的線性相關關系進行估計,這實際上是將非確定性的相關關系問題轉化成確定性的函數關系問題進行研究.由于回歸直線將部分觀測值所反映的規律性進行了延伸,它在情況預測、資料補充等方面有著廣泛的應用.1.下列兩個變量之間的關系不是函數關系的是().A.角度和它的余弦值B.正方形的邊長和面積C.正n邊形的邊數和各內角度數之和D.人的年齡和身高【解析】函數關系就是一種變量之間的確定性的關系,A,B,C三項都是函數關系,它們的函數表達式分別為f(θ)=cosθ,g(a)=a2,h(n)=nπ2π.D項不是函數關系,對于年齡確定的人群,仍可以有不同的身高,故選D.【答案】D2.為了表示n個點與相應直線在整體上接近程度,我們常用()表示.A.(yiy)B.(yi)C.(yiy)2 D.(yi)2【解析】由回歸直線方程y=a+bx,可知y為一個量的估計量,而yi為它的實際值,在最小二乘法中[yi(a+bx)]2,即(yiy)2,故選C.【答案】C3.在一次實驗中,測得(x,y)的四組值分別是A(1,2),B(2,3),C(3,4),D(4,5),則y與x之間的回歸直線方程為.

【解析】因為A,B,C,D四點都在直線y=x+1上,故填y=x+1.【答案】y=x+14.1907年一項關于16艘輪船的研究中,船的噸位區間位于192噸到3246噸,船員的人數從5人到32人,船員的人數關于船的噸位的回歸分析得到如下結果:船員人數=9.1+0.006×噸位.(1)假定兩艘輪船噸位相差1000噸,船員平均人數相差多少?(2)估計最小的船的船員數和最大的船的船員數.【解析】(1)船員平均人數之差=0.006×噸位之差=0.006×1000=6,即船員平均相差6人.(2)9.1+0.006×192=10.252,估計最小的船的船員數為10.9.1+0.006×3246=28.576,估計最大的船的船員數為28.利用公式,確定回歸直線方程某5名學生的數學和化學成績如下表:學生學科ABCDE數學成績(x)8876736663化學成績(y)7865716461(1)畫出散點圖;(2)求化學成績(y)對數學成績(x)的回歸直線方程.【方法指導】熟記公式,根據表格計算公式中所需的各種數據.【解析】(1)散點圖(略).(2)=73.2,=67.8,xiyi=25054,=27174,所以b==≈0.625.a=b=67.80.625×73.2=22.05.所以y對x的回歸直線方程為y=0.625x+22.05.【小結】利用公式求解時應注意以下幾點:①求b時應先求出,,xiyi,,再由a=b求a的值,并寫出回歸直線方程.②線性回歸方程中的截距a和斜率b都是通過樣本估計而來,存在著誤差,這種誤差可能導致預測結果的偏差.③回歸直線方程y=a+bx中的b表示x增加1個單位時y的變化量為b,而a是不隨x的變化而變化的量.④可以利用回歸直線方程y=a+bx預測在x取某一個值時,y的估計值.根據回歸直線方程,對結果進行分析或預測從某大學中隨機選取8名女大學生,其身高和體重數據如下表:編號12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據女大學生的身高預測體重的回歸方程,并預測一名身高為172cm的女大學生的體重.【方法指導】可以計算出r≈0.798>0.75.這表明體重與身高有較強的線性相關關系,從而可以建立身高和體重的線性回歸方程,根據身高和體重的線性回歸方程,由身高預測體重.【解析】由于問題中要求根據身高預測體重,因此選取身高為自變量x,體重為因變量y.作出散點圖(如圖).從圖中可以看出,樣本點呈條狀分布,身高和體重有較強的線性相關關系,因此可以用線性回歸方程來近似刻畫它們之間的關系,根據公式,可以得到b≈0.848,a≈85.712.于是得到回歸方程y=0.848x85.712.因此,對于身高172cm的女大學生,由回歸方程可以預測其體重為y=0.848×17285.712=60.144kg.【小結】解析中b=0.848是斜率的估計值,說明身高x每增加1個單位時,體重y就增加0.848kg,這表明體重與身高具有正的線性相關關系.盡管身高172cm的女大學生的體重不一定是60.144kg,但一般可以認為她的體重接近60.144kg.可線性化的非線性回歸問題一只紅鈴蟲的產卵數y和溫度x之間的7組觀測數據列于下表:溫度x/℃21232527293235產卵數y/個711212466115325試建立y與x之間的回歸方程,并預測溫度為28℃時產卵數目.【方法指導】作出散點圖(或根據已知的散點圖)分析欲采用較為恰當的擬合曲線,用換元法轉化成線性關系再進行回歸分析.【解析】選擇變量,畫散點圖.在散點圖中,根據已有的函數知識,可以發現樣本點分布在某一條指數函數曲線y=c1的周圍,其中c1和c2是待定參數.即問題變為如何估計待定參數c1和c2.我們可以通過對數變換把指數關系變為線性關系.令z=lny,則變換后樣本點應該分布在直線z=bx+a(a=lnc1,b=c2)的周圍.這樣,就可以利用線性回歸模型來建立y和x之間的非線性回歸方程了.由已知表的數據可以得到變換后的樣本數據表(下表):x21232527293235z1.9463.3983.0453.1784.1904.7455.784下圖給出了表中數據的散點圖.從圖中可以看出,變換后的樣本點分布在一條直線附近,因此可以用線性回歸方程來擬合.由表中的數據得到線性回歸方程z=0.242x2.884.相關系數r≈0.953.因此紅鈴蟲的產卵數對溫度的非線性回歸方程為y=e0.242x2.884.當x=28℃時,y≈49.預測當氣溫為28℃時,產卵數為49個.綜上所述,在本題中指數函數模型比一元線性模型、二次函數模型有更好的擬合效果.【小結】對于給定的樣本點(x1,y1),(x2,y2),…,(xn,yn),其中a和b都是未知參數.應先根據散點圖或利用相關系數r判斷兩變量間是否存在線性相關關系,若兩變量線性相關性顯著,采用例1的方法進行線性回歸分析;若兩變量線性相關性不顯著,則可采用例2的方法和步驟進行擬合效果分析.在某種產品表面進行腐蝕線實驗,得到腐蝕深度y與腐蝕時間t之間對應的一組數據:時間t(s)5101520304050607090120深度y(μm)610101316171923252946試求腐蝕深度y對時間t的回歸直線方程.【解析】經計算可得相關系數r≈0.982>0.75,所以可以認為y與t之間有較強的線性相關關系.≈46.36,≈19.45,=36750,=5422,tiyi=13910.b==≈0.3.a=b=19.450.3×46.36≈5.542.故所求的回歸直線方程為y=0.3t+5.542.一機器可以按各種不同的速度運轉,其生產物件有一些會有缺點,每小時生產有缺點物件的多少隨機器運轉速度而變化,用x表示轉速(單位:轉/秒),用y表示每小時生產的有缺點物件個數,現觀測得到(x,y)的4組觀測值為(8,5),(12,8),(14,9),(16,11).(1)假定y與x之間有線性相關關系,求y對x的回歸直線方程;(2)若實際生產中所容許的每小時最大有缺點物件數為10,則機器的速度不得超過多少轉/秒.(精確到1轉/秒)【解析】(1)設回歸直線方程為y=bx+a,=12.5,=8.25,=660,xiyi=438.于是b===,a=b=8.25×12.5=×=.故所求的回歸直線方程為y=x.(2)由y=x≤10,得x≤≈15,即機器速度不得超過15轉/秒.為了研究某種細菌隨時間x變化時,繁殖個數y的變化,收集數據如下:天數x/天123456繁殖個數y/個612254995190(1)用天數x作解釋變量,繁殖個數y作預測變量,作出這些數據的散點圖;(2)建立解釋變量x與預測變量y之間的回歸方程.【解析】(1)所作散點圖如圖所示.(2)由散點圖看出樣本點分析在一條指數函數y=c1的周圍,于是令z=lny,則x、z數據如下表格,x123456z1.792.483.223.894.555.25由計算器得z=0.69x+1.112,r≈0.9999>0.75,則有y=e0.69x+1.112.1.給定x與y的一組樣本數據,求得相關系數r=0.690,則().A.y與x的線性相關性很強B.y與x的相關性很強C.y與x正相關 D.y與x負相關【解析】因為|r|=0.69<0.75,所以y與x的線性相關性不顯著,排除A、B,又因為r=0.690<0,故選D.【答案】D2.下列兩個變量之間的關系不是函數關系的是().A.角度和它的正切值B.人的右手一柞長和身高C.正方體的棱長和表面積D.真空中自由落體運動物體的下落距離和下落時間【解析】由正切函數y=tanx知A是函數關系;人的右手一柞長和身高不是確定的關系,故B不是函數關系;設正方體的棱長為a,則它的表面積S=6a2,C是函數關系;由物理知識知,自由落體運動物體的下落距離h和下落時間t滿足h=gt2(t>0),D是函數關系.【答案】B3.已知回歸直線的方程為y=22.5x,則當x=25時,y的估計值是.

【解析】將x=25代入方程得y=22.5×25=60.5.【答案】60.54.某市統計1994~2004年在校中學生每年高考考入大學的百分比,把農村、縣鎮、城市分開統計,為了便于計算,把1994年編號為0,1995年編號為1,…,2004年編號為10,如果把每年考入大學的百分比作為統計變量,把年份從0到10作為自變量進行回歸分析,可得到下面三條回歸直線,城市:y=9.50+2.54x;縣鎮:y=6.76+2.32x;農村:y=1.80+0.42x.(1)對于農村學生來講,系數等于0.42意味著什么?(2)在這一階段,哪里的大學入學率增長最快?【解析】(1)對于農村學生來講,系數等于0.42意味著1994~2004年在校中學生每年高考考入大學的百分比逐年增加0.42.(2)在這一階段,城市的大學入學率增長最快.(2011年·山東卷)某產品的廣告費用x(萬元)與銷售額y(萬元)的統計數據如下表:廣告費用x(萬元)4235銷售額y(萬元)49263954根據上表可得回歸方程y=bx+a中的b為9.4,據此模型預測廣告費用為6萬元時銷售額為().A.63.6萬元 B.65.5萬元C.67.7萬元 D.72.0萬元【解析】由表可計算==,==42,因為點(,42)在回歸直線y=bx+a上,且b為9.4,所以42=9.4×+a,解得a=9.1,故回歸方程為y=9.4x+9.1,將x=6代入方程得y=65.5,選B.【答案】B

1.觀察兩個變量(存在線性相關關系)的數據如下:x106.995.012.983.9857.998.01y97534.014.9978則兩變量間的線性回歸方程為().A.y=x+1B.y=xC.y=2x+ D.y=x+1【解析】由于線性回歸方程一定經過樣本點的中心(,),所以本題只需求出,,然后代入所給選項進行檢驗,即可得到答案.由表中數據可得=0,=0,只有B項中的方程過點(0,0),故選B.【答案】B2.在以下四個散點圖中(如圖所示),適用于作線性回歸的散點圖為().A.①② B.①③C.②③ D.③④【解析】①表示正相關,③表示負相關.【答案】B3.若線性回歸方程y=a+bx中,b=0,則相關系數r=.

【解析】由b==0,得(xi)(yi)=0,所以r==0.【答案】04.某種產品的廣告費用支出x(萬元)與銷售額y(萬元)之間有如下的對應數據:x(萬元)24568y(萬元)3040605070(1)求相關系數和回歸直線方程;(2)據此預測廣告費用支出為10萬元時銷售收入y的值.【解析】(1)=(2+4+5+6+8)=5,=(30+40+60+50+70)=50,=22+42+52+62+82=145,=302+402+602+502+702=13500,xiyi=1380,r=≈0.919>0.75,即兩變量間有很強的線性相關關系.b==6.5,a=b=506.5×5=17.5,故回歸直線方程為y=6.5x+17.5.(2)當x=10時,預測y的值為y=10×6.5+17.5=82.5.5.已知對一組觀測值(xi,yi)作出散點圖后,確定其具有線性相關關系.若對于y=bx+a,求得b=0.51,=61.75,=38.14,則回歸直線方程為().A.y=0.51x+6.65 B.y=6.65x+0.51C.y=0.51x+42.30 D.y=42.30x+0.51【解析】y=bx+a過點(,),∴a=b=38.140.51×61.75≈6.65,∴y=0.51x+6.65.【答案】A6.煉鋼時鋼水的含碳量與冶煉時間是().A.確定性關系 B.相關關系C.函數關系 D.無任何關系【解析】解答本題的關鍵是弄清相關關系的定義及相關關系與函數關系的區別.【答案】B7.某化工廠為預測某產品的回收率y,需要研究它和原料有效成分含量x之間的線性相關關系,現取8組觀測值,計算得xi=52,yi=228,=478,xiyi=1849,則y與x的回歸直線方程是.(精確到小數點后兩位數)

【解析】根據給出的數據可先求=xi=6.5,=yi=28.5,然后代入公式b==≈2.62,從而a=bx=28.52.62×6.5=11.47,所以回歸直線方程y=11.47+2.62x.【答案】y=11.47+2.62x8.在彩電顯影中,由經驗可知形成染料光學密度y與析出銀的光學密度x的公式為y=A(b<0),現測得試驗數據如下:xi0.050.060.250.310.070.100.380.430.140.200.47yi0.100.141.001.120.230.371.191.250.590.791.29試求y對x的回歸方程.【解析】由題意知,對于給定的公式y=A(b<0)兩邊取自然對數,得lny=lnA+.與線性回歸方程相對照可以看出,只要令u=,v=lny,a=lnA,就有v=a+bu.這是v對u的線性回歸方程,對此再套用相關系數公式,求回歸系數a和b.題目中所給的數據由變量置換u=,v=lny,變為如下所示的數據:ui20.00016.6674.0003.22614.28610.000vi2.3031.96600.1131.4700.994ui2.6322.3267.1435.0002.128vi0.1740.2230.5280.2360.255可以求出|r|≈0.998>0.75.可知u與v具有很強的線性相關關系.再求出b≈0.146,a≈0.548,所以v=0.5480.146u,把u和v置換回來,得lny=0.548,所以y==e0.548·≈1.73,所以y對x的回歸方程為y=1.73.9.一唱片公司預測支出費用x(十萬元)與唱片銷售量y(千張)之間的關系,從其所發行的唱片中隨機抽選了10千張,得到如下的資料:xi=28,=303.4,yi=75,=598.5,xiyi=237,則y與x的相關系數r的絕對值為.

【解析】根據公式,得相關系數r===0.3,所以|r|=0.3.【答案】0.310.測得某國10對父子身高(單位:英寸)如下:父親身高(x)60626465666768707274兒子身高(y)63.665.26665.566.967.167.468.370.170(1)對變量y與x進行相關性檢驗;(2)如果y與x之間具有線性相關關系,求回歸方程;(3)如果父親的身高為73英寸,估計兒子的身高.【解析】(1)=66.8,=67.01,=4462.24,=44974,=4490.3401,=44941.93,xiyi=44842.4,r===≈0.98,所以y與x之間具有很強的線性相關關系.(2)設回歸方程為y=bx+a.由b===≈0.4646,a=b=67.010.4646×66.8≈35.97.故所求的回歸方程為y=0.4646x+35.97.(3)當x=73時,y=0.4646×73+35.97≈69.9,所以當父親的身高為73英寸時,估計兒子的身高為69.9英寸.第3課時獨立性檢驗1.通過對典型案例(如“患肺癌與吸煙有關嗎”等)的探究.了解獨立性檢驗(只要求2×2列聯表)的基本思想、方法及初步應用.2.過程與方法:引導學生形成“自主學習”“合作學習”等良好的學習方式,培養學生的歸納概括能力.重點:了解獨立性檢驗的基本思想.難點:獨立性檢驗的基本思想、隨機變量χ2的含義及獨立性檢驗的步驟.經常上網會影響學習嗎?下表為教育部對1000名中學生進行調查的結果.經常上網影響學習嗎?如何判斷?經常上網不經常上網合計不及格80120200及格120680800合計2008001000問題1:(1)通過上述數據經常上網的人成績及格的比例為60%,不經常上網的人成績及格的比例為85%,這個數據可以初步判斷經常上網對學習成績是有影響的,但這種說法的把握性有多大,還需要進行獨立性檢驗才知道.

(2)獨立性檢驗的概念用統計量χ2的大小來研究兩個變量是否有關系的方法,稱為獨立性檢驗.問題2:兩個分類變量A和B的2×2列聯表一般地,假設有兩個分類變量A和B,它們的可能取值分別為{A1,A2}和{B1,B2},其樣本頻數列聯表(稱為2×2列聯表)為:BAB1B2總計A1aba+b

A2cdc+d

總計a+c

b+d

a+b+c+d

問題3:統計量χ2的計算公式是怎樣的?若有如下列聯表所示的抽樣數據:類1類2總計類Aaba+b類Bcdc+d總計a+cb+da+b+c+d則χ2=

(其中n=a+b+c+d).

問題4:根據χ2判斷兩變量是否有關聯當χ2≤2.706時,沒有充分的證據判定變量A、B有關聯,可以認為變量A、B是沒有關聯的;

當χ2>2.706時,有90%的把握判定變量A、B有關聯;

當χ2>3.841時,有95%的把握判定變量A、B有關聯;

當χ2>6.635時,有99%的把握判定變量A、B有關聯.

獨立性檢驗的必要性為什么不能只憑列聯表中的數據和由其繪出的圖形下結論?由列聯表可以粗略地估計出兩個分類變量是否有關(即粗略地進行獨立性檢驗),但2×2列聯表中的數據是樣本數據,它只是總體的代表,具有隨機性,故需要用獨立性檢驗的方法確認所得結論在多大程度上適用于總體.1.在吸煙與患肺病是否相關的研究中,有下面的說法:①若χ2=6.7,我們有99%的把握判定吸煙與患肺病有關聯,那么在100個吸煙的人中必有99個患肺病;②從獨立性檢驗可知有99%的把握判定吸煙與患肺病有關聯時,若某人吸煙,那么他有99%的可能患有肺病;③從統計量中求出有95%的把握判定吸煙與患肺病有關聯,是指有5%的可能性使得推斷出現錯誤.其中說法正確的個數為().A.0B.1C.2D.3【解析】χ2是檢測吸煙與患肺病相關程度的量,是一種相關關系,而不是確定關系,只能反映有關和無關的概率.故①②錯誤,③正確.【答案】B2.分類變量X和Y的2×2列聯表如下,則().YXY1Y2總計X1aba+bX2cdc+d總計a+cb+da+b+c+dA.其他值一定時,adbc越小,說明X與Y的關系越弱B.其他值一定時,adbc越大,說明X與Y的關系越強C.其他值一定時,(adbc)2越大,說明X與Y的關系越強D.其他值一定時,(adbc)2越接近于0,說明X與Y的關系越強【解析】由統計量χ2的計算公式χ2=可知其他值一定的情況下,(adbc)2越大,則χ2的值越大,則X與Y的關系越強,故選C.【答案】C3.在對某小學的學生吃零食的調查中,得到數據如下表:吃零食不吃零食總計男學生243155女學生82634總計325789根據上述數據分析,我們可以得出χ2=.

【解析】χ2=≈3.689.【答案】3.6894.某高校《統計》課程的教師隨機給出了主修該課程的一些情況,具體數據如下:非統計專業統計專業男1310女720為了判斷主修統計專業是否與性別有關,根據表中數據,得χ2=≈4.844,若判定主修統計專業與性別有關,則這種判斷出錯的可能性有多大?【解析】根據樣本數據計算χ2≈4.844>3.841,即有95%以上的把握認為主修統計專業與性別有關,即這種判斷出錯的可能性為10.95=0.05.獨立性檢驗的應用有人發現,多看電視容易使人變冷漠,下表是一個調查機構對此現象的調查結果:冷漠不冷漠總計多看電視6842110少看電視203858總計8880168請你判斷大約有多大的把握認為多看電視與人變冷漠有關系.【方法指導】利用χ2的公式求出χ2的值,并與臨界值進行比較得出結論.【解析】根據表中的數據,得到χ2=≈11.377>6.635,所以有99%以上的把握認為多看電視與人變冷漠有關系.【小結】本題是利用公式求出χ2的值,再利用其與臨界值的大小關系來判斷獨立性.解題時應注意準確地代入數據進行計算.正確推斷獨立性檢驗的結果在對人們的休閑方式的一次調查中,共調查了124人,其中女性70人,男性54人.女性中有43人主要的休閑方式是看電視,另外27人主要的休閑方式是運動;男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運動.(1)根據以上數據建立一個2×2列聯表;(2)判斷性別與休閑方式是否有關.【方法指導】(1)列2×2列聯表,統計男、女人數以及看電視、運動的人數,填出表格.(2)把(1)中的數據代入公式求出χ2的值,并與臨界值比較.【解析】(1)2×2列聯表如下:看電視運動總計女432770男213354總計6460124(2)計算χ2=≈6.201.∵6.635>χ2>3.841,∴有95%以上的把握認為休閑方式與性別有關.【小結】在日常生活中,我們經常會遇到一些需要推斷的問題.推斷時,不能僅憑主觀意愿作出結論,需要通過實驗(或調查)來收集數據,并根據獨立性檢驗的基本思想作出合理的推斷.獨立性檢驗與統計的綜合應用某校為了探索一種新的教學模式,進行了一項課題實驗,乙班為實驗班,甲班為對比班,甲、乙兩班均有50人,一年后對兩班進行測試,成績如下表(總分:150分):甲班成績[80,90)[90,100)[100,110)[110,120)[120,130)人數42015101乙班成績[80,90)[90,100)[100,110)[110,120)[120,130)人數11123132(1)現從甲班成績位于[90,120)內的試卷中抽取9份進行試卷分析,請問用什么抽樣方法更合理,并寫出最后的抽樣結果;(2)根據所給數據可估計在這次測試中,甲班的平均分是101.8,請你估計乙班的平均分,并計算兩班平均分相差幾分;(3)完成下面2×2列聯表,并判斷能否有95%以上的把握,認為這兩個班在這次測試中成績的差異與實施課題實驗有關.請說明理由.成績小于100分成績不小于100分總計甲班a=

2650乙班12d=

50總計3664100【方法指導】(1)先由3組數據存在差異確定抽樣方法并計算抽樣比,從而確定各區間抽樣份數.(2)累加各組的組中值與頻率的積,并計算乙班的平均分,從而得到兩班平均分的差.(3)根據所給的數據得到2×2列聯表,由列聯表中的數據求出χ2,結合臨界值表得出結論.【解析】(1)用分層抽樣的方法更合理.甲班成績位于[90,120)內的試卷共有20+15+10=45份,從中抽取9份,抽樣比為=,故在[90,100),[90,110),[110,120)各分數段內抽取試卷20×=4份,15×=3份,10×=2份.(2)估計乙班的平均分為=85×+95×+105×+115×+125×=105.8,105.8101.8=4,即兩班的平均分差4分.(3)補全列表如下:成績小于100分成績不小于100分總計甲班a=242650乙班12d=3850總計3664100由表中的數據計算得χ2==6.25,因為6.25>3.841,所以有95%以上的把握認為這兩個班在這次測試中成績的差異與實施課題實驗有關.【小結】近幾年高考中較少單獨考查獨立性檢驗,而是與頻率分布表融合在一起考查,一般需要根據條件列出2×2列聯表,計算χ2的值,從而解決問題.研究人員選取170名青年男女大學生作為樣本,對他(她)們進行一種心理測驗,發現有60名女生對該心理測驗的最后一個題目的反應是:作肯定的18名,否定的42名;男生110名在相同的項目上做出肯定的有22名,否定的有88名.請問性別與態度之間是否存在某種關系?【解析】根據題目所給數據建立如下2×2列聯表:肯定否定總計男生2288110女生184260總計40130170由列聯表中的數據得χ2=≈2.158<2.706.因此,沒有充分的證據顯示“性別與態度有關”.為了研究色盲與性別的關系,調查了1000人,調查結果如下表所示:男女正常442514色盲386根據上述數據,試問:色盲與性別是否是相互獨立的?【解析】由已知條件可得下表:男女總計正常442514956色盲38644總計4805201000依據公式得χ2=≈27.139.由于27.139>6.635,所以有99%以上的把握認為色盲與性別是有關的,從而可以認為色盲與性別不是相互獨立的.電視傳媒公司為了了解某地區電視觀眾對某類體育節目的收視情況,隨機抽取了100名觀眾進行調查,其中女性有55名.下面是根據調查結果繪制的觀眾日均收看該體育節目時間的頻率分布直方圖:將日均收看該體育節目時間不低于40分鐘的觀眾稱為“體育迷”,已知“體育迷”中有10名女性,根據已知條件完成下面的2×2列聯表,并據此資料你是否認為“體育迷”與性別有關?【解析】由所給的頻率分布直方圖知,“體育迷”人數為100×(10×0.020+10×0.005)=25.“非體育迷”人數為75,則據題意完成2×2列聯表:非體育迷體育迷合計男301545女451055合計7525100將2×2列聯表的數據代入公式計算:χ2==≈3.03.因為3.03>2.706,所以有90%以上的把握認為“體育迷”與性別有關.1.2×2列聯表如下:y1y2總計x1a2173x252530總計b46103則a,b的值分別為().A.94,99B.52,57C.52,47D.57,52【解析】a+21=73?a=52,故b=52+5=57.【答案】B2.為了了解高中生作文成績與課外閱讀量之間的關系,某研究機構隨機抽取了60名高中生,通過問卷調查,得到以下數據:作文成績優秀作文成績一般總計課外閱讀量較大221032課外閱讀量一般82028總計303060由以上數據,計算得到χ2=9.643,根據臨界值表,以下說法正確的是().A.沒有充足的理由認為課外閱讀量大與作文成績優秀有關B.有1%的把握認為課外閱讀量大與作文成績優秀有關C.有95%的以上把握認為課外閱讀量大與作文成績優秀有關D.有99%的以上把握認為課外閱讀量大與作文成績優秀有關【解析】根據臨界值表,χ2≈9.643>6.635,在犯錯誤的概率不超過0.01的前提下,認為課外閱讀量大與作文成績優秀有關系,即有99%以上的把握認為課外閱讀量大與作文成績優秀有關.【答案】D3.對于χ2有下列幾種取值:①χ2>12;②χ2>0;③χ2>4;④χ2<2.其中有把握說兩事件無關的是(填序號).

【解析】根據三個臨界值可得,當χ2≤2.706時,可判斷兩事件無關.【答案】④4.研究小麥種子經滅菌與否跟發生黑穗病的關系,經試驗觀察,得到數據如下表所示:種子滅菌種子未滅菌合計黑穗病26184210無黑穗病50200250合計76384460試按照原試驗目的作統計分析推斷.【解析】由列聯表得χ2==≈4.804,由于χ2≈4.804>3.841,所以有95%以上的把握認為種子滅菌與否與小麥發生黑穗病是有關系的.(2013年·福建卷)某工廠有25周歲以上(含25周歲)工人300名,25周歲以下工人200名.為研究工人的日平均生產量是否與年齡有關,現采用分層抽樣的方法,從中抽取了100名工人,先統計了他們某月的日平均生產件數,然后按工人年齡在“25周歲以上(含25周歲)”和“25周歲以下”分為兩組,再將兩組工人的日平均生產件數分成5組:[50,60),[60,70),[70,80),[80,90),[90,100]分別加以統計,得到如圖所示的頻率分布直方圖.(1)從樣本中日平均生產件數不足60件的工人中隨機抽取2人,求至少抽到一名“25周歲以下組”工人的概率;(2)規定日平均生產件數不少于80件者為“生產能手”,請你根據已知條件完成2×2列聯表,并判斷是否有90%以上的把握認為“生產能手與工人所在的年齡組有關”?【解析】(1)由已知得,樣本中有25周歲以上組工人60名,25周歲以下組工人40名.所以,樣本中日平均生產件數不足60件的工人中,25周歲以上組工人有60×0.05=3人,記為A1,A2,A3;25周歲以下組工人有40×0.05=2人,記為B1,B2.從中隨機抽取2名工人,所有的可能結果共有10種,它們是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周歲以下組”工人的可能結果共有7種,它們是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.(2)由頻率分布直方圖可知,在抽取的100名工人中,“25周歲以上組”中的生產能手60×0.25=15人,“25周歲以下組”中的生產能手40×0.375=15人,據此可得2×2列聯表如下:生產能手非生產能手合計25周歲以上組15456025周歲以下組152540合計3070100所以χ2==≈1.79.因為1.79<2.706,所以沒有90%以上的把握認為“生產能手與工人所在的年齡組有關”.

1.如果有95%以上的把握說事件A與事件B有關,那么具體算出的數據應滿足().A.χ2>3.841B.χ2<3.841C.χ2>6.635 D.χ2<6.635【解析】根據對變量的獨立性進行判斷的結果知選A.【答案】A2.對于獨立性檢驗,下列說法錯誤的是().A.兩事件頻數相關越小,χ2就越小B.兩事件頻數相關越小,χ2就越大C.χ2≤2.706時,事件A與事件B無關D.χ2>6.635時,有99%的把握說事件A與事件B有關【解析】由χ2及對變量的獨立性進行檢驗可以判斷A、C、D正確,B不正確.【答案】B3.若由一個2×2列聯表中的數據計算得χ2=4.013,那么有以上的把握認為兩個變量有關系.

【答案】95%4.某企業為考察生產同一種產品的甲、乙兩條生產線的產品合格率,同時各抽取100件產品,檢驗后得到如下列聯表:合格不合格總計甲線973100乙線955100總計1928200請問甲、乙兩條生產線生產的產品合格率在多大程度上有關系?【解析】根據列聯表中的數據,可以求得χ2=≈0.521<2.706.因此沒有充分的證據判定甲、乙兩條生產線生產的產品合格率有關系.5.在研究吸煙與患肺癌的關系中,通過收集數據、整理分析數據得“吸煙與患肺癌有關”的結論,并且有99%以上的把握認為這個結論是成立的,下列說法中正確的是().A.100個吸煙者中至少有99人患有肺癌B.1個人吸煙,那么這個人99%患有肺癌C.在100個吸煙者中一定有患肺癌的人D.在100個吸煙者中可能一個患肺癌的人也沒有【解析】獨立性檢驗的結果是可能值,而不是確定的,故選D.【答案】D6.假設有兩個分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其2×2列聯表為:YXy1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d對同一樣本,以下數據能說明X與Y有關的可能性最大的一組為().A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5 D.a=3,b=2,c=4,d=5【解析】通過計算可知選D.【答案】D7.下列關于χ2的說法中,正確的是.

①χ2在任何相互獨立問題中都可以用于檢驗是否相關;②χ2越大,兩個事件的相關性越大;③χ2是用來判斷兩個相互獨立事件相關與否的一個統計量,它可以用來判斷兩個事件是否相關這一類問題.【解析】①錯,不是任何相互獨立問題都能用χ2檢驗;②錯,χ2的值只能體現把握性的大小,不能體現相關性.【答案】③8.為調查某地區老年人是否需要志愿者提供幫助,用簡單隨機抽樣的方法從該地區調查了500位老年人,結果如下:性別是否需要志愿者男女需要4030不需要160270(1)估計該地區老年人中,需要志愿者提供幫助的老年人的比例;(2)能否有99%以上的把握認為該地區的老年人是否需要志愿者提供幫助與性別有關?(3)根據(2)的結論,能否提出更好的調查方法來估計該地區的老年人中,需要志愿者提供幫助的老年人的比例?說明理由.【解析】(1)調查的500位老年人中有70位需要志愿者提供幫助,因此該地區老年人中,需要提供幫助的老年人的比例約為=14%.(2)χ2=≈9.967.由于9.967>6.635,所以有99%以上的把握認為該地區的老年人是否需要幫助與性別有關.(3)由(2)的結論知,該地區老年人是否需要幫助與性別有關,并且從樣本數據能看出該地區男性老年人與女性老年人中需要幫助的比例有明顯差異,因此在調查時,先確定該地區老年人中男、女的比例,再把老年人分成男、女兩層并采用分層抽樣方法,比采用簡單隨機抽樣的方法更好.9.在研究性別與吃零食這兩個分類變量是否有關系時,下列說法中正確的是.

①若χ2=6.7,則我們在犯錯誤的概率不超過0.01的前提下認為吃零食與性別有關系,那么在100個吃零食的人中必有99人是女性;②由獨立性檢驗可知在犯錯誤的概率不超過0.01的前提下認為吃零食與性別有關系時,如果某人吃零食,那么此人是女性的可能性為99%;③用獨立性檢驗可知在犯錯誤的概率不超過0.01的前提下認為吃零食與性別有關系時,是指每進行100次這樣的推斷,平均有1次推斷錯誤.【解析】χ2值是支持確定有多大的把握認為“吃零食與性別有關系”的隨機變量值,所以由獨立性檢驗可知在犯錯誤的概率不超過0.01的前提下認為吃零食與性別有關系時,是指每進行100次這樣的推斷,平均有1次推斷錯誤,故填③.【答案】③10.為檢驗回答一個問題的對錯是否和性別有關,有人做了一次調查,其中女生人數是男生人數的,男生答對人數占男生人數的,女生答錯人數占女生人數的.(1)若有99%以上的把握認為回答結果的對錯和性別有關,則男生至少有多少人?(2)若沒有充分的證據顯示回答結果的對錯和性別有關,則男生至多有多少人?【解析】設男生人數為x,依題意得2×2列聯表如下:對錯總計男生x女生總計x(1)若有99%以上的把握認為回答結果的對錯和性別有關,則χ2>6.635.由χ2==>6.635,解得x>17.69.∵,為整數,∴若有99%以上的把握認為回答結果的對錯和性別有關,則男生至少有18人.(2)沒有充分的證據顯示回答結果的對錯和性別有關,則χ2≤2.706.由χ2==≤2.706,解得x≤7.216.∵,為整數,∴若沒有充分的證據顯示回答結果的對錯和性別有關,則男生至多有6人.第三章章末小結1.回歸分析(1)回歸分析步驟:收集數據→作散點圖→求回歸直線方程→利用方程進行預測.

(2)線性回歸模型:y=bx+a,其中=

xi,=

yi,

2.相關系數樣本相關系數:對于變量y與x的一組觀測值,把r==叫作變量y與x之間的樣本相關系數,簡稱相關系數,用它來衡量兩個變量之間的線性相關程度,|r|≤1.當r>0時,表明兩個變量正相關;當r<0時,表明兩個變量負相關.|r|越接近1,相關程度越大;且|r|越接近0,相關程度越小.

3.幾種能轉化為線性回歸模型的非線性回歸模型(1)冪函數曲線y=axb作變換u=lny,v=lnx,c=lna,得線性函數u=c+bv.

(2)指數曲線y=aebx作變換u=lny,c=lna,得線性函數u=c+bx.

(3)倒指數曲線y=a作變換u=lny,c=lna,v=,得線性函數u=c+bv.

(4)對數曲線y=a+blnx作變換u=y,v=lnx,得線性函數u=a+bv.

4.χ2的計算公式及其特點(1)根據2×2列聯表與構造的隨機變量χ2=

(其中n=a+b+c+d是樣本容量)來計算χ2的值;

(2)當數據量較大時,統計學中已有明確的結論,隨機事件χ2≥x0發生的概率如下:當χ2≤2.706時,沒有充分的證據判定變量A、B有關聯,可以認為變量A、B是沒有關聯的;

當χ2>2.706時,有90%的把握判定變量A、B有關聯;

當χ2>3.841時,有95%的把握判定變量A、B有關聯;

當χ2>6.635時,有99%的把握判定變量A、B有關聯.

由于抽樣的隨機性,由樣本得到的推斷有可能正確,也有可能錯誤.利用χ2進行獨立性檢驗,可以對推斷正確的概率作出估計,樣本容量n越大,估計越準確.

題型1:變量間相關關系的分析研究某灌溉渠道水的流速與水深之間的關系,測得一組數據如下:水深x(m)1.401.501.601.701.801.902.002.10流速y(m/s)1.701.791.881.952.032.112.162.2(1)求y對x的回歸直線方程;(2)預測水深為1.95m時水的流速約是多少.【方法指導】結合公式求回歸方程,再根據回歸方程作出預測即可.【解析】(1)=×14.00=1.75,=×15.82=1.9775,xiyi=27.991,=24.92.r≈0.994>0.75,即兩變量間有很強的線性相關關系.b=≈0.729,a=1.97750.729×1.75≈0.7018,所以y對x的回歸方程為y=a+bx=0.7018+0.729x.(2)由上述(1)中求出的回歸直線方程,把x=1.95代入方程,得y=0.7018+0.729×1.95≈2.12,計算結果表明,當水深為1.95m時可以預測水的流速為2.12m/s.【小結】求解此類問題要注意判斷兩變量間是否滿足線性相關關系.題型2:非線性回歸分析下表是1957年美國舊轎車價格的調查資料.使用年數12345678910平均價格(美元)2651194314941807765538484290226204已知轎車使用年數x和相應的平均價格y(美元)之間存在y=ea+bx的關系,試求出y對x的回歸方程.【方法指導】本題是一個非線性回歸問題.解決這類題,首先應畫出兩變量的散點圖(題設中未告知兩變量符合哪類函數時,根據散點圖確定擬合函數),再對給出的函數(或擬合函數)進行變量代換,轉化成線性回歸問題,求出對應的回歸直線的方程,最后將回歸直線方程中的變量代換,還原回題設中的變量,從而將線性回歸方程轉化為兩變量的非線性回歸方程.【解析】由題意知,對于給定的y=ea+bx,兩邊取自然對數,得lny=a+bx,設u=lny,就有u=a+bx,根據題中表格列出下表:ixiuixiui117.883162.1427.883227.572457.33515.144337.309953.42121.927447.4991656.24129.996556.6402544.09033.200666.2883639.53937.728776.1824938.21743.274885.6706432.14945.360995.4218129.38748.78910105.31810028.28153.180∑5565.782385440.796336.481則=5.5,=6.578.由r==≈0.979,|r|=0.979>0.75,所以u和x線性相關.又因為b==≈0.307,a=b=6.578+0.307×5.5≈8.267.所以u=8.2670.307x,把u用lny代回得,y=e8.2670.307x.【小結】解決非線性回歸問題的方法步驟:(1)確定變量:確定解釋變量為x,預報變量為y;(2)畫散點圖:通過觀察散點圖并與學過的函數(冪函數、指數函數、對數函數、二次函數)作比較,選取擬合效果較好的函數模型;(3)變量置換:通過變量置換把非線性問題轉化為線性回歸問題;(4)分析擬合效果;(5)寫出非線性回歸方程.題型3:獨立性檢驗為了考察某種藥物預防疾病的效果,任選105只動物做試驗,其中55只服用此種藥,50

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論