人教版高數選修2-3第7講:獨立性檢驗與回歸分析(教師版)_第1頁
人教版高數選修2-3第7講:獨立性檢驗與回歸分析(教師版)_第2頁
人教版高數選修2-3第7講:獨立性檢驗與回歸分析(教師版)_第3頁
人教版高數選修2-3第7講:獨立性檢驗與回歸分析(教師版)_第4頁
人教版高數選修2-3第7講:獨立性檢驗與回歸分析(教師版)_第5頁
已閱讀5頁,還剩5頁未讀 繼續免費閱讀

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

獨立性檢驗與回歸分析____________________________________________________________________________________________________________________________________________________________________1.了解變量間的相關關系,能根據給出的線性回歸方程系數建立線性回歸方程.2.了解獨立性檢驗(只要求2×2列聯表)的基本思想、方法及其簡單應用.3.了解回歸分析的基本思想、方法及其簡單應用.1.獨立性檢驗(1)概念:用統計量研究獨立性問題的檢驗的方法稱為獨立性檢驗.(2)m×n列聯表指有m行n列的列聯表(3)必備公式2.統計量中的四個臨界值經過對統計量分布的研究,已經得到了四個經常用到的臨界值:2.706、3.841、6.635、10.828.由2×2列聯表計算出,然后與相應的臨界值進行比較,當>2.706時,有90%的把握說事件A與B有關.當>3.841時,有95%的把握說事件A與B有關.當>6.635時,有99%的把握說事件A與B有關.當>10.828時,有99.9%的把握說事件A與B有關.當≤2.706時,認為事件A與B是無關的.3.回歸分析(1)線性回歸模型是指方程,其中稱為確定性函數,稱為隨機誤差.(2)線性回歸方程是指直線方程,其中回歸截距、回歸系數公式如下:==.(3)參數r檢驗線性相關的程度,計算公式為r=,即r=化簡后r=,其中表示數據(i=1,2,…,n)的標準差,這個r稱為y與x的樣本相關系數,簡稱相關系數,其中-1≤r≤1.若r>0,則x與y是正相關,若r<0,則x與y是負相關,若r=0,則x與y不相關,r=1或r=-1時,x與y為完全線性相關.類型一.獨立性檢驗例1:為考察高中生的性別與是否喜歡數學課程之間的關系,在某城市的某校高中生中隨機抽取300名學生,得到如下列聯表:喜歡數學課程不喜歡數學課程合計男生3785122女生35143178合計72228300判斷性別與是否喜歡數學課程有關嗎?[解析]假設:性別與是否喜歡數學課程無關,由卡方計算公式得所以我們可以拒絕從而有95%的把握認為性別與是否喜歡數學課程有關系.練習1:為了研究子女吸煙與父母吸煙的關系,調查了一千多名青少年及其家長,數據如下:父母吸煙父母不吸煙合計子女吸煙23783320子女不吸煙6785221200合計9156051520用獨立性檢驗方法判斷父母吸煙對子女是否吸煙有影響.[解析]提出假設:父母吸煙對子女是否吸煙沒有影響,由列聯表中的數據得到:所以有99.9%的把握認為:父母吸煙對子女是否吸煙有影響.類型二.變量間的相關關系及線性回歸方程例2:下列關系中,是帶有隨機性相關關系的是______.①正方形的邊長與面積之間的關系;②水稻產量與施肥量之間的關系;③人的身高與年齡之間的關系;④降雪量與交通事故的發生率之間的關系.[答案]②④[解析]兩變量之間的關系有兩種:函數關系與帶有隨機性的相關關系.①正方形的邊長與面積之間的關系是函數關系.②水稻產量與施肥量之間不是嚴格的函數關系,但是具有相關性,因而是相關關系.③人的身高與年齡之間的關系既不是函數關系,也不是相關關系,因為人的年齡達到一定時期身高就不發生明顯變化了,因而他們不具有相關關系.④降雪量與交通事故的發生率之間具有相關關系.例3:某工業部門進行一項研究,分析該部門的產量與生產費用的關系,從這個工業部門內隨機抽選了10個企業作樣本,資料如下表:產量x(千克)40424855657988100120140生產費用y(千克)150140160170150162185165190185根據表格求出回歸直線方程.[解析]∴回歸直線方程為練習1:下列兩個變量之間的關系哪個不是函數關系()(A)角度和它的余弦值(B)正方形邊長和面積(C)正n邊形的邊數和頂點角度之和(D)人的年齡和身高[答案]D[解析]人的身高與年齡只具有相關性類型三.相關檢驗與回歸分析例3:某工業部門進行一項研究,分析該部門的產量與生產費用之間的關系.從這個工業部門內隨機抽選了10個企業作樣本,有如下資料:產量x(千克)40424855657988100120140生產費用y(千克)150140160170150162185165190185完成下列問題:(1)計算x與y的相關系數;(2)對這兩個變量之間是否線性相關進行相關性檢驗;(3)設線性回歸方程為求系數[解析]由表可計算得:(1)(2)因為0.808>=0.632,所以認為x與y之間具有線性相關關系.(3)代入公式得練習1:某運動員訓練次數與運動成績之間的數據關系如下:次數(x)3033353739444650成績(y)3034373942464851試預測該運動員訓練47次以及55次的成績.[解析](1)可求得所以所以回歸直線方程為(2)計算相關系數將上述數據代入得r≈0.992704,查表可知0.707,而故y與x之間存在顯著的線性相關關系.(3)作出預報:由上述分析可知,我們可用回歸方程1.0415x-0.00386作為該運動員成績的預測值,將x=47和x=55分別代入該方程得和故預測該運動員訓練47次和55次成績分別為49和57.1.在調查中學生近視情況中,某校男生150名中有80名近視,女生140名中有70名近視,在檢驗這些中學生眼睛近視是否與性別有關時用什么方法最有說服力()A.期望與方差 B.排列與組合 C.獨立性檢驗 D.概率[答案]C2.通過對統計量的研究,得到了若干臨界值,當≤2.706時,我們認為事件A與B()A.有90%的把握認為A與B有關系B.有95%的把握認為A與B有關系C.沒有充分理由說明事件A與B有關系D.不能確定[答案]C3.下列關于的說法中正確的是()A.在任何相互獨立問題中都可以用來檢驗有關還是無關B.的值越大,兩個事件的相關性就越大C.是用來判斷兩個分類變量是否有關系的隨機變量,只對于兩個分類變量適合D.的觀測值的計算公式為[答案]C4.下列兩個變量之間的關系是相關關系的是()A.角度和它的余弦值 B.正方形邊長和面積C.正n邊形的邊數和頂點數 D.人的年齡和身高[答案]D5.由一組樣本數據得到的回歸方程為下面說法不正確的是()A.直線必經過點B.直線至少經過點中的一個點C.直線的斜率為D.直線和各點的偏差平方和是該坐標平面上所有直線與這些點的偏差平方和中最小的直線[答案]B6.有甲、乙兩個班級進行數學考試,按照大于等于85分為優秀,85分以下非優秀統計成績,得到如下所示的列聯表:優秀非優秀總計甲班10b乙班c30合計已知在全部105人中隨機抽取1人,成績優秀的概率為eq\f(2,7),則下列說法正確的是()A.列聯表中c的值為30,b的值為35B.列聯表中c的值為15,b的值為50C.根據列聯表中的數據,若按97.5%的可靠性要求,能認為“成績與班級有關系”D.根據列聯表中的數據,若按97.5%的可靠性要求,不能認為“成績與班級有關系”[答案]C7.為了判斷高中三年級學生是否選修文科與性別的關系,現隨機抽取50名學生,得到如下2×2列聯表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根據表中數據,得到K2=eq\f(50×(13×20-10×7)2,23×27×20×30)≈4.844.則認為選修文科與性別有關系出錯的可能性為________.[答案]5%8.某數學老師身高176cm,他爺爺、父親和兒子的身高分別是173cm、170cm和182cm.因兒子的身高與父親的身高有關,該老師用線性回歸分析的方法預測他孫子的身高為________cm.[答案]185__________________________________________________________________________________________________________________________________________________________________基礎鞏固1.(2014重慶卷)已知變量x與y正相關,且由觀測數據算得樣本平均數x=3,y=3.5,則由該觀測數據算得的線性回歸方程可能是()A.y^=0.4x+2.3 B.y^=2x-2.4C.y^=-2x+9.5 D.y^=-0.3x+4.4[答案]A2.(2014湖北卷)根據如下樣本數據:x345678y4.02.5-0.50.5-2.0-3.0得到的回歸方程為eq\o(y,\s\up6(^))=bx+a,則()A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0[答案]B3.(2014江西卷)某人研究中學生的性別與成績、視力、智商、閱讀量這4個變量的關系,隨機抽查52名中學生,得到統計數據如表1至表4,則與性別有關聯的可能性最大的變量是()成績性別不及格及格總計男61420女102232總計163652視力性別好差總計男41620女122032總計163652智商性別偏高正常總計男81220女82432總計163652閱讀量性別豐富不豐富總計男14620女23032總計163652A.成績 B.視力 C.智商 D.閱讀量[答案]D4.下列兩個變量之間的關系是相關關系的是()A.正方體的棱長和體積 B.角的弧度數和它的正弦值C.單產為常數時,土地面積和總產量 D.日照時間與水稻的畝產量[答案]D5.(2015福建)為了解某社區居民的家庭年收入所年支出的關系,隨機調查了該社區5戶家庭,得到如下統計數據表:收入(萬元)8.28.610.011.311.9支出(萬元)6.27.58.08.59.8根據上表可得回歸直線方程,其中,據此估計,該社區一戶收入為15萬元家庭年支出為()A.11.4萬元 B.11.8萬元 C.12.0萬元 D.12.2萬元[答案]B6.“回歸”一詞是在研究子女的身高與父母的身高之間的遺傳關系時,由高爾頓提出的.他的研究結果是子代的平均身高向中心回歸.根據他的結論,在兒子的身高y與父親的身高x的回歸方程中,()A.在(-1,0)內 B.等于0 C.在(0,1)內 D.在[1,+∞)[答案]C7.線性回歸方程中,回歸系數的含義是________________.[答案]x每增加一個單位,y相應地平均變化個單位8.在一項打鼾與患心臟病是否有關的調查中,共調查了1978人,經過計算28.63,根據這一數據分析,我們有理由認為打鼾與患心臟病是________的.(填“有關”、“無關”)[答案]有關能力提升1.下列說法:①將一組數據中的每一個數據都加上或減去同一個常數后,方差不變;②設有一個線性回歸方程eq\o(y,\s\up6(^))=3-5x,變量x增加1個單位時,y平均增加5個單位;③設具有相關關系的兩個變量x,y的相關系數為r,則|r|越接近于0,x和y之間的線性相關程度越強;④在一個2×2列聯表中,由計算得K2的值,則K2的值越大,判斷兩個變量間有關聯的把握就越大.其中錯誤的個數是()A.0 B.1 C.2 D.3[答案]C2.已知x與y之間的幾組數據如下表:x123456y021334假設根據上表數據所得線性回歸直線方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),若某同學根據上表中的前兩組數據(1,0)和(2,2)求得的直線方程為y=b′x+a′,則以下結論正確的是()A.eq\o(b,\s\up6(^))>b′,eq\o(a,\s\up6(^))>a′ B.eq\o(b,\s\up6(^))>b′,eq\o(a,\s\up6(^))<a′C.eq\o(b,\s\up6(^))<b′,eq\o(a,\s\up6(^))>a′ D.eq\o(b,\s\up6(^))<b′,eq\o(a,\s\up6(^))<a′[答案]C3.對相關系數r,下列說法正確的是()A.越大,相關程度越小 B.越小,相關程度越大C.越大,相關程度越小,越小,相關程度越大D.≤1且越接近1,相關程度越大,越接近0,相關程度越小[答案]D4.假設關于某設備的使用年限x(年)與所支出的維修費用y(萬元)有如下統計資料:x23456y2.23.85.56.57.0若由資料知,y對x呈線性相關關系,試求:(1)線性回歸方程;(2)估計設備的使用年限為10年時,維修費用約是多少?[答案](1)i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.0所以線性回歸方程是1.23x+0.08.(2)當x=10時,1.23×10+0.08=12.38(萬元),即估計設備用10年時,維修費用約是12.38萬元.5.假設關于某設備的使用年限x(年)和所支出的維修費用y(萬元)有如下表的統計資料:使用年限x(年)23456維修費用y(萬元)2.23.85.56.57.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論