吳堡中學高中數學第一章統計案例變量間的相關關系、回歸及獨立性檢驗知識精講素材北師大版選修1-2_第1頁
吳堡中學高中數學第一章統計案例變量間的相關關系、回歸及獨立性檢驗知識精講素材北師大版選修1-2_第2頁
吳堡中學高中數學第一章統計案例變量間的相關關系、回歸及獨立性檢驗知識精講素材北師大版選修1-2_第3頁
吳堡中學高中數學第一章統計案例變量間的相關關系、回歸及獨立性檢驗知識精講素材北師大版選修1-2_第4頁
吳堡中學高中數學第一章統計案例變量間的相關關系、回歸及獨立性檢驗知識精講素材北師大版選修1-2_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、變量間的相關關系、回歸分析及獨立性檢驗【知識精講】1會作兩個相關變量的數據的散點圖,會利用散點圖認識變量的相關關系2了解最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程3掌握獨立檢驗(只要求2×2列聯表)的基本思想、方法簡單應用.4. 掌握假設檢驗和聚類分析的基本思想、方法簡單應用.【基礎梳理】1相關關系的量:當自變量一定時,因變量的取值帶有一定的隨機性的兩個變量之間的關系稱為相關關系2回歸分析:對具有相關關系的兩個變量進行統計分析的方法叫做回歸分析3散點圖:表示具有相關關系的兩個變量的一組數據的圖形叫做散點圖4正相關與負相關概念:如果散點圖中的點散布在從左下角到右

2、上角的區域內,稱為正相關如果散點圖中的點散布在從左上角到右下角的區域內,稱為負相關6 相關系數:r叫做變量y與x之間的樣本相關系數,簡稱相關系數,用它來衡量兩個變量之間的線性相關程度7相關系數的性質:|r|1,且|r|越接近1,相關程度越大;且|r|越接近0,相關程度越小8獨立性檢驗:一般地,假設有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數列聯表(稱為2×2列聯表)為: 2×2列聯表若要推斷的論述為H1:X與Y有關系,可以按如下步驟判斷結論H1成立的可能性:(1)通過三維柱形圖和二維條形圖,可以粗略地判斷兩個分類變量是否有關系,但是這種判斷無

3、法精確地給出所得結論的可靠程度在三維柱形圖中,主對角線上兩個柱形高度的乘積ad與副對角線上的兩個柱形高度的乘積bc相差越大,H1成立的可能性就越大在二維條形圖中,可以估計滿足條件Xx1的個體中具有Yy1的個體所占的比例 ,也可以估計滿足條件Xx2的個體中具有Yy2的個體所占的比例.“兩個比例的值相差越大,H1成立的可能性就越大”(2)可以利用獨立性檢驗來考察兩個分類變量是否有關系,并且能較精確地給出這種判斷的可靠程度具體做法是:根據實際問題需要的可信程度確定臨界值k0;利用公式K2 ,由觀測數據計算得到隨機變量K2的觀測值k;如果kk0,就以(1P(K2k0)×100%的把握認為“X

4、與Y有關系”;否則就說樣本觀測數據沒有提供“X與Y有關系”的充分證據【要點解讀】要點七 相關關系的判斷【例7】山東魯潔棉業公司的科研人員在7塊并排、形狀大小相同的試驗田上對某棉花新品種進行施化肥量x對產量y影響的試驗,得到如下表所示的一組數據(單位:kg)(1)畫出散點圖;(2)判斷是否具有相關關系【命題立意】考查相關關系的分析方法.【標準解析】用施化肥量x作為橫軸,產量y為縱軸可作出散點圖,由散點圖即可分析是否具有線性相關關系【誤區警示】正確選擇坐標描點,并準確觀察散點的實際分布判斷兩變量的正相關和負相關是常用方法.【答案】(1)散點圖如右圖所示, (2)由散點圖知,各組數據對應點大致都在一

5、條直線附近,所以施化肥量x與產量y具有線性相關關系.【變式訓練】(2009·寧夏、海南)對變量x,y有觀測數據(xi,yi)(i1,2,10),得散點圖(1);對變量u、v有觀測數據(ui,vi)(i1,2,10),得散點圖(2)由這兩個散點圖可以判斷()A變量x與y正相關,u與v正相關B變量x與y正相關,u與v負相關C變量x與y負相關,u與v正相關D變量x與y負相關,u與v負相關【標準解析】由圖(1)可知,各點整體呈遞減趨勢,x與y負相關,由圖(2)可知,各點整體呈遞增趨勢,u與v正相關【技巧點撥】注意正負相關的判斷標準.【答案】C要點八 線性回歸分析【例8】一臺機器使用時間較長,

6、但還可以使用它按不同的轉速生產出來的某機械零件有一些會有缺點,每小時生產有缺點零件的多少,隨機器運轉的速度而變化,下表為抽樣試驗結果: (1)對變量y與x進行相關性檢驗;(2)如果y與x有線性相關關系,求回歸直線方程;(3)若實際生產中,允許每小時的產品中有缺點的零件最多為10個,那么,機器的運轉速度應控制在什么范圍內?【命題立意】考查線性回歸分析方法。【標準解析】利用相關系數r進行線性相關檢驗(也可利用散點圖)如果線性相關,再求回歸直線方程并加以判斷(2) 0.728 6x0.857 1.(3)要使 100.728 6x0.857 110,所以x14.901 3.所以機器的轉速應控制在14.

7、901 3轉/秒以下【答案】【變式訓練】假設關于某設備的使用年限x和所支出的維修費用y(萬元),有如下的統計資料:(1)y與x間是否有線性相關關系?若有,求出線性回歸方程;(2)估計使用年限為10年時的維修費用【標準解析】先作出散點圖,然后檢驗相關性,再求其回歸直線【技巧點撥】對具有相關關系的兩個變量進行統計分析時,首先要作出散點圖,然后進行相關性檢驗,在確認具有線性相關關系后,再求其回歸直線。【答案】要點九 獨立性檢驗【例9】(2009·遼寧)某企業有兩個分廠生產某種零件,按規定內徑尺寸(單位:mm)的值落在29.94,30.06)的零件為優質品從兩個分廠生產的零件中各抽出了500

8、件,量其內徑尺寸,得結果如下表:甲廠: 乙廠:(1)試分別估計兩個分廠生產的零件的優質品率;(2)由以上統計數據填下面2×2列聯表,并問是否有99%的把握認為“兩個分廠生產的零件的質量有差異”.【命題立意】考查由采集樣本的數據檢驗獨立性.【標準解析】利用公式計算K2的值,比較它與臨界值的大小關系,來判斷事件X與Y是否有關的問題【誤區警示】圖表數據及利用計算數據判斷獨立性的步驟必須正確理解.【答案】(1)甲廠抽查的產品中有360件優質品,從而甲廠生產的零件的優質品率估計為72%;乙廠抽查的產品中有320件優質品,從而乙廠生產的零件的優質品率估計為64%.(2) 所以有99%的把握認為“

9、兩個分廠生產的零件的質量有差異” 【變式訓練】在對人們休閑方式的一次調查中,共調查了124人,其中女性70人,男性54人女性中有43人主要的休閑方式是看電視,另外27人的休閑方式是運動;男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運動(1)根據以上數據建立一個2×2列聯表;(2)畫出二維條形圖;(3)檢驗休閑方式是否與性別有關,可靠性有多大【標準解析】獨立性檢驗的考查。【技巧點撥】先由已知條件轉化聯表及條形圖,然后由公式計算k2與臨界值的關系。【答案】(1)2×2列聯表如圖: (2)二維條形圖如圖:(3)假設休閑方式與性別無關,則K26.2015.024

10、,所以有理由認為休閑方式與性別無關是不合理的,即我們有97.5%的把握認為休閑方式與性別有關【原創題探討】【原創精典1】 某企業三月中旬生產A、B、C三種產品共3 000件,根據分層抽樣的結果,企業統計員制作了如下的統計表:產品類別ABC產品數量(件)1 300樣本容量130由于不小心,表格中A、C產品的有關數據已被污染看不清楚了,統計員只記得A產品的樣本容量比C產品的樣本容量多10,根據以上信息,可得C產品的數量是_件【解析】設樣本的總容量為x,則×1 300130,x300.A產品和C產品在樣本中共有300130170(件)設C產品的樣本容量為y,則yy10170,y80.C產品

11、的數量為×80800.【答案】800【原創精典2】如右圖是某電視臺綜藝節目舉辦的挑戰主持人大賽上,七位評委為某選手打出的分數的莖葉統計圖,去掉一個最高分和一個最低分后,所剩數據的平均數和方差分別為()A84,4.84 B84,1.6 C85,4 D85,1.6【解析】由莖葉圖可知評委打出的最低分為79,最高分為93,其余得分為84,84,86,84,87,故平均分為85,方差為3×(8485)2(8685)2(8785)21.6.【答案】D【原創精典3】近年來,由于亂砍濫伐,掠奪性使用森林資源,我國長江、黃河流域植被遭到破壞,土地沙化嚴重,洪澇災害時有發生沿黃某地區為積極響

12、應和支持“保護母親河”的倡議,建造了長100千米,寬0.5千米的防護林有關部門為掌握這一防護林共約有多少棵樹,從中選出10塊(每塊長1千米,寬0.5千米)進行統計,每塊樹木數量如下(單位:棵)65 100 63 200 64 600 64 700 67 30063 300 65 100 66 600 62 800 65 500請你根據以上數據計算這一防護林共約有多少棵樹(結果保留3個有效數字)【解析】要求學生有用樣本估計總體的思想方法,另一方面要求學生有應用數學的意識,這是今后中考命題發展的趨勢【答案】先計算出(65 10063 20064 60064 70067 30063 30065 10

13、066 60062 80065 500)64 820于是,可以估計這一防護林平均每塊約有64820株樹又64 820×1006 482 0006.48×106(株),于是可以估計這一防護林大約共有6.48×106株樹新動向前瞻【樣題1】已知總體的各個體的值由小到大依次為2,3,3,7,a,b,12,13.7,18.3,20,且總體的中位數為10.5,若要使該總體的方差最小,則a、b的取值分別是_【解析】中位數為10.5,10.5,ab21,x10,s2(102)2(103)2(103)2(107)2(10a)2(10b)2(1012)2(1013.7)2(1018

14、.3)2(1020)2令y(10a)2(10b)22a242a22122,當a10.5時,y取最小值,方差s2也取最小值a10.5,b10.5.【答案】10.510.5【樣題2】某醫療研究所為了檢驗某種血清預防感冒的作用,把500名使用血清的人與另外500名未用血清的人一年中的感冒記錄作比較,提出假設H0:“這種血清不能起到預防感冒的作用”,利用2×2列聯表計算得K23.918,經查對臨界值表知P(K23.841)0.05.p:有95%的把握認為“這種血清能起到預防感冒的作用”;q:若某人未使用該血清,那么他在一年中有95%的可能性得感冒;r:這種血清預防感冒的有效率為95%;s:這

15、種血清預防感冒的有效率為5%.則下列結論中,正確結論的序號是_(把你認為正確的命題序號都填上)pq;綈pq;(綈p綈q)(rs);(p綈r)(綈qs)【解析】由題意,得K23.918,P(K23.841)0.05,所以只有p正確,即有95%的把握認為“這種血清能起到預防感冒的作用”,由真值表知、為真命題【答案】【樣題3】合情推理是由特殊到一般的推理,得到的結論不一定正確,演繹推理是由一般到特殊的推理,得到的結論一定正確;一般地,當r的絕對值大于0.75時,認為兩個變量之間有很強的線性相關關系,如果變量y與x之間的相關系數r0.956 8,則變量y與x之間具有線性關系;用獨立性檢驗(2×

16、;2列聯表法)來考察兩個分類變量是否有關系時,算出的隨機變量K2的值越大,說明“x與y有關系”成立的可能性越大;命題p:xR使得x2x10,則綈p:xR均有x2x10.其中結論正確的序號為_(寫出你認為正確的所有結論的序號)【解析】通過統計假設,查表得結論正確;參考兩個分類變量x和y有關系的可信度表:k2的值越大,說明“x與y有關系”成立的可能性越大;正確,命題p:xR使得p(x),則綈p:xR均有綈p(x)【答案】【樣題4】出下列四個命題:xR,cos xsinsin一定不成立;今年初某醫療研究所為了檢驗“達菲(藥物)”對甲型H1N1流感病毒是否有抑制作用,把墨西哥的患者數據庫中的500名使

17、用達菲的人與另外500名未用達菲的人一段時間內患甲型H1N1流感的療效記錄作比較,提出假設H0:“達菲不能起到抑制甲型H1N1流感病毒的作用”,利用2×2列聯表計算得K23.918,經查對臨界值表知P(K23.841)0.05,說明達菲抑制甲型H1N1流感病毒的有效率為95%;|a·b|a|b|是|ab|a|b|成立的充要條件;如右圖的莖葉圖是某班在一次測驗時的成績:可斷定:女生成績比較集中,整體水平稍高于男生其中真命題的序號是_(填上所有真命題的序號)【解析】對于,等式展開后可化簡為asin xbcos x0的形式,可知一定有解;對于,正確解釋是:有95%的把握認為“達菲對甲型H1N1流感病毒有抑制作用”;對于,由向量模的性質知不正確【答案】【樣題5】某種產品的廣告費支出x與銷售額y(單位:百萬元)之間有如下對應數據:x24568y3040605070(1)畫出散點圖;(2)求回歸直線方程;(3)試預測廣告費支出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論