




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、環球雅思學科教師輔導講義講義編號: 組長簽字: 簽字日期: 學員編號: 年 級: 高二 課時數:3學員姓名: 輔導科目: 數學 學科教師:閆建斌課 題線性回歸方程授課日期及時段2014-2-11 18:00-20:00教學目標線性回歸方程基礎重點、難點教 學 內 容1、本周錯題講解2、知識點梳理1線性回歸方程變量之間的兩類關系:函數關系與相關關系制作散點圖,判斷線性相關關系線性回歸方程:(最小二乘法)最小二乘法:求回歸直線,使得樣本數據的點到它的距離的平方最小的方法 注意:線性回歸直線經過定點2相關系數(判定兩個變量線性相關性):注:0時,變量正相關; 0時,變量負相關; 越接近于1,兩個變量
2、的線性相關性越強; 接近于0時,兩個變量之間幾乎不存在線性相關關系。3線形回歸模型:隨機誤差:我們把線性回歸模型,其中為模型的未知參數,稱為隨機誤差。 隨機誤差殘差:我們用回歸方程中的估計,隨機誤差,所以是的估計量,故,稱為相應于點的殘差。回歸效果判定-相關指數(解釋變量對于預報變量的貢獻率) (的表達式中確定)注:得知越大,說明殘差平方和越小,則模型擬合效果越好;越接近于1,則回歸效果越好。4獨立性檢驗(分類變量關系):(1)分類變量:這種變量的不同“值”表示個體所屬的不同類別的變量。(2)列聯表:列出兩個分類變量的頻數表,稱為列聯表。(3)對于列聯表:的觀測值。(4)臨界值表:0.500.
3、400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828如果,就推斷“有關系”,這種推斷犯錯誤的概率不超過;否則,在樣本數據中沒有發現足夠證據支持結論“有關系”。(5)反證法與獨立性檢驗原理的比較:反證法原理在假設下,如果推出矛盾,就證明了不成立。獨立性檢驗原理在假設下,如果出現一個與相矛盾的小概率事件,就推斷不成立,且該推斷犯錯誤的概率不超過這個小概率。典型例題1(2011山東)某產品的廣告費用x與銷售額y的統計數據如下表:廣告費用x/萬元4235銷售額y/萬元49263
4、954根據上表可得回歸方程x中的為9.4,據此模型預報廣告費用為6萬元時銷售額為 ()A63.6萬元 B65.5萬元C67.7萬元 D72.0萬元解析,42,又x必過(,),429.4,9.1.線性回歸方程為9.4x9.1.當x6時,9.469.165.5(萬元)答案B2(2011江西)為了解兒子身高與其父親身高的關系,隨機抽取5對父子的身高數據如下:父親身高x/cm174176176176178兒子身高y/cm175175176177177則y對x的線性回歸方程為 ()A.x1 B.x1C.88x D.176解析因為176,176,又y對x的線性回歸方程表示的直線恒過點(,),所以將(176
5、,176)代入A、B、C、D中檢驗知選C.答案C3(2011陜西)設(x1,y1),(x2,y2),(xn,yn)是變量x和y的n個樣本點,直線l是由這些樣本點通過最小二乘法得到的線性回歸直線(如圖),以下結論中正確的是()Ax和y的相關系數為直線l的斜率Bx和y的相關系數在0到1之間C當n為偶數時,分布在l兩側的樣本點的個數一定相同D直線l過點(,)解析因為相關系數是表示兩個變量是否具有線性相關關系的一個值,它的絕對值越接近1,兩個變量的線性相關程度越強,所以A、B錯誤C中n為偶數時,分布在l兩側的樣本點的個數可以不相同,所以C錯誤根據回歸直線方程一定經過樣本中心點可知D正確,所以選D.答案
6、D4(2011廣東)為了解籃球愛好者小李的投籃命中率與打籃球時間之間的關系,下表記錄了小李某月1號到5號每天打籃球時間x(單位:小時)與當天投籃命中率y之間的關系:時間x12345命中率y0.40.50.60.60.4小李這5天的平均投籃命中率為_;用線性回歸分析的方法,預測小李該月6號打6小時籃球的投籃命中率為_解析小李這5天的平均投籃命中率0.5,可求得小李這5天的平均打籃球時間3.根據表中數據可求得0.01,0.47,故回歸直線方程為0.470.01x,將x6代入得6號打6小時籃球的投籃命中率約為0.53.答案0.50.535(2011遼寧)調查了某地若干戶家庭的年收入x(單位:萬元)和
7、年飲食支出y(單位:萬元),調查顯示年收入x與年飲食支出y具有線性相關關系,并由調查數據得到y對x的回歸直線方程:0.254x0.321.由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均增加_萬元解析由題意知0.254(x1)0.321(0.254x0.321)0.254.答案0.2546(2011安徽)某地最近十年糧食需求量逐年上升,下表是部分統計數據:年份20022004200620082010需求量(萬噸)236246257276286(1)利用所給數據求年需求量與年份之間的回歸直線方程x;(2)利用(1)中所求出的直線方程預測該地2012年的糧食需求量解(1)由所給數據看出,
8、年需求量與年份之間是近似直線上升的,下面求回歸直線方程為此對數據預處理如下:年份200642024需求量257211101929對預處理后的數據,容易算得0,3.2.6.5,b3.由上述計算結果,知所求回歸直線方程為257(x2 006)6.5(x2 006)3.2,即6.5(x2 006)260.2.(2)利用直線方程,可預測2012年的糧食需求量為65(20122006)260.26.56260.2299.2(萬噸)課堂練習1實驗測得四組(x,y)的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的回歸直線方程為()A.x1B.x2 C.2x1 D.x12在比較兩個模型的擬
9、合效果時,甲、乙兩個模型的相關指數R2的值分別約為0.96和0.85,則擬合效果好的模型是()A甲 B乙 C甲、乙相同 D不確定3某化工廠為預測產品的回收率y,需要研究它和原料有效成分含量x之間的相關關系,現取8對觀測值,計算,得xi52,yi228,x478,xiyi1849,則其線性回歸方程為()A.11.472.62x B.11.472.62xC.2.6211.47x D.11.472.62x4下表是某廠14月份用水量(單位:百噸)的一組數據:月份x1234用水量y4.5432.5由散點圖可知,用水量y與月份x之間有較好的線性相關關系,其線性回歸直線方程是0.7xa,則a等于_5某車間為
10、了規定工時定額,需要確定加工零件所花費的時間,為此作了四次試驗,得到的數據如下:零件的個數x(個)2345加工的時間y(小時)2.5344.5(1)在給定的坐標系中畫出表中數據的散點圖;(2)求出y關于x的線性回歸方程bxa,并在坐標系中畫出回歸直線;(3)試預測加工10個零件需要多少小時?課后練習一、選擇題1實驗測得四組(x,y)的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的回歸直線方程為()A.x1B.x2C.2x1 D.x1答案A解析畫出散點圖,四點都在直線x1.2下列有關樣本相關系數的說法不正確的是()A相關系數用來衡量變量x與y之間的線性相關程度B|r|1,且|
11、r|越接近于1,相關程度越大C|r|1,且|r|越接近0,相關程度越小D|r|1,且|r|越接近1,相關程度越小答案D3由一組樣本(x1,y1),(x2,y2),(xn,yn)得到的回歸直線方程abx,下面有四種關于回歸直線方程的論述:(1)直線abx至少經過點(x1,y1),(x2,y2),(xn,yn)中的一個點;(2)直線abx的斜率是;(3)直線abx必過(,)點;(4)直線abx和各點(x1,y1),(x2,y2),(xn,yn)的偏差 (yiabxi)2是該坐標平面上所有的直線與這些點的偏差中最小的直線其中正確的論述有()A0個 B1個C2個 D3個答案D解析線性回歸直線不一定過點
12、(x1,y1),(x2,y2),(xn,yn)中的任何一點;b就是線性回歸直線的斜率,也就是回歸系數;線性回歸直線過點(,);線性回歸直線是平面上所有直線中偏差 (yiabxi)2取得最小的那一條故有三種論述是正確的,選D.4設兩個變量x和y之間具有線性相關關系,它們的相關系數是r,y關于x的回歸直線的斜率是b,縱截距是a,那么必有()Ab與r的符號相同 Ba與r的符號相同Cb與r的符號相反 Da與r的符號相反答案A5在比較兩個模型的擬合效果時,甲、乙兩個模型的相關指數R2的值分別約為0.96和0.85,則擬合效果好的模型是()A甲 B乙C甲、乙相同 D不確定答案A6某化工廠為預測產品的回收率
13、y,需要研究它和原料有效成分含量x之間的相關關系,現取8對觀測值,計算,得xi52,yi228,x478,xiyi1849,則其線性回歸方程為()A.11.472.62x B.11.472.62xC.2.6211.47x D.11.472.62x答案A解析利用回歸系數公式計算可得a11.47,b2.62,故11.472.62x.二、填空題7下表是某廠14月份用水量(單位:百噸)的一組數據:月份x1234用水量y4.5432.5由散點圖可知,用水量y與月份x之間有較好的線性相關關系,其線性回歸直線方程是0.7xa,則a等于_解析2.5,3.5,回歸直線方程過定點(,),3.50.72.5a.a5
14、.25.8某服裝商場為了了解毛衣的月銷售量y(件)與月平均氣溫x()之間的關系,隨機統計了某4個月的月銷售量與當月平均氣溫,其數據如下表:月平均氣溫x()171382月銷售量y(件)24334055由表中數據算出線性回歸方程bxa中的b2,氣象部門預測下個月的平均氣溫約為6,據此估計,該商場下個月毛衣的銷售量約為_件(參考公式:b,ab )答案46解析由所提供數據可計算得出10,38,又b2代入公式ab 可得a58,即線性回歸方程2x58,將x6代入可得9對196個接受心臟搭橋手術的病人和196個接受血管清障手術的病人進行了3年的跟蹤研究,調查他們是否又發作過心臟病,調查結果如下表所示:又發作
15、過心臟病未發作過心臟病合計心臟搭橋手術39157196血管清障手術29167196合計68324392試根據上述數據計算K2_.比較這兩種手術對病人又發作心臟病的影響有沒有差別_.答案1.78不能作出這兩種手術對病人又發作心臟病的影響有差別的結論解析提出假設H0:兩種手術對病人又發作心臟病的影響沒有差別根據列聯表中的數據,可以求得K21.78.當H0成立時K21.78,而K22.072的概率為0.85.所以,不能否定假設H0.也就是不能作出這兩種手術對病人又發作心臟病的影響有差別的結論三、解答題10某農科所對冬季晝夜溫差大小與某反季大豆新品種發芽多少之間的關系進行分析研究,他們分別記錄了201
16、0年12月1日至12月5日的每天晝夜溫差與實驗室每天每100顆種子中的發芽數,得到如下表:日期12月1日12月2日12月3日12月4日12月5日溫差x()101113128發芽數y(顆)2325302616該農科所確定的研究方案是:先從這五組數據中選取2組,用剩下的3組數據求線性回歸方程,再對被選取的2組數據進行檢驗(1)求選取的2組數據恰好是不相鄰的2天數據的概率;(2)若選取的是12月1日與12月5日的兩組數據,請根據12月2日至12月4日的數據,求出y關于x的線性回歸方程bxa;(3)若由線性回歸方程得到的估計數據與所選出的檢驗數據的誤差均不超過2顆,則認為得到的線性回歸方程是可靠的,試
17、問(2)中所得到的線性回歸方程是否可靠?解析(1)設抽到不相鄰的兩組數據為事件A,因為從5組數據中選取2組數據共有10種情況:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)其中數據為12月份的日期數每種情況都是可能出現的,事件A包括的基本事件有6種:所以P(A).所以選取的2組數據恰好是不相鄰2天數據的概率是.(2)由數據,求得12,27.由公式,求得b,ab 3.所以y關于x的線性回歸方程為x3.(3)當x10,10322,|2223|2;同樣,當x8時,8317,|1716|2;所以,該研究所得到的回歸方程是可靠的11
18、某車間為了規定工時定額,需要確定加工零件所花費的時間,為此作了四次試驗,得到的數據如下:零件的個數x(個)2345加工的時間y(小時)2.5344.5(1)在給定的坐標系中畫出表中數據的散點圖;(2)求出y關于x的線性回歸方程bxa,并在坐標系中畫出回歸直線;(3)試預測加工10個零件需要多少小時?(注:b,ab )解析(1)散點圖如圖(2)由表中數據得:xiyi52.5,3.5,3.5,x54,b0.7,a1.05,0.7x1.05.回歸直線如圖所示(3)將x10代入回歸直線方程,得0.7101.058.05(小時 )預測加工10個零件需要8.05小時12(2010遼寧卷)為了比較注射A,B兩種藥物后產生的皮膚皰疹的面積,選200只家兔做試驗,將這200只家兔隨機地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.下表1和表2分別是注射藥物A和B后的試驗結果(皰疹面積單位:mm2)表1:注射藥物A后皮膚皰疹面積的頻數分布表皰疹面積60,65)65,70)70,75)75,80)頻數30402010表2:注射藥物B后皮膚皰疹面積的頻數分布表皰疹面積60,65)65,70)70,75)75,80)80,85)頻數1025203015()完成下面頻率分布直方圖,并比較注射兩種藥物后皰疹面積的中位數大小;()完成下面22列聯表,并回答能否有99.9% 的把握認為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030入門文化行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030兒童牙刷行業兼并重組機會研究及決策咨詢報告
- 甘肅省白銀市靖遠一中2025屆高三下學期聯合考試英語試題含解析
- 2025-2030倉儲公司行業發展分析及投資戰略研究報告
- 2025-2030中藥口服液行業市場深度調研及前景趨勢與投資研究報告
- 陜西省西北農林科技大學附屬中學2025屆高三3月份模擬考試英語試題含解析
- 2025屆云南省曲靖市宣威市第九中學高三第三次測評英語試卷含答案
- 新疆昌吉州教育共同體2025屆高考沖刺英語模擬試題含答案
- 2025-2030中國非處方藥行業市場發展現狀及發展趨勢與投資風險研究報告
- 安徽省合肥市2025屆高三下學期一模考試英語試題含解析
- 醫療安全不良事件報告制度培訓
- 無人機空氣動力學與飛行原理學習通超星期末考試答案章節答案2024年
- 2022年俄烏沖突專題俄羅斯和烏克蘭的恩怨情仇課件
- 舒適化醫療麻醉
- 手工小船的原理
- 2024年高級汽車維修工職業鑒定考試題庫及答案
- 2024年離婚不離家互不干涉的婚姻協議書范文
- 2024秋期國家開放大學《可編程控制器應用實訓》一平臺在線形考(形成任務1)試題及答案
- 對我國地方檔案立法原則的探討
- 新209道100以內四個數字的加減法混合題目
- 山東省煙臺市2024-2025學年高二地理下學期期末考試試題
評論
0/150
提交評論