




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第3節成對數據的統計分析考試要求1.了解樣本相關系數的統計含義.2.了解一元線性回歸模型和2×2列聯表,會運用這些方法解決簡單的實際問題.【知識梳理】1.變量的相關關系(1)相關關系的分類:正相關和負相關.(2)線性相關:一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在____________附近,我們就稱這兩個變量線性相關.一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量非線性相關或曲線相關.2.樣本相關系數(1)相關系數r的計算變量x和變量y的樣本相關系數r的計算公式如下:r=eq\f(\o(∑,\s\up12(n),\s\do11(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up12(n),\s\do11(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up12(n),\s\do11(i=1))(yi-\o(y,\s\up6(-)))2)).(2)相關系數r的性質①當r>0時,稱成對樣本數據________相關;當r<0時,成對樣本數據________相關;當r=0時,成對樣本數據間沒有線性相關關系.②樣本相關系數r的取值范圍為________.當|r|越接近1時,成對樣本數據的線性相關程度越________;當|r|越接近0時,成對樣本數據的線性相關程度越________.3.一元線性回歸模型(1)我們將eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))稱為Y關于x的經驗回歸方程,其中eq\b\lc\{(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\o(∑,\s\up12(n),\s\do10(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up12(n),\s\do10(i=1))(xi-\o(x,\s\up6(-)))2)=,,\o(a,\s\up6(^))=\o(y,\s\up6(-))-\o(b,\s\up6(^))\o(x,\s\up6(-)).))(2)決定系數R2=1-eq\f(\o(∑,\s\up12(n),\s\do10(i=1))(yi-\o(y,\s\up6(^))i)2,\o(∑,\s\up12(n),\s\do10(i=1))(yi-\o(y,\s\up6(-)))2),R2越________,即擬合效果越好,R2越________,模型擬合效果越差.4.列聯表與獨立性檢驗(1)關于分類變量X和Y的抽樣數據的2×2列聯表XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d記n=a+b+c+d,則隨機變量χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).(2)獨立性檢驗基于小概率值α的檢驗規則是:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828[常用結論與微點提醒]1.求解經驗回歸方程的關鍵是確定回歸系數eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)),應充分利用回歸直線過樣本點的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).2.根據χ2的值可以判斷兩個分類變量有關的可信程度,若χ2越大,則兩個分類變量有關的把握越大.3.回歸分析和獨立性檢驗都是基于成對樣本觀測數據進行估計或推斷,得出的結論都可能犯錯誤.【診斷自測】1.思考辨析(在括號內打“√”或“×”)(1)散點圖無法判斷兩個變量是否相關.()(2)通過經驗回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))可以估計預報變量的取值和變化趨勢.()(3)只有兩個變量有相關關系,所得到的回歸模型才有預測價值.()(4)事件X,Y關系越密切,則由觀測數據計算得到的χ2的值越小.()2.(選修三P139T3)根據分類變量x與y的觀測數據,計算得到χ2=2.974.依據α=0.05的獨立性檢驗,結論為()A.變量x與y不獨立B.變量x與y不獨立,這個結論犯錯誤的概率不超過0.05C.變量x與y獨立D.變量x與y獨立,這個結論犯錯誤的概率不超過0.053.(選修三P103T1改編)兩個變量的相關關系有:①正相關;②負相關;③不相關,則下列散點圖從左到右分別反映的變量間的相關關系是()A.①②③ B.②③①C.②①③ D.①③②4.(多選)在統計中,由一組樣本數據(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到兩個變量的經驗回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),那么下列說法正確的是()A.直線eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必經過點(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))B.直線eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))表示最接近y與x之間真實關系的一條直線C.相關系數為r,且|r|越接近于1,相關程度越大;|r|越接近于0,相關程度越小D.用決定系數R2來刻畫回歸效果,R2越小說明擬合效果越好考點一成對數據的相關性例1(1)(2023·天津卷)調查某種群花萼長度和花瓣長度,所得數據如圖所示,其中相關系數r=0.8245,下列說法正確的是()A.花瓣長度和花萼長度沒有相關性B.花瓣長度和花萼長度呈負相關C.花瓣長度和花萼長度呈正相關D.若從樣本中抽取一部分,則這部分的相關系數一定是0.8245(2)(2024·杭州質檢)某興趣小組研究光照時長x(h)和向日葵種子發芽數量y(顆)之間的關系,采集5組數據,作如圖所示的散點圖.若去掉D(10,2),則下列說法正確的是()A.相關系數r變小 B.決定系數R2變小C.殘差平方和變大 D.解釋變量x與預報變量y的相關性變強__________________________________________________________________________________________________________________________________________________________________________________________________________________感悟提升判定兩個變量相關性的方法(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關;點的分布從左上角到右下角,兩個變量負相關.(2)樣本相關系數:當r>0時,正相關;當r<0時,負相關;|r|越接近于1,相關性越強.(3)決定系數法:利用決定系數判定,R2越接近1,模型的擬合效果越好,相關性越強.訓練1(1)(2023·上海卷)已知某校50名學生的身高與體重的散點圖如圖所示,則下列說法正確的是()A.身高越高,體重越重 B.身高越高,體重越輕C.身高與體重成正相關 D.身高與體重成負相關(2)在一組樣本數據(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=-eq\f(1,2)x+1上,則這組樣本數據的樣本相關系數為()A.-1 B.0C.-eq\f(1,2) D.1考點二回歸分析角度1線性回歸分析例2為實施鄉村振興,科技興農,某村建起了田園綜合體,并從省城請來專家進行技術指導,根據統計,該田園綜合體西紅柿畝產量的增加量y(千克)與某種液體肥料每畝使用量x(千克)之間的對應數據如下:x(千克)24568y(千克)300400400400500(1)由上表數據可知,可用經驗回歸模型擬合y與x的關系,請計算樣本相關系數r并加以說明(若|r|>0.75,則線性相關程度很高,可用經驗回歸模型擬合);(2)求y關于x的經驗回歸方程,并預測當液體肥料每畝使用量為15千克時,西紅柿畝產量的增加量約為多少千克?附:相關系數r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)·\r(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)),經驗回歸方程eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x的斜率和截距的最小二乘估計公式分別為eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)),eq\r(10)≈3.16.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________角度2非線性回歸分析例3(2024·廣州質檢)一企業生產某種產品,通過加大技術創新投入降低了每件產品成本.為了調查年技術創新投入x(單位:千萬元)對每件產品成本y(單位:元)的影響,對近10年的年技術創新投入xi和每件產品成本yi(i=1,2,3,…,10)的數據進行分析,得到如下散點圖,并計算得:eq\o(x,\s\up6(-))=6.8,eq\o(y,\s\up6(-))=70,eq\o(∑,\s\up6(10),\s\do4(i=1))eq\f(1,xi)=3,eq\o(∑,\s\up6(10),\s\do4(i=1))eq\f(1,xeq\o\al(2,i))=1.6,eq\o(∑,\s\up6(10),\s\do4(i=1))eq\f(yi,xi)=350.(1)根據散點圖可知,可用函數模型y=eq\f(β,x)+α擬合y與x的關系,試建立y關于x的回歸方程;(2)已知該產品的年銷售額m(單位:千萬元)與每件產品成本y的關系為m=-eq\f(y2,500)+eq\f(2y,25)+eq\f(200,y-10)+100.該企業的年投入成本除了年技術創新投入,還要投入其他成本10千萬元,根據(1)的結果回答:當年技術創新投入x為何值時,年利潤的預報值最大?(注:年利潤=年銷售額-年投入成本)參考公式:對于一組數據(u1,v1),(u2,v2),…,(un,vn),其回歸直線v=α+βu的斜率和截距的最小二乘估計分別為eq\o(β,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))uivi-n\o(u,\s\up6(-))\o(v,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))ueq\o\al(2,i)-n\o(u,\s\up6(-))2),eq\o(α,\s\up6(^))=eq\o(v,\s\up6(-))-eq\o(β,\s\up6(^))eq\o(u,\s\up6(-)).________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________感悟提升回歸分析問題的類型及解題方法(1)求經驗回歸方程①當兩個系數均未知時,可利用公式法求解;②當兩個系數已知一個求另一個時,可利用經驗回歸直線過樣本點的中心求解.(2)利用經驗回歸方程進行預測,把經驗回歸方程看作一次函數,求函數值.(3)經驗回歸方程的擬合效果可以利用相關系數判斷,當|r|越趨近于1時,兩變量的線性相關性越強.訓練2(2024·西安調研)某商業銀行對存款利率與日存款總量的關系進行調研,發現存款利率每上升一定的百分點,日均存款總額就會發生一定的變化,經過統計得到下表:利率上升百分點x0.10.20.30.40.5日均存款總額y(億元)0.20.350.50.650.8(1)在給出的坐標系中畫出上表數據的散點圖;(2)根據上表提供的數據,用最小二乘法求出y關于x的經驗回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)已知現行利率下的日均存款總額為0.625億元,試根據(2)中的經驗回歸方程,預測日均存款總額為現行利率下的2倍時,利率需上升多少個百分點?參考公式及數據:①eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)),②eq\o(∑,\s\up6(5),\s\do4(i=1))xiyi=0.9,eq\o(∑,\s\up6(5),\s\do4(i=1))xeq\o\al(2,i)=0.55.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________考點三獨立性檢驗例4(2023·全國甲卷改編)一項試驗旨在研究臭氧效應,試驗方案如下:選40只小白鼠,隨機地將其中20只分配到試驗組,另外20只分配到對照組,試驗組的小白鼠飼養在高濃度臭氧環境,對照組的小白鼠飼養在正常環境,一段時間后統計每只小白鼠體重的增加量(單位:g).試驗結果如下:對照組的小白鼠體重的增加量從小到大排序為15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2試驗組的小白鼠體重的增加量從小到大排序為7.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)計算試驗組的樣本平均數;(2)①求40只小白鼠體重的增加量的中位數m,再分別統計兩樣本中小于m與不小于m的數據的個數,完成如下列聯表:<m≥m對照組試驗組②根據①中的列聯表,依據小概率值α=0.050的獨立性檢驗,能否認為小白鼠在高濃度臭氧環境中與在正常環境中體重的增加量有差異?附:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),α0.1000.0500.010xα2.7063.8416.635________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________感悟提升獨立性檢驗的一般步驟(1)根據樣本數據制成2×2列聯表.(2)根據公式χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))計算.(3)比較χ2與臨界值的大小關系,作統計推斷.訓練3某學生興趣小組隨機調查了某市100天中每天的空氣質量等級和當天到某公園鍛煉的人次,整理數據得到下表(單位:天):鍛煉人次空氣質量等級[0,200](200,400](400,600]1(優)216252(良)510123(輕度污染)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- LY/T 3384-2024植物新品種特異性、一致性、穩定性測試指南檵木屬
- 安徽省蚌埠市2016-2017學年高二物理上學期期末考試試題文
- 安排出國差旅活動49課件
- 考研復習-風景園林基礎考研試題【突破訓練】附答案詳解
- 2025年黑龍江省五常市輔警招聘考試試題題庫及1套完整答案詳解
- 2025年Z世代消費趨勢下新消費品牌供應鏈管理優化報告
- 醫院行風建設總結
- 復發性急性胰腺炎罕見病因研究2025
- AI與DeepSeek大模型賦能家具制造業數字化轉型解決方案
- 樂水湖景區污水處理站及配套管網建設項目環評報告
- 壓力鋼管制作施工方案
- 小學六年級語文:《常考的10篇文言文》
- 整本書閱讀三國演義閱讀推進課課件公開課一等獎課件省課獲獎課件
- 2023-2024學年四川省瀘州市小學語文五年級期末自測模擬試題附參考答案和詳細解析
- 改革開放與新時代智慧樹知到答案章節測試2023年同濟大學
- 《金匱要略》試題及答案大全(二)
- 汽車電工電子基礎教案
- 不對稱短路故障分析與計算(電力系統課程設計)
- 油氣田集輸管道工程檢驗批表格十張表格
- 2023-2024學年四川省樂山市小學數學四年級下冊期末高分題
- GB/T 28731-2012固體生物質燃料工業分析方法
評論
0/150
提交評論