




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1人教A版2019選擇性必修第三冊第八章《成對數據的統計分析》
在必修課程中,我們學習了單個變量的觀察數據的直觀表示和統計特征的刻畫等知識與方法.例如,用直方圖描述樣本數據的分布規律,用均值刻畫樣本數據的集中趨勢,用方差刻畫樣本數據的離散程度等.這些方法主要適用于通過樣本認識單個變量的統計規律.
在現實中,我們還經常需要了解兩個或兩個以上變量之間的關系.例如,教育部門為掌握學生身體健康狀況,需要了解身高變量和體重變量之間的關系;醫療衛生部門要制定預防青少年近視的措施,需要了解有哪些因素會影響視力,以及這些因素是如何影響視力的;商家要根據顧客的意見改進服務水平,希望了解哪些因素影響服務水平,以及這些因素是如何起作用的;等等.
為此,我們需要進一步學習通過樣本推斷變量之間關系的知識和方法.
本章的學習內容有成對數據的統計相關性、一元線性回歸模型和2×2列聯表等,這些知識與方法在解決實際問題中非常有用.可以發現,兩個隨機變量的相關性可以通過成對樣本數據進行分析;利用一元線性回歸模型可以研究變量之間的隨機關系,進行預測;利用2×2列聯表可以檢驗兩個隨機變量的獨立性.
本章的學習對于提高我們解決實際問題的能力,提升數據分析、數學建模等素養都是非常有幫助的.
如果變量y是變量x的函數,那么由x就可以唯一確定y.然而,現實世界中還存在這樣的情況:兩個變量之間有關系,但密切程度又達不到函數關系的程度.例如,人的體重與身高存在關系,但由一個人的身高值并不能確定他的體重值.那么,該如何刻畫這兩個變量之間的關系呢?下面我們就來研究這個問題.8.1成對數據的統計相關性
我們知道,一個人的體重與他的身高有關系.一般而言,個子高的人往往體重值較大,個子矮的人往往體重值較小.但身高并不是決定體重的唯一因素.
例如生活中的飲食習慣、體育鍛煉、睡眠時間以及遺傳因素等也是影響體重的重要因素.像這樣,兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.1.相關關系:8.1.1變量的相關關系
兩個變量具有相關關系的事例在現實中大量存在.例如:1.子女身高y與父親身高x之間的關系.一般來說,父親的個子高,其子女的個子也會比較高;父親個子矮,其子女的個子也會比較矮.但影響子女身高的因素,除父親身高外還有其他因素,例如母親身高、飲食結構、體育鍛煉等,因此父親身高又不能完全決定子女身高.2.商品銷售收入y與廣告支出x之間的關系.一般來說,廣告支出越多,商品銷售收人越高.但廣告支出并不是決定商品銷售收入的唯一因素,商品銷售收入還與商品質量、居民收入等因素有關.
兩個變量具有相關關系的事例在現實中大量存在.例如:3.空氣污染指數y與汽車保有量x之間的關系.一般來說,汽車保有量增加,空氣污染指數會上升.但汽車保有量并不是造成空氣污染的唯一因素,氣象條件、工業生產排放、居民生活和取暖、垃圾焚燒等都是影響空氣污染指數的因素.4.糧食畝產量y與施肥量x之間的關系.在一定范圍內,施肥量越大,糧食畝產量就越高.但施肥量并不是決定糧食畝產量的唯一因素,糧食畝產量還要受到土壤質量、降水量、田間管理水平等因素的影響.
因為在相關關系中,變量y的值不能隨變量x的值的確定而唯一確定,所以我們無法直接用函數去描述變量之間的這種關系.對上述各例中兩個變量之間的相關關系,我們往往會根據自己以往積累的經驗作出推斷.“經驗之中有規律”,經驗的確可以為我們的決策提供一定的依據,但僅憑經驗推斷又有不足.例如,不同經驗的人對同一情形可能會得出不同結論,不是所有的情形都有經驗可循等.因此,在研究兩個變量之間的相關關系時,我們需要借助數據說話,即通過樣本數據分析,從數據中提取信息,并構建適當的模型,再利用模型進行估計或推斷.
變量的相關關系與函數關系的區別和聯系:相同點:兩者均是兩個變量之間的關系;不同點:①函數關系是一種確定的關系,如勻速直線運動中時間t與路程s的關系,相關關系是一種非確定的關系,如一塊農田的小麥產量與施肥量之間的關系;②函數關系是兩個隨機變量之間的關系,而相關關系是非隨機變量與隨機變量之間的關系;③函數關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.練習:下列關系中,屬于相關關系的是__________①正方形的邊長與面積之間的關系②農作物的產量與施肥量之間的關系③出租車打車費與行駛的里程④降雪量與交通事故的發生率之間的關系②④兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.相關關系:探究:在對人體的脂肪含量和年齡之間關系的研究中,科研人員獲得了一些年齡和脂肪含量的簡單隨機樣本數據,如下表所示.表中每個編號下的年齡和脂肪含量數據都是對同一個體的觀測結果,它們構成了成對數據.編號1234567年齡/歲23273941454950脂肪含量/%9.517.821.225.927.526.328.2編號891011121314年齡/歲53545657586061脂肪含量/%29.630.231.430.833.535.234.6根據以上數據,你能推斷人體的脂肪含量與年齡之間存在怎樣的關系嗎?
為了更加直觀地描述上述成對樣本數據中脂肪含量與年齡之間的關系,我們用圖形展示成對樣本數據的變化特征、用橫軸表示年齡,縱軸表示脂肪含量,則表中每個編號下的成對樣本數據都可用直角坐標系中的點表示出來,由這些點組成了如下圖所示的統計圖.我們把這樣的統計圖叫做散點圖.
觀察圖形,可以發現,這些散點大致落在一條從左下角到右上角的直線附近,表明隨年齡值的增加,相應的脂肪含量值呈現增加的趨勢.這樣,由成對樣本數據的分布規律,我們可以推斷脂肪含量變量和年齡變量之間存在著相關關系.
如果從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現增加的趨勢,我們就稱這兩個變量正相關;如果當一個變量的值增加時,另一個變量的相應值呈現減小的趨勢,則稱這兩個變量負相關.
由圖可推斷脂肪含量與年齡這兩個變量正相關.思考:(1)兩個變量負相關時,成對樣本數據的散點圖有什么特點?(2)你能舉出生活中兩個變量正相關或負相關的一些例子嗎?
散點圖是描述成對數據之間關系的一種直觀方法.觀察下面的散點圖,從中我們不僅可以大致看出脂肪含量和年齡呈現正相關性,而且從整體上可以看出散點落在某條直線附近.一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,我們就稱這兩個變量線性相關.年齡/歲脂肪含量/%
觀察散點圖8.1-2,我們發現:圖(1)中的散點落在某條曲線附近,而不是落在一條直線附近,說明這兩個變量具有相關性,但不是線性相關;類似地,圖(2)中的散點落在一條折線附近,這兩個變量也具有相關性,但它們既不是正相關,也不是負相關;圖(3)中的散點雜亂無章,無規律可言,看不出兩個變量有什么相關性.
一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量非線性相關或曲線相關.
課堂小結:兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.1.相關關系把成對樣本數據用直角坐標系中的點表示出來,由這些點組成的統計圖叫做散點圖.2.散點圖3.正相關與負相關一個變量隨另一個變量的增加呈現減小的趨勢.正相關:一個變量隨另一個變量的增加呈現增加的趨勢.負相關:1.舉例說明什么叫相關關系.相關關系與函數關系有什么區別?例如,身高與腳長的關系,一般來說,身高較高的人腳長也會較長,但身高相同的人腳長末必相同;
受教育程度和收人水平的關系,一般來說,受教育程度高的人收入也較高,但受教育程度相同的人收入未必相同.
相關關系是指從總的變化趨勢來看,變量之間存在著某種關系,但這種關系又不能用函數關系完全表達出來.相關關系是不確定性的數量關系,對其中一個變量的每個取值,另一個變量可能有多個不同的取值;而函數關系是確定性的數量關系,對自變量的每個取值,因變量有唯一確定的值與之對應.相同點:均是指兩個變量的關系.不同點:函數關系是一種確定的關系,因果關系;而相關關系是一種非確定性關系,也可能是伴隨關系.
請看課本P95:練習12.根據下面的散點圖,判斷圖中的兩個變量是否存在相關關系.負相關非線性相關不相關正相關
請看課本P95:練習23.下表給出了一些地區的鳥的種類數與該地區的海拔高度的數據,鳥的種類數與海拔高度是否存在相關關系?如果是,那么這種相關關系有什么特點?地區ABCDEFGHIJK海拔/m1250115810674577017316106701493762549鳥的種類/種363037111113171329415海拔高度/m解:從散點圖中散點的分布看,鳥的種類數與海拔高度正相關,鳥的種類數在海拔高度1000m以上的明顯多于在海拔高度1000m以下的.但從局部看,不管是在海拔高度1000m以上,還是在海拔高度1000m以下,鳥的種類數和海拔高度正相關都不明顯
請看課本P95:練習3例:以下是某地不同樓盤新房的銷售價格y(單位:萬元)和面積x(單位:m2)的數據解:面積x(m2)11511080135105銷售價格y(萬元)24.821.619.429.222(1)畫出數據對應的散點圖;(2)判斷新房的銷售價格和面積之間是否具有相關關系.如果有相關關系,是正相關還是負相關?(1)數據對應的散點圖如圖所示.(2)通過以上數據對應的散點圖可以判斷,新房的銷售價格和面積之間具有相關關系,且是正相關.1.下列所給出的兩個變量之間存在相關關系的為(
)A.學生的座號
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物業空調對接方案(3篇)
- 健康檢測干預方案(3篇)
- 寢室噪音處理方案(3篇)
- DB23-T3040-2021-落新婦品種分株繁殖技術規程-黑龍江省
- DB23-T3034-2021-東風菜露地栽培技術規程-黑龍江省
- DB23-T2992-2021-稻殼灰廢棄物綜合利用生產白炭黑用稻殼灰加工技術規范-黑龍江省
- DB23-T2886-2021-小黑楊嫁接更新技術規程-黑龍江省
- DB23-T2866-2021-金娃娃萱草栽培技術規程-黑龍江省
- 設計公司變現方案(3篇)
- 取消境內賽事管理制度
- DB61-T+1418-2021 河湖和水利工程管理范圍及保護范圍劃界技術規范
- 2025年江蘇省昆山市五校聯考中考三模道德與法治試題(原卷版+解析版)
- 麻精藥品管理培訓
- 2024年小升初試卷及答案
- 露營基地管理制度清單
- 2025年上海市黃浦區高三語文二模試卷及答案
- 工程調價協商函
- 老年腦卒中患者居家護理
- 2025年中國獨角獸企業行業市場調研及未來發展趨勢預測報告
- 手電鉆安全使用
- 老員工帶新員工的培訓制度
評論
0/150
提交評論