13.1-13.2 總體與樣本 數據的獲取(課件)-2023-2024學年高二數學同步課堂(滬教版2020必修第三冊)_第1頁
13.1-13.2 總體與樣本 數據的獲取(課件)-2023-2024學年高二數學同步課堂(滬教版2020必修第三冊)_第2頁
13.1-13.2 總體與樣本 數據的獲取(課件)-2023-2024學年高二數學同步課堂(滬教版2020必修第三冊)_第3頁
13.1-13.2 總體與樣本 數據的獲取(課件)-2023-2024學年高二數學同步課堂(滬教版2020必修第三冊)_第4頁
13.1-13.2 總體與樣本 數據的獲取(課件)-2023-2024學年高二數學同步課堂(滬教版2020必修第三冊)_第5頁
已閱讀5頁,還剩35頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

13.1-13.2總體與樣本

數據的獲取第13章

統計教師xxx滬教版(2020)

必修第三冊總體與樣本0102CONTANTS目錄數據的獲取總體與樣本011.總體:與所研究的問題有關的_________組成一個總體.2.個體:總體中___________.3.樣本:總體中的___________組成一個樣本.4.樣本容量:樣本中___________.所有對象每一個對象一部分個體個體的數目5.簡單隨機樣本:在選取樣本時,應該使總體的每一個個體有___________被選中,這種樣本稱為簡單隨機樣本.6.簡單隨機樣本的獲取方法:簡單隨機樣本可以用_____的方法或者利用計算機的_____________來獲取.同等的機會抽簽隨機數發生器(1)在50名學生中選取10名學生的視力作為樣本,則50名學生是總體.()(2)在選取樣本時,總體中的每一個個體應該都有同等的機會被選中.()(3)用抽簽的方法可以獲得簡單隨機樣本.()(4)在300名學生中選取100名優等生的數學成績作為樣本,反映總體的數學成績.()×√√×知識點1總體、個體、樣本和樣本容量【例1】某校初二年級全體320名學生在電腦培訓前后各參加了一次水平相同的考試,考分都以同一標準劃分成“不合格”、“合格”、“優秀”三個等級.為了了解電腦培訓的效果,用抽簽的方式得到其中32名學生的兩次考試的考分等級,所繪制的統計圖如圖所示.試結合圖示信息回答下列問題:(1)在此問題中,總體和樣本各是什么?(2)這32名學生經過培訓,考分等級“不合格”的百分比由____下降到_____.(3)通過調查這32名學生培訓效果估計整個學校初二年級的培訓效果合理嗎?為什么?【思路點撥】(1)根據樣本、總體的概念解答.(2)不合格人數的百分比=抽簽不合格人數÷抽簽人數×100%.(3)根據所選取樣本是否具代表性,估計培訓效果是否合理.【自主解答】(1)總體是初二年級320名學生電腦培訓的效果,樣本是抽到的32名學生電腦培訓的效果.(2)培訓前不合格的百分比是24÷32×100%=75%;培訓后不合格的百分比是8÷32×100%=25%.(3)合理,因為樣本容量不是很小,而且樣本的選取是隨機的,因此樣本具有代表性,可以估計全校初二年級320名學生電腦培訓的效果.【互動探究】問題中添加條件“學校有800名學生”后求學校培訓后不合格的人數是多少?提示:培訓后不合格的人數占初二年級人數的百分比為25%.所以學校培訓后不合格的人數為25%×800=200(人).【總結提升】總體、個體、樣本的異同總體、個體、樣本所指的考察對象是統一的,只是三者的包含范圍不一樣:總體是所要考察對象的全體,樣本是其中的一部分,個體是單獨的一個考察對象.總體也有容量,不能忽略.解題時,要清楚總體、個體、樣本所要研究的對象,而不是需要考察的對象的載體本身.知識點2簡單隨機樣本的應用【例2】為了制定本市初中七、八、九年級學生校服的生產計劃,有關部門準備對180名初中男生的身高做調查,現有三種調查方案:A.測量少年體校中180名男子籃球、排球隊員的身高;B.查閱有關外地180名男生身高的統計資料;C.在本市的市區和郊縣各任選一所完全中學、兩所初級中學,在這六所學校有關年級的各班中,用抽簽的方法分別選出10名男生,然后測量他們的身高.為了達到估計本市初中這三個年級男生身高分布的目的,你認為采用上述哪一種調查方案比較合理,為什么?【解題探究】1.選取樣本的原則是什么?提示:選取樣本的原則是使總體的每一個個體有同等的機會被選中(簡單隨機樣本).2.根據樣本選取的原則,調查方案A,B,C哪種符合簡單隨機樣本的標準?提示:調查方式A和B都不符合樣本選取標準,調查方式C符合樣本選取原則.【互動探究】按調查方案A測得的身高與實際身高有何差異?提示:偏高.因為少年體校中180名男子籃球、排球隊員的身高比一般學生都要高,所以,測得的數據偏高.【總結提升】選取簡單隨機樣本的兩種方法1.抽簽:編號后隨機抽取組成樣本.2.應用計算機隨機數發生器:編號后根據計算機抽取的號碼組成樣本.數據的獲取02

統計學是通過收集數據和分析數據來認識未知現象的,因此如何收集數據,是統計學研究的重要內容.

在實踐中,獲取數據的途徑多種多樣,像統計報表和年鑒、社會調查、普查和抽樣、互聯網、試驗設計等等都是常見的.下面介紹獲取數據的些基本途徑.1.通過調查獲取數據

對于有限總體問題,如人口總數、城鄉就業狀況、農村貧困人口脫貧狀況、生態環境改善狀況、青少年受教育狀況、高中生近視的比例、產品合格率、高中生日平均上網時間等問題,我們一般通過抽樣調查或普查的方法獲取數據.

針對不同問題的特點,為了有效收集所需數據,專家發明了各種不同的抽樣方法.除了我們已經學過的簡單隨機抽樣和分層隨機抽樣,還有系統抽樣、整群抽樣、不等慨率抽樣、自適應抽樣、兩階段抽樣等很多其他的方法,在實際應用中,關鍵在于是否能充分有效地利用背景信息選擇或創建更好的抽樣方法,并有效避免抽樣過程中的人為錯誤.在前面的學習中,我們對此有了一定的認識.2.通過試驗獲取數據

試驗是獲取樣本觀測數據的另一種重要途徑.例如,要判斷研制的新藥是否有效、培育的小麥新品種是否具有更高的產量等情況,沒有現存的數據可以查詢,就需要通過對比試驗的方法去獲取樣本觀測數據.又如特種鋼、輪胎的配方和產品質量等,也需要通過試驗獲取樣本觀測數據.

通過試驗獲取數據時,我們需要嚴格控制試驗環境,通過精心的設計安排試驗,以提高數據質量,為獲得好的分析結果奠定基礎.在統計學中,這種安排試驗的學問叫做“試驗設計”,感興趣的同學可以查閱試驗設計教科書.

在現實生活中,我們感興趣的很多自然現象都不能被人類所控制,如地震、降水、大氣污染、宇宙射線等,自然現象會隨著時間的變化而變化,不能用我們已經學過的有限總休來刻畫,也就不能用抽樣的方法獲取觀測數據;另一方面,由于自然現象不能被人為控制,也不能通過試驗獲取觀測數據.研究這類現象,只能通過長久的持續觀察獲取數據.3.通過觀察獲取數據

對于各個不同的行業,往往需要專業測量設備獲取觀測數據.隨著科技水平的提高,專業測量設備的自動化程度越來越高,通過觀測獲取和存儲數據的成本越來越低,這成為大數據產生的根源.一般地,通過觀察自然現象所獲取的數據性質比較復雜,其中蘊含著所觀察現象的本質信息,這些信息十分寶貴,統計學理論和方法是挖掘這些信息的強有力的工具之一.

我們感興趣的問題,可能有眾多專家研究過,他們在研究中所收集的樣本觀測數據可能存儲于學術論文、專著、新聞稿、公報或互聯網上,這些數據是寶貴的財富,我們可以收集前人的勞動成果并加以利用,從而減少收集數據的成本.我們往往把這樣獲得的數據叫做二手數據.國家統計局是我國最主要的統計數據收集和發布的部門,調查統計的數據涉及經濟、社會、民生的方方面面.國家統計局的統計數據通過多種形式進行公布,例如定期發布新聞稿、舉辦新聞發布會、發布統計公報、出版各類統計資料等.統計公報有年度統計公報、經濟普查公報、人口普查公報、農業普查公報等;統計資料出版物有《中國統計摘要》、以《中國統計年鑒》為代表的統計年鑒系列等.4.通過查詢獲得數據2014年全國交通事故情況

例如,我們想了解2014年全國的交通事故情況,通過查找《中國統計年鑒》可以得到如下表所示的數據.如果我們關心機動車交通事故逐年變化的情況,那么需要通過查找每年的數據表,并把它們合并整理.類型發生數/起死亡人數/人受傷人數/人直接財產損失/萬元機動車18032154944194887103386.0非機動車141752311157372719.4行人乘車人2242124711671403.5其他74219134.1總計19681258523211882107543

隨著信息技術的發展,通過互聯網獲取數據越來越成為獲取二手數據的主要方式.例如,可以從國家統計局的官方網站查詢得到國家統計局公布的各種統計數據.在網絡上,也有專門提供數據服務的公司,它們提供政府部門允許公開的各類數據.當然,互聯網的最大優勢是,人們可以利用強大的搜索功能,在整個網絡上查找所需要的數據.但從網絡上查找的數據,因為數據來歷和渠道多樣,所以質量會參差不齊,必須根據問題背景知識“清洗”數據,去偽存真,為進一步的數據分析奠定基礎.歸納總結通過試驗獲取數據沒有現存的數據可以查詢嚴格控制實驗環境,通過精心的設計安排試驗,以提高數據質量通過觀察獲取數據自然現象要通過長久的持續觀察獲取數據通過查詢獲得數據眾多專家研究過,其收集的數據有所存儲必須根據問題背景知識“清洗數據”,去偽存真獲取數據的基本途徑適用類型注意問題通過調查獲取數據對于有限總體問題,我們一般通過抽樣調查或普查的方法獲取數據要充分有效地利用背景信息選擇或創建更好的抽樣方法,并有效地避免抽樣過程中的人為錯誤典例分析例1:判斷正誤:(1)要得到某鄉鎮的貧困人口數據,可以通過試驗獲取數據.(2)要了解一批節能燈的使用壽命,可以采用普查的方式.(3)普查獲取的資料更加全面、系統,抽樣調查更方便、快捷.題型一獲取數據的途徑【解答】解:(1)某鄉鎮的貧困人口數據屬于有限總體問題,所以可以通過調查獲取數據,故(1)錯誤,(2)要了解一批節能燈的使用壽命,可以采用抽查的方式,故(2)錯誤,(3)普查獲取的資料更加全面、系統,抽樣調查更方便、快捷,故(3)正確.故答案為:(1)錯誤;(2)錯誤;(3)正確.變式訓練下列調查中,適宜采用全面調查(普查)方式的有.①調查某市市民對東京奧運會吉祥物的知曉率;②了解全國中學生的睡眠狀況;③檢查某學校的學生是否感染了流行病毒;④調查某超市庫存儲備的牛奶的質量情況;⑤調查乘坐某航班飛機的旅客是否攜帶違禁物品;⑥檢測一批種子的發芽率.【解答】解:③⑤是需要對每一個調查對象都進行調查,適宜采用全面調查;①②的調查樣本量大,不適宜進行全面調查;④⑥調查具有破壞性,只能選用抽樣調查.故答案為:③⑤.解題技巧選擇獲取數據的途徑的依據選擇獲取數據的途徑主要是根據所要研究問題的類型,以及獲取數據的難易程度.有的數據可以有多種獲取途徑,有的數據只能通過一種途徑獲取,選擇合適的方法和途徑能夠更好地提高數據的可靠性.練一練:下列問題中采用怎樣的抽樣方法較為合理?(1)運動會服務人員為參加400米決賽的六名同學安排跑道(2)一次數學競賽中,某班有10人在110分以上,40人在90~100分,10人

低于90分,現從中抽取12人了解有關情況解析:(1)總體容量較小,而且差異不大,用簡單隨機抽樣方法中的抽簽法和隨機數法都比較方便(2)不同成績段的學生對同一問題的看法可能存在較大差異,共用分層

隨機抽樣較為合理

3.為調查小區平均每戶居民的月用水量,下面是三名學生設計的方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論