




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、體育統計數據特征第1頁,共55頁,2022年,5月20日,23點14分,星期日一、集中量數由頻數分布表可看出頻數分布的兩個重要特征:集中趨勢和離散程度。 如:例2.2,身高有高有矮,但中等身高居多,此為集中趨勢;由中等身高到較矮或較高的頻數分布逐漸減少,反映了離散程度。對于數值變量資料,可從集中趨勢和離散程度兩個側面去分析其規律性。第2頁,共55頁,2022年,5月20日,23點14分,星期日集中趨勢:在一組數據中變量值集中的位置(數據分布最密集的位置)。集中量數:反映集中趨勢的統計量稱為集中量數。常用的集中量數有: (1)算術平均數 (2)中位數 (3)眾數第3頁,共55頁,2022年,5月
2、20日,23點14分,星期日1、算術平均數定義:所有觀察值之和除以總頻數,簡稱均數。 樣本均數: 總體均數:含義:反映同質研究對象觀察值的平均水平與集中趨勢的統計量。 第4頁,共55頁,2022年,5月20日,23點14分,星期日算術平均數的計算方法(1)直接法:由觀察值直接計算,用于樣本含量較少時,其公式為: 式中,希臘字母表示求和; X1,X2,Xn為各觀察值; n為樣本含量,即觀察值的個數。第5頁,共55頁,2022年,5月20日,23點14分,星期日例1:某少年組運動員10人,立定跳遠成績(單位:米)如下表試求其均值。(p26例3.1)解: 返回編號12345678910成績2.722
3、.682.782.832.622.813.093.002.942.89第6頁,共55頁,2022年,5月20日,23點14分,星期日(2)加權法:當資料中出現相同觀察值時,可將相同觀察值的個數(即頻數)與該觀察值 X 的乘積代替相同觀察值逐個相加,即 X1 , X2 , , Xk f1 , f2 , , fk其公式為:第7頁,共55頁,2022年,5月20日,23點14分,星期日例2:某人50發射擊成績如下表,試求其均數。 (p16例2.1)解:環數 5 6 8 9 10頻數 4 3 18 22 3第8頁,共55頁,2022年,5月20日,23點14分,星期日(3)簡捷法:主要是針對連續型頻數
4、分布表,是加權法的一種變形形式。其公式為: 式中: :所在組的組下限 f:該組的頻數 i:組距第9頁,共55頁,2022年,5月20日,23點14分,星期日 身 高 頻 數11511183121812410127201301913312136413921421451總和80例3:80名上海市小學二年男生身高數據如下表:求其均值。(p16例2.2)解:第10頁,共55頁,2022年,5月20日,23點14分,星期日算術平均數的適應范圍及優缺點優點:(1)均數作為反映變量的集中量數,既考慮到頻次的多少,又考慮到每一個變量值的大小,故它是可靠的、靈敏的,也是對資料提供信息運用最充分的。(2)均數適合
5、代數運算,計算方便,因此是一個用途最廣、效果最好的集中量數。第11頁,共55頁,2022年,5月20日,23點14分,星期日缺點: (1)均數易受少數極端數據的影響而大大改變其數值,從而相對削弱它作為集中量數的代表性。適應范圍: 數據嚴重偏態分布時,一般不用均數反映它的集中趨勢。一般應用于正態或近似正態的數據。第12頁,共55頁,2022年,5月20日,23點14分,星期日給定一組數據資料,如何判斷是否適合選用算術均數來表達其平均水平呢?(1)如果是小樣本,可用目測法:如果數據相差不太懸殊,將數據由小到大排列后,較小和較大的數據個數基本相等,且關于最中間的數據基本對稱即可。(2)如果大樣本,將
6、其按一定組距分組,若居中的組段內頻數最大,而且在該組前后的組段內的頻數逐漸減少且基本對稱,也適合用算術均數。第13頁,共55頁,2022年,5月20日,23點14分,星期日關于集中趨勢的討論集中趨勢反映的是位置,不能比較大小。 例: 甲班體育統計平均成績 乙班體育統計平均成績 上式反映的是:乙班的成績比甲班好(平均水平),而不能說乙班的集中趨勢比甲班大。第14頁,共55頁,2022年,5月20日,23點14分,星期日2、中位數定義: 是把各個變量值按大小順序排列后,位于序列中間的數,稱為中位數,是一種位置指標,反映數據集中趨勢的一個統計量。記為: 含義:反映一組觀察值在位置上的平均水平。第15
7、頁,共55頁,2022年,5月20日,23點14分,星期日中位數的計算離散型數據(1)數據個數為奇數個時:(2)數據個數為偶數個時:連續型數據(略)第16頁,共55頁,2022年,5月20日,23點14分,星期日例4:求下列兩組數的中位數(1)14,2,17,9,22,13,1,7,11(2)1,26,11,9,14,13,7,17,22,2解:先排序 (1)1,2,7,9,11,13,14,17,22 該組的中位數為: 11 (2) 1,2,7,9,11,13,14,17,22,26 該組的中位數為:第17頁,共55頁,2022年,5月20日,23點14分,星期日優缺點及適用條件優缺點: (
8、1)由于中位數只受居中變量值的影響,故它不夠靈敏、充分。 (2)不會受到極端數據的影響。適用條件: 適用于任何分布資料,特別是偏態分布、分布不明、分布末端無確定值。第18頁,共55頁,2022年,5月20日,23點14分,星期日極端數據對均數和中位數影響的舉例例5:分別求下列兩組數的均數和中位數。 (1)1,2,7,9,11,13,14,17,22 (2)1,2,7,9,11,13,14,17,100解:(1)中位數為:11 均數為:10.67 (1)中位數為:11 均數為:19.33第19頁,共55頁,2022年,5月20日,23點14分,星期日3、眾數定義:在一次實驗中出現次數(頻數)最多
9、的觀察值;在頻數分布表中對應于數據最集中所在位置的觀察值。記作:適應條件:適用于大樣本;較粗糙。第20頁,共55頁,2022年,5月20日,23點14分,星期日例6:某班體育考試成績如下表:該組數據的眾數:分 數7071727374757677787980頻 數2461411975431第21頁,共55頁,2022年,5月20日,23點14分,星期日4、均數、中位數、眾數三者關系正態分布時: 均數中位數眾數右偏態分布時:均數中位數眾數左偏態分布時:均數中位數眾數第22頁,共55頁,2022年,5月20日,23點14分,星期日常用集中趨勢指標及應用條件集中趨指標 應用場合算術均數適用于對稱分布,
10、特別是正態分布眾數大樣本,較粗糙。中位數適用于任何分布資料,特別是偏態分布、分布不明、分布末端無確定值第23頁,共55頁,2022年,5月20日,23點14分,星期日二、離散量數例7:兩組學生的引體向上成績如下: 甲組:3,5,5,5,5,6,6 乙組:1,2,4,5,6,8,9 從該上述資料中兩組數據我們可以看出: (1)甲組和乙組的平均成績都是5。 (2)這兩組數據的分布特征不盡相同,各組的7個數據間參差不齊的程度是不一樣的。 (3)根據常識:我們會認為甲組的成績比乙組好。第24頁,共55頁,2022年,5月20日,23點14分,星期日離散程度(變異程度): 反映數據分布的密集程度。離散量
11、數:反映數據離散程度的指標稱為離散量數。 常用的離散量數: 1、全距 2、方差、標準差 3、變異系數第25頁,共55頁,2022年,5月20日,23點14分,星期日1、全距(極差)定義:該組數據的最大值與最小值的差。計算方法:R=max-min 例7中: 因為 : 所以:甲組成績的離散程度(變異程度)小于乙組成績。第26頁,共55頁,2022年,5月20日,23點14分,星期日優缺點: (1)計算簡單方便。 (2)只反映出該組數據資料中最大值與最小值的信息,其他數據信息反映不充分。 (3)只能比較數據數目相同的同質數據。適用條件: 樣本含量較小時,數據分布相對比較均勻的數據。第27頁,共55頁
12、,2022年,5月20日,23點14分,星期日2、離均差平方和 表示所有數到均數差的代數和。第28頁,共55頁,2022年,5月20日,23點14分,星期日 的幾何解釋:表示各點到均數距離的和。由于該值為零,無法反映數據的離散程度,但是對我們找一個合適的指標來反映離散程度有一定啟發意義。第29頁,共55頁,2022年,5月20日,23點14分,星期日 表示所有數到均數差的絕對值的和。 的幾何解釋:表示各點到均數路程的和。 如果這個值越小則離散程度就越小,反之亦然。優點:反映的信息充分。缺點: (1)只能比較數據數目相同的同質數據。 (2)式中包含絕對值符號。 第30頁,共55頁,2022年,5
13、月20日,23點14分,星期日 :離均差平方和,表示所有數和均數差的平方的代數和。 離均差平方和的含義: 表示所有數據的總變異即總的離散程度。優點:充分、靈敏、嚴密確定。缺點:只能比較數據數目相同的同質數據。第31頁,共55頁,2022年,5月20日,23點14分,星期日為什么我們一般不使用離均差平方和來反映數據的離散程度(變異程度)? 例:現在有兩個班同時在學習體育統計,甲班有45人,乙班有40人,考試結束后,比較兩個班的體育統計成績?是分別比較兩個班的總分還是平均分? 結果是顯而易見的:比較平均分,因為兩個班的人數不相等。 離均差平方和就相當于這里的總分。第32頁,共55頁,2022年,5
14、月20日,23點14分,星期日3、方差定義:離均差平方和除以該組數據的總頻數。 其公式為: n-1: 自由度總體方差:樣本方差:第33頁,共55頁,2022年,5月20日,23點14分,星期日含義:表示每個觀察值的平均離散程度,方差越大,說明數據的離散程度越大。優點:(1)靈敏性、嚴密確定、充分性。(2)可以比較不同數目同質數據的各組數據資料。缺點:(1)容易受到極端數據影響。(2)它的單位與觀察值的單位不同,是觀察值單位的平方,這給我們解釋實際問題造成了一些麻煩。 第34頁,共55頁,2022年,5月20日,23點14分,星期日4、標準差定義:方差的平方根。其公式為: 式中, n-1: 自由
15、度含義:反映每個數據的平均離散程度,標準差越大,說明數據的離散程度越大。 總體標準差:樣本標準差:第35頁,共55頁,2022年,5月20日,23點14分,星期日標準差的優缺點及適用條件優缺點:(1)靈敏性、嚴密確定、充分性。(2)標準差能對平均數的代表性作出 補充說明。 標準差越大,表明這組數據的離散程度越大,平均數的代表性越差;標準差越小,表明這組數據的離散程度越小,平均數的代表性越好。(3)與方差相比,標準差更容易解釋實際問題。(4)易受極端數據的影響。適用條件:(1)數據分布相對比較均勻,正態或近似正態的數據。第36頁,共55頁,2022年,5月20日,23點14分,星期日標準差的計算
16、方法(1)直接法:用于樣本量較小的資料。其公式為:其中:第37頁,共55頁,2022年,5月20日,23點14分,星期日例8:某少年組運動員10人,立定跳遠成績(單位:米)如下表試求其標準差。(p26例3.1)解: 編號12345678910成績2.722.682.782.832.622.813.093.002.942.89第38頁,共55頁,2022年,5月20日,23點14分,星期日(2)加權法:用于樣本量較大的離散型頻數表資料。 其公式:其中,第39頁,共55頁,2022年,5月20日,23點14分,星期日例9:某人50發射擊成績如下表,試求其標準差。 (p16例2.1)解:環數 5 6
17、 8 9 10頻數 4 3 18 22 3第40頁,共55頁,2022年,5月20日,23點14分,星期日(3)簡捷法:是加權法的另一種變形形式,主要用于連續型頻數分布表。其公式為:組下限f:該組的頻數其中:第41頁,共55頁,2022年,5月20日,23點14分,星期日 身高 頻 數11511183121812410127201301913312136413921421451總和80例10:80名上海市小學二年男生身高數據如下表:求其均值。(p16例2.2)解:第42頁,共55頁,2022年,5月20日,23點14分,星期日5、變異系數定義:同組數據的標準差與平均數的百分比。含義:表示數據的
18、相對變異程度,變異系數越小,變異程度就越小;變異系數越大,變異程度就越大。適用條件: 比較單位相同但均數相差較大數據。 比較單位不同的數據。第43頁,共55頁,2022年,5月20日,23點14分,星期日例11:測100名男生100米跑成績 ;立定跳遠 , ,是比較兩項成績哪一項整齊。解:所以:100米跑成績更整齊。第44頁,共55頁,2022年,5月20日,23點14分,星期日6、標準差(方差)與變異系數的區別標準差反映數據的絕對離散程度(變異程度);變異系數反映數據相對的變異程度。標準差(方差、全距)只能比較同質的數據;變異系數可以比較不同質的數據。變異系數只能比較大小,不能進行代數運算。
19、例:上式無任何實際意義!第45頁,共55頁,2022年,5月20日,23點14分,星期日集中趨勢 離散趨勢 應用場合算術均數 標準差 適用于對稱分布,特別是正態分布 中位數 全距 變異系數 適用于任何分布資料,特別是偏態 分布、分布不明、分布末端無確定 值適用于均數相差懸殊或度量衡單位不同的資料各種樣本特征數的適應條件第46頁,共55頁,2022年,5月20日,23點14分,星期日本章重點內容明確均數、中位數、標準差和變異系數的優缺點及其適用條件。均數、中位數、標準差和變異系數的含義。均數、中位數、標準差和變異系數的計算。第47頁,共55頁,2022年,5月20日,23點14分,星期日自由度:
20、 在統計學中,n個數據如不受任何條件的限制,則n個數據可取任意值,稱為有n個自由度。若受到k個條件的限制,就只有(nk)個自由度了。 計算標準差時, n個變量值本身有n個自由度。但受到樣本均數的限制,任何一個“離均差”均可以用另外的(n1)個“離均差”表示,所以只有(n1)個獨立的“離均差”。因此只有(n1)個自由度。 返回第48頁,共55頁,2022年,5月20日,23點14分,星期日身高頻數累計頻數 頻率累計頻率115111.25%1.25%118343.75%5.00 %12181210%15.00 %124102212.5%27.50 %127204225%52.5 %13019612
21、3.75%76.25 %133127315%91.25 %1364775%96.25 %1392792.50%98.75 %1421451801.25%100 %總和80 返回第49頁,共55頁,2022年,5月20日,23點14分,星期日計算器用法 MODE MODE 1 “SD” SHIFT CLR 1 EXE(=) “清除數據” X1 M+ “輸入數據” X2 M+ Xn M+ SHIFT 2 1 EXE(=) “算術平均數” SHIFT 2 3 EXE(=) “標準差” 第50頁,共55頁,2022年,5月20日,23點14分,星期日 MODE MODE 1 “SD” SHIFT CLR 1 EXE(=) “清除數據” 2.72 M+ “輸入數據” 2.68 M+ 2.78 M+ 2.89 M+ SHIFT 2 1 EXE(=) “2.836” SHIFT 2 3 EXE(=) “0.147” 第51頁,共55頁,2022年,5月20日,23點14分,星期日 MODE MODE 1 “SD” SHIFT CLR 1 EXE(=) “清除數據” X1 SHIFT , f1 M+ “輸入數據” X2 SHIFT ,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 設備預知維修管理制度
- 設計研發中心管理制度
- 評估外聘專家管理制度
- 診所藥品供貨管理制度
- 2025年中國滑動窗行業市場全景分析及前景機遇研判報告
- 調度系統設備管理制度
- 財務風險預警管理制度
- 貨代公司人員管理制度
- 貨架物品擺放管理制度
- 貨車油路直供管理制度
- T/CWPIA 2-2020戶外重組竹地板鋪裝技術規范
- 2025屆黃岡市重點中學八下數學期末統考試題含解析
- 2025年英語四級考試模擬試卷及答案
- 跨學科視域下道德與法治與心理健康教育融合的探究
- 智能在線問卷調查系統開發合同
- 2025公需課《人工智能賦能制造業高質量發展》試題及答案
- 汽車4S店展廳布局設計
- 旅游公司的財務崗位職責
- 《結腸憩室》課件
- 2025年廣東省珠海市香洲區5月中考模擬化學試題(含答案)
- 2025年江蘇省無錫市惠山區中考一模英語試題(含答案)
評論
0/150
提交評論