




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
平均數標準差與變異系數第1頁,共35頁,2023年,2月20日,星期四數據有兩種變化趨勢:集中趨勢和離散趨勢。表示數據集中趨勢的指標有多個,如平均數(算術平均數、幾何平均數)、中位數、眾數,使用最多的是算術平均數。表示數據離散趨勢的指標有多個,如極差、平均離差、方差與標準差,使用最多的是方差與標準差。第2頁,共35頁,2023年,2月20日,星期四資料中各觀察值的總和除以觀察值的個數所得的商,稱為算術平均數,簡稱為平均數或均數。用符號表示。平均數的意義:平均數用來描述資料的集中性,即指出資料中數據集中較多的中心位置,常用于同類性質資料間的相互比較。一、集中趨勢第3頁,共35頁,2023年,2月20日,星期四計算方法1.直接法適用于樣本含量較小的非頻數資料如果一個含量為n的樣本,其n個觀察值分別用x1、x2……xn表示,則它們的平均數為其中,(Sigma)為總和符號,表示從第一個觀察值x1累加到第n個觀察值xn,若在意義上已明確時,簡記為x。第4頁,共35頁,2023年,2月20日,星期四常數的總和等于該常數的n倍,即代數和的總和等于總和的代數和,即總和符號內的常數因子可以提取到總和符號之外,即其中C為常數(a為常數)關于總和符號的幾個性質第5頁,共35頁,2023年,2月20日,星期四2.加權法如果樣本中有n1個x1,有n2個x2,那么,n1+n2個數的平均數是加權平均數。同理:各組的次數fi
是權衡各組中值
xi在資料中所占比重大小的數量,因此f被稱為是x的“權”,加權法也由此而得名。第6頁,共35頁,2023年,2月20日,星期四在計算離散型頻數資料的平均數時,式中x為組值,f為頻數,N為總頻數(∑f),k為組數。第7頁,共35頁,2023年,2月20日,星期四表3-1
50只小雞出殼天數的頻數分布表第8頁,共35頁,2023年,2月20日,星期四在計算連續型頻數資料的平均數時,式中m為組中值,f、N和k同上式。第9頁,共35頁,2023年,2月20日,星期四組別組中值m頻數(f)fm44.25—45.029045.75—46.529347.25—48.01048048.75—49.51259450.25—51.026132651.75—52.544231053.25—54.043232254.75—55.5291609.556.25—57.01162757.75—58.515877.559.25—60.0212060.75—61.54246合計20010695表3-2某純系蛋雞200枚蛋重的頻數分布表
=10695/200=53.475第10頁,共35頁,2023年,2月20日,星期四平均數有以下幾個基本特性:(1)平均數的計算與樣本內每個值都有關,它的大小受每個值的影響。(2)若每個xi都乘以相同的數k,則平均數亦應乘以k。(3)若每個xi都加上(或減去)相同的數A,則平均數亦應加上(或減去)A。第11頁,共35頁,2023年,2月20日,星期四中位數(median)將資料中所有觀察值從小到大依次排列,處于中間位置的數。以Md表示。適用條件資料呈偏態分布或頻數分布類型不明,以及一端或兩端無確定數值,這種資料用中位數作為代表值比用算術平均數為好。非頻數資料,先將各觀察值由小到大排列,當n為奇數時,第(n+1)/2位置的觀察值即為中位數,即:Md=x(n+1)/2第12頁,共35頁,2023年,2月20日,星期四其中:L—中位數所在組的下限;i—組距;f—中位數所在組的頻數;n—總頻數;c—小于中數所在組的累積頻數。當n為偶數時,和位置的兩個觀察值之和的二分之一即為中位數,即:若資料已分組,并編制成了頻數分布表,可利用頻數分布表計算中數。第13頁,共35頁,2023年,2月20日,星期四潛伏期(小時)病例數f累計例數0——252512——588324——4012336——2314648——1215860——516372——1164[例]某地區有164人因沙門氏菌食物中毒,其潛伏期資料經整理如下表,試計算中位數。第14頁,共35頁,2023年,2月20日,星期四眾數(Mode)資料中出現次數最多的那個數或頻數最多一組的組中值,記為Mo。第15頁,共35頁,2023年,2月20日,星期四
fmax=24,Mo=22
50只小雞出殼天數的頻數分布表Md=22第16頁,共35頁,2023年,2月20日,星期四組別組中值m頻數(f)fx44.25—45.029045.75—46.529347.25—48.01048048.75—49.51259450.25—51.026132651.75—52.544231053.25—54.043232254.75—55.5291609.556.25—57.01162757.75—58.515877.559.25—60.0212060.75—61.54246合計20010695表3-2某純系蛋雞200枚蛋重的頻數分布表
=10695/200=53.475fmax=44,Mo=52.5Md=53.35第17頁,共35頁,2023年,2月20日,星期四幾何平均數(Geometricmean)定義
指n個觀察值乘積的n次方根。即適用條件
主要應用于數據呈倍數關系或不對稱分布的資料,算術平均數對這類資料的代表性差。如抗體效價(1:10,1:100,1:1000,1:10000)、增長率或生長率、動態發展速度等。第18頁,共35頁,2023年,2月20日,星期四計算1、應用公式計算(實際應用時常取對數)第19頁,共35頁,2023年,2月20日,星期四例海蝦養殖試驗,各旬的生長速度3.0,1.51.3,1.2,1.2,1.1,1.1,求海蝦的旬平均生長速度。解:即海蝦平均生長速度為1.38。其算術平均數為第20頁,共35頁,2023年,2月20日,星期四當資料編成頻數分布表時,
—各組組中值;
—各組次數;第21頁,共35頁,2023年,2月20日,星期四二、離散趨勢資料的另一方面的特征是變異程度。如:
A組資料:3、4、5、6、7平均數為:5
B組資料:1、3、5、7、9平均數為:5
這里的平均數5對于A組資料的代表性好?還是對于B組資料的代表性好?
可見,只表明了數據的集中程度是遠遠不夠的,還需要進一步說明數據的變異程度。只有通過變異程度的描述,才知道代表值的代表性。表示數據變異特征的數值叫變異數。常用的變異數有:極差、平均離差、方差、標準差、變異系數等。第22頁,共35頁,2023年,2月20日,星期四極差(全距)極差=最大值-最小值只利用了資料中最大值和最小值,不能準確表達資料中各個觀察值的變異程度。平均離差
第23頁,共35頁,2023年,2月20日,星期四它不能表示整個資料中所有觀察值的總偏離程度使用不方便,在統計學中未被采用消除離均差的負號離均差的平方之和(簡稱平方和,記為SS)稱為均方(縮寫為MS),又稱為樣本方差,記為S2標準差S離均差第24頁,共35頁,2023年,2月20日,星期四首先求出離均差,即每個數與它們的平均數之間的離差;然后將所有的離均差平方,再相加,得出離均差平方和;最后用n-1除離均差平方和(按照統計學理論,不要用樣本含量n去除),所得的商稱為樣本方差,用符號s2表示。方差s2是離均差平方的平均數。雖然方差在實際應用中用得最廣泛,但因它的單位是原始數據單位的平方,所以它不能直接地指出某個數x與平均數之間的偏離究竟達到什么程度。為此,采用標準差s做標準,衡量x與平均數之間的離散程度。第25頁,共35頁,2023年,2月20日,星期四自由度(degreeoffreedom):統計學借此來反映一批變量的約束條件。例如一個有5個觀察值的樣本,因為受到統計數的約束,在5個離均差中,只有4個數值可以在一定范圍內自由變動取值,而第五個離均差必須滿足這一限制條件。自由度記作DF,一般樣本自由度等于觀察值個數(n)減去約束條件的個數(k),即DF=n-k。
第26頁,共35頁,2023年,2月20日,星期四樣本方差樣本標準差第27頁,共35頁,2023年,2月20日,星期四為了方便計算,將離均差平方和轉化為另一種形式,同時略去下標,上式可表示為:第28頁,共35頁,2023年,2月20日,星期四在計算離散型頻數資料的標準差時,式中x為組值,f為頻數,N為總頻數(∑f),k為組數。第29頁,共35頁,2023年,2月20日,星期四在計算連續型頻數資料的標準差時,式中m為組中值,f、N和k同上式。第30頁,共35頁,2023年,2月20日,星期四標準差的特性(一)標準差的大小受資料中各觀察值的影響,觀察值間變異大的標準差也大,反之則??;(二)計算標準差時,各觀測值加上或減去一個常數,標準差的值不變;
(三)當每個觀察值都乘以一個常數a時,所得的標準差是原來標準差的a倍.第31頁,共35頁,2023年,2月20日,星期四樣本的方差為總體的方差為第32頁,共35頁,2023年,2月20日,星期四變異系數Coeffcientofvariation資料的單位不同或平均數相差很大時,直接利用標準差比較資料間變異程度是不妥的,需用變異系數。變異系數同標準差一樣是衡量資料變異程度的統計量。變異系數消除了不同單位和平均數的影響,可以用來比較不同資料的相對變異程度。第33頁,共35頁,2023年,2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 踐行理念計算機二級試題及答案總結
- 論文學概論考試的核心試題及答案
- 計算機二級MySQL表札創建試題及答案
- 2025七年級下冊數學學科融合計劃
- 藥品采購中的網采中選藥品實施措施
- 智能倉儲設備采購與智能化物流配送執行協議
- 智能灌溉系統定制開發與農業可持續發展戰略合同
- 稅務師事務所合伙人資源共享與互補合作協議
- 湘教版科學五年級上冊科學興趣小組計劃
- 消防工程設計審查與施工監理服務協議
- 2025-2030年中國緩釋和和控釋肥料行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025年河北省秦皇島市海港區中考一模數學試卷(原卷版+解析版)
- 衛生法律法規的試題及答案
- 2025年注冊測繪師考試測繪地理信息數據處理與應用試題
- 2025屆湖北省黃岡市黃州中學高考生物三模試卷含解析
- 二手車貨車合同協議書
- 2024-2025部編版小學道德與法治二年級下冊期末考試卷及答案
- 測井試題及答案完整版
- 人格性格測試題及答案
- 2025-2030年中國電子變壓器市場運行前景及投資價值研究報告
- 山東某年產10萬噸甲醇工程施工組織設計(土建 安裝)
評論
0/150
提交評論