統計數據的描述_第1頁
統計數據的描述_第2頁
統計數據的描述_第3頁
統計數據的描述_第4頁
統計數據的描述_第5頁
已閱讀5頁,還剩77頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

位置的度量

MeasuresofLocationMean平均數Median中位數Mode眾數Percentiles百分數Quartiles四分位數當前1頁,總共82頁。問題:莎士比亞的作品是否真的是莎士比亞寫的?美國一般家庭有多少個孩子?男性的薪水是否一定比女性高?新娘和新郎在結婚時的年齡是多少?當前2頁,總共82頁。各種平均數平均數是一個數值,是對一個變量的觀察值進行計算后得到的.我們常讀到MBA的平均工資,平均房價,道瓊斯平均股票價格,平均謀殺率等.你都理解這些平均數嗎?讓我們來看一下下面的句子:當代美國的平均人是女人,平均每個女人有2.1個孩子,且這些女人住在平均價值為$80000的住房中當前3頁,總共82頁。一、算術平均數㈠算術平均數的概念與用途㈡算術平均數的計算㈢算術平均數的數學性質當前4頁,總共82頁。Thisisthemostpopularandusefulmeasureofcentrallocation基本計算方法是各項數據之和與數據的個數之比。是集中趨勢最主要的測度值。SumofthemeasurementsNumberofmeasurementsMean=SamplemeanPopulationmeanSamplesizePopulationsize

Arithmeticmean算術平均數當前5頁,總共82頁。算術平均數:全部變量值之和與變量值個數相除所得的商。通常也稱為平均數(average)或均值(mean)。算術平均數的概念與用途當前6頁,總共82頁。STAT算術平均數83名女生的身高變量一般水平、代表性數值分布的集中趨勢、中心數值算術平均數當前7頁,總共82頁。一、算術平均數㈠算術平均數的概念與用途㈡算術平均數的計算㈢算術平均數的數學性質當前8頁,總共82頁。算術平均數的計算算術平均數=總體標志總量總體單位總數數據集數據個數N簡單算術平均數當前9頁,總共82頁。當前10頁,總共82頁。“權”和"weight"的字義商務印書館《古代漢語詞典》1998.12版權:1.樹名。2.秤錘,秤。3.稱量。4.權力。5.權宜。6.副詞,姑且。7.權攝,暫代官職。8.周列國名。9.通“顴”,面頰。牛津大學出版社《牛津現代高級英漢雙解詞典》1985Weight/n1.gravitationalforce引力,重力,地心吸力2.Howheavyathingis.重量3.Loadtobesupport負擔4.importanceorinfluence重要,影響力5.pieceofmetalofknownweightusedinscalesforweighingthings秤錘6.systemforunits,scaleornotation,forexpressing計重法

vt1.放砝碼於…上2.使負重擔3.用礦物質處理(織物)使之顯得更結實當前11頁,總共82頁。桿秤合稱“權衡”,秤砣為權,秤桿為衡“權”的概念旨在刻畫對有關假設的整個局面的知識的增長陳克艱《上帝怎樣擲骰子》四川人民出版社,1987,54頁當前12頁,總共82頁。秦權銅詔鐵權秦當前13頁,總共82頁。秦量吳昌碩臨秦權文字當前14頁,總共82頁。

身高組中值人數比重(cm)(cm)

(人)(%)

150-155152.533.61155-160157.51113.25160-165162.53440.96165-170167.52428.92170以上172.51113.25

總計83100某年級83名女生身高資料組距數列次數f頻率f/Σf變量值x加權算術平均數當前15頁,總共82頁。例題:當前16頁,總共82頁。二、交替標志的平均數在社會經濟統計中,有時把社會經濟現象的總體單位,分為具有某種標志的單位和不具有這種標志的單位兩組。統計中,用“是”、“否”或“有”、“無”來表示的標志,稱為交替標志,也稱是非標志。當前17頁,總共82頁。交替標誌

Qualitativevariables-proportions

定性變量-比例Qualitativevariablesaresummarizedbyatableofproportionsorpercentages.Whiletherearetheconceptsoflocationandvariabilityforsuchvariables,therearenosinglenumbersummariesforthelocationandvariability.Generallythelocationissummarizedbygivingthepercentagesinthemostcommongroups.當前18頁,總共82頁。交替標誌or是非標誌分組單位數變量值具有某一屬性不具有某一屬性10合計—為研究是非標誌總體的數量特征,令指總體中全部單位只具有“是”或“否”、“有”或“無”兩種表現形式的標志,又叫是非標誌交替標誌當前19頁,總共82頁。是非標誌總體的指標具有某種標志表現的單位數所占的成數不具有某種標志表現的單位數所占的成數指是非標誌總體中具有某種表現或不具有某種表現的單位數占全部總體單位總數的比重成數當前20頁,總共82頁。是非標誌總體的均值均值當前21頁,總共82頁。1.簡單幾何平均數幾何平均數(又稱“對數平均數”)計算時要進行對數變換,即:當前22頁,總共82頁。幾何平均數(geomean(geomatricmean))是N

個變量值連乘積的N次方根。當前23頁,總共82頁。

就用途而言,幾何平均方法直接用于個體數量相乘等于總數量的現象的平均。某產品的總合格率=各連續作業工序合格率之積若干年間總的1+利率(復利)=各年度1+利率之積第一道工序第二道工序全工序投入制品1000個900個1000個合格產品900個810個810個合格率%90908181%=90%90%向銀行借款1000元,年利率(復利)為10%,則:第一年利息額100元,第二年利息額110元,兩年合計210元。兩年后還款本利和與借款額的比例為1.21。1.21=1.11.1

當前24頁,總共82頁。例某機械廠有鑄造車間、機加工車間、裝配車間三個連續流水作業車間。本月份這三個車間產品合格率分別為95%、92%、90%,求平均車間產品合格率。解:這說明該廠車間產品平均合格率為92.31%當前25頁,總共82頁。2.加權幾何平均數當前26頁,總共82頁。

投資銀行某筆投資的年利率是按復利計算的,25年的年利率分配是:有1年為3%,有4年為5%,有8年為8%,有10年為10%,有2年為15%,求平均年利率。本利率(%)X年數f本利率的對數lgXf·lgX10312.01282.012810542.02128.084810882.033416.2672110102.041420.414011522.06074.1214合計25-50.9002例當前27頁,總共82頁。這就是說,25年的平均本利率為108.6%,年平均利率即為8.6%。當前28頁,總共82頁。△幾何平均數的特點如果數列中有一個標志值等于零或負值,就無法計算;受極端值的影響較和小;它適用于反映特定現象的平均水平,即現象的總標志值是各單位標志值的連乘積。當前29頁,總共82頁。△幾何平均數的特點如果數列中有一個標志值等于零或負值,就無法計算;受極端值的影響較和小;它適用于反映特定現象的平均水平,即現象的總標志值是各單位標志值的連乘積。當前30頁,總共82頁。72法則計算翻一番需要的時間時,可以用72除以增長速度的數值,得到時期數比如,每年增長10%,則7.2年翻一番;每年增長3%,則24年翻一番1.1^7.2=1.991.03^24=2.03通常,年利率都是10以下,此法很準72法則同樣還可以用來算貶值,設年通貨膨脹率是8%,那么72/8=9,9年後你現在的一元錢就只能買五毛錢的東西了。當前31頁,總共82頁。以20天為週期對國際油價進行評估國際油價連續20天日均漲幅或跌幅超過4%,就應考慮對國內成品油價格進行調整1.04^20=2.190.96^20=0.44該準則意味著:在連續的20天之內,如果油價上漲超過1倍,或下跌了一半以上,就要考慮調整國內油價當前32頁,總共82頁。三、次序統計量(位置平均數)㈠眾數㈡中位數㈢四分位數和百分位數當前33頁,總共82頁。眾數(mode):出現次數最多即出現頻率最高的變量值。身高人數(CM)(人)152115421552156415711582159216012161716281634身高人數(CM)(人)1643165816651673168716911705171217231741總計83152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174當前34頁,總共82頁。眾數的確定方法某年級83名女生身高資料

身高人數(CM)(人)152115421552156415711582159216012161716281634

身高人數(CM)(人)1643165816651673168716911705171217231741總計83當前35頁,總共82頁。

身高人數比重(CM)(人)(%)150-15533.61155-1601113.25160-1653440.96165-1702428.92170以上1113.25

總計83100某年級83名女生身高資料眾數的確定方法概約眾數:眾數所在組的組中值,在本例為162.5cm當前36頁,總共82頁。眾數的原理及應用83名女生身高原始數據83名女生身高組距數列當前37頁,總共82頁。

當數據分布存在明顯的集中趨勢,且有顯著的極端值時,適合使用眾數。在數據分布的集中趨勢不明顯或存在兩個以上分布中心時,不適合使用眾數(前者無眾數,后者為雙眾數或多眾數,也等于沒有眾數)。眾數的原理及應用當前38頁,總共82頁。出生1981.01980.01979.01978.01977.01976.01975.0160140120100806040200413名學生出生時間分布直方圖眾數的原理及應用沒有突出地集中在某個年份當前39頁,總共82頁。192.5190.5188.5186.5184.5182.5180.5178.5176.5174.5172.5170.5168.5166.5164.5162.5160.5158.5156.5154.5152.5150.5148.56050403020100眾數的原理及應用413名學生的身高分布直方圖出現了兩個明顯的分布中心當前40頁,總共82頁。413名學生身高分布條形圖當前41頁,總共82頁。413名學生身高分布疊加線圖當前42頁,總共82頁。STAT

在研究身高時,男生與女生不能合成一個總體,而是應當作為兩個總體分別進行統計。

當數據分布呈現出雙眾數或多眾數時,可以斷定這些數據來源于不同的總體。當前43頁,總共82頁。當前44頁,總共82頁。眾數的應用可以用來平均名詞型變量:如性別變量只有兩個值,男和女.在美國婦女比男子多.所以可以說平均人口是女人.一項對大學生的研究包括了10個心理學專業的學生,20個英語專業的學生和5個數學專業的學生.我們就無法計算這些專業的平均數的中位數,但我們可以指出眾數是英語專業,因為它是出現頻數最多的那個塊專業.眾數用來描述分類變量,特別是許多個值的分類變量.例如在某一特別的街區,宗教的眾數是穆斯林,人種的眾數是亞裔,而社會階級的眾數是”中上等”當前45頁,總共82頁。三、次序統計量(位置平均數)㈠眾數㈡中位數㈢四分位數和百分位數當前46頁,總共82頁。152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174

中位數(median):位于變量值序列中點的數值中位數當前47頁,總共82頁。中位數的確定方法對于未分組數據:中位數位置為某年級83名女生身高資料

身高人數累計(CM)(人)人數152111542315525156491571101582121592141601226161733162841163445

身高人數累計(CM)(人)人數

164348165856166561167364168771169172170577171279172382174183

總計83當前48頁,總共82頁。中位數的確定方法

身高人數累計(CM)(人)人數150-15533155-1601114160-1653448165-1702472170以上1183

總計83某年級83名女生身高資料當前49頁,總共82頁。中位數的作用及用法中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。566668920中位數為6當前50頁,總共82頁。中位數的作用及用法中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。566668920中位數為(6+6)/2=6當前51頁,總共82頁。中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。中位數的作用及用法當前52頁,總共82頁。中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。中位數的作用及用法當前53頁,總共82頁。中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。中位數的作用及用法當前54頁,總共82頁。中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。中位數的作用及用法當前55頁,總共82頁。中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。中位數的作用及用法

變量值34556910中位數5平均值6與中位數離差-2-100145與平均數離差-3-2-1-1034絕對數值之和1314當前56頁,總共82頁。中位數與累計次數分布在累計次數分布曲線上,縱軸上50%所對應的點,其橫軸坐標就是中位數。當前57頁,總共82頁。結婚年齡中位數HK當前58頁,總共82頁。當前59頁,總共82頁。當前60頁,總共82頁。三、次序統計量(位置平均數)㈠眾數㈡中位數㈢四分位數和百分位數(四)箱線圖當前61頁,總共82頁。百分位數:提供了數據值如何在最小值至最大值之間分布的信息.對不含多個重復數值的數據來說,第P個百分數把數據分成兩部分:大約P%的觀察值小于第P個百分數;大約(100-P)%的觀察值大于第P個百分數

四分位數(quartile

將數據等分為4部分)和百分位數(percentile將數據等分為100部分)。中位數也是一個分位數(二分位數,將數據等分為兩部分)。當前62頁,總共82頁。當前63頁,總共82頁。當前64頁,總共82頁。MeasuresofRelativeStandingandBoxPlots

相對位置的測定和箱線圖PercentileThepthpercentileofasetofmeasurementsisthevalueforwhichatmostp%ofthemeasurementsarelessthanthatvalueatmost100(1-p)%ofallthemeasurementsaregreaterthanthatvalue.ExampleSuppose600isthe78%percentileofaGMATscore.Then60020080078%ofallthescoresliehere22%當前65頁,總共82頁。152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174第一個四分位數Q1

第二個四分位數Q2

第三個四分位數Q3

分位數的確定及用途當前66頁,總共82頁。分位數的確定及用途25%25%25%25%75%即四分之三的數據小于等于Q3當前67頁,總共82頁。三、次序統計量(位置平均數)㈠眾數㈡中位數㈢四分位數和百分位數(四)箱線圖當前68頁,總共82頁。BoxPlots箱線圖Thisisapictorialdisplay畫圖thatprovidesthemaindescriptivemeasuresofthemeasurementset:L-thelargestmeasurementQ3-TheupperquartileQ2-ThemedianQ1-ThelowerquartileS-ThesmallestmeasurementSQ1Q2Q3LAnadjustmenttothisgeneraldescriptionofaboxplotmaybeneededinthepresenceofoutliers.Seethenextexample.當前69頁,總共82頁。由於箱型圖可用來幫助判斷資料是否有無離群值存在,因此,須將簡易箱形圖的繪製步驟加以修改。1. 須規定判斷離群值的內限與外限的範圍資料分佈之內限上界=Q3+1.5

IQR,其中IQR=Q3-Q1資料分佈之內限下界=Q1-1.5

IQR資料分佈之外限上界=Q3+3

IQR資料分佈之外限下界=Q1-3

IQR如下圖:當前70頁,總共82頁。圖3-16離群值的判斷當前71頁,總共82頁。Example4.12-GMATscoresCreateaboxplotforthedataregardingtheGMATscoresof200applicants(seefileXm04-12)當前72頁,總共82頁。440670S410Q1530Q2560Q3590L700IQR=Q3-Q1=590-530=60Fences={Q1-1.5(IQR),Q3+1.5(IQR}={440,670}Theoutliersare700,and410.Therefore,thewhiskerswillextendtothetwoextremevaluesthatarenotoutliers(440and670).Observe.當前73頁,總共82頁。44

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論