




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一頁,共八十四頁,2022年,8月28日描述性統計學:數值方法A
DescriptiveStatistics:NumericalMethods
PartAMeasuresofLocation
集中趨勢度量MeasuresofVariability
分散性度量x%第二頁,共八十四頁,2022年,8月28日位置的度量
MeasuresofLocationMean平均數Median中位數Mode眾數Percentiles百分數Quartiles四分位數第三頁,共八十四頁,2022年,8月28日問題:莎士比亞的作品是否真的是莎士比亞寫的?美國一般家庭有多少個孩子?男性的薪水是否一定比女性高?新娘和新郎在結婚時的年齡是多少?第四頁,共八十四頁,2022年,8月28日各種平均數平均數是一個數值,是對一個變量的觀察值進行計算后得到的.我們常讀到MBA的平均工資,平均房價,道瓊斯平均股票價格,平均謀殺率等.你都理解這些平均數嗎?讓我們來看一下下面的句子:當代美國的平均人是女人,平均每個女人有2.1個孩子,且這些女人住在平均價值為$80000的住房中第五頁,共八十四頁,2022年,8月28日一、算術平均數㈠算術平均數的概念與用途㈡算術平均數的計算㈢算術平均數的數學性質第六頁,共八十四頁,2022年,8月28日Thisisthemostpopularandusefulmeasureofcentrallocation基本計算方法是各項數據之和與數據的個數之比。是集中趨勢最主要的測度值。SumofthemeasurementsNumberofmeasurementsMean=SamplemeanPopulationmeanSamplesizePopulationsize
Arithmeticmean算術平均數第七頁,共八十四頁,2022年,8月28日算術平均數:全部變量值之和與變量值個數相除所得的商。通常也稱為平均數(average)或均值(mean)。算術平均數的概念與用途第八頁,共八十四頁,2022年,8月28日STAT算術平均數83名女生的身高變量一般水平、代表性數值分布的集中趨勢、中心數值算術平均數第九頁,共八十四頁,2022年,8月28日一、算術平均數㈠算術平均數的概念與用途㈡算術平均數的計算㈢算術平均數的數學性質第十頁,共八十四頁,2022年,8月28日算術平均數的計算算術平均數=總體標志總量總體單位總數數據集數據個數N簡單算術平均數第十一頁,共八十四頁,2022年,8月28日第十二頁,共八十四頁,2022年,8月28日“權”和"weight"的字義商務印書館《古代漢語詞典》1998.12版權:1.樹名。2.秤錘,秤。3.稱量。4.權力。5.權宜。6.副詞,姑且。7.權攝,暫代官職。8.周列國名。9.通“顴”,面頰。牛津大學出版社《牛津現代高級英漢雙解詞典》1985Weight/n1.gravitationalforce引力,重力,地心吸力2.Howheavyathingis.重量3.Loadtobesupport負擔4.importanceorinfluence重要,影響力5.pieceofmetalofknownweightusedinscalesforweighingthings秤錘6.systemforunits,scaleornotation,forexpressing計重法
vt1.放砝碼於…上2.使負重擔3.用礦物質處理(織物)使之顯得更結實第十三頁,共八十四頁,2022年,8月28日桿秤合稱“權衡”,秤砣為權,秤桿為衡“權”的概念旨在刻畫對有關假設的整個局面的知識的增長陳克艱《上帝怎樣擲骰子》四川人民出版社,1987,54頁第十四頁,共八十四頁,2022年,8月28日秦權銅詔鐵權秦第十五頁,共八十四頁,2022年,8月28日秦量吳昌碩臨秦權文字第十六頁,共八十四頁,2022年,8月28日
身高組中值人數比重(cm)(cm)(人)(%)
150-155152.533.61155-160157.51113.25160-165162.53440.96165-170167.52428.92170以上172.51113.25
總計83100某年級83名女生身高資料組距數列次數f頻率f/Σf變量值x加權算術平均數第十七頁,共八十四頁,2022年,8月28日例題:第十八頁,共八十四頁,2022年,8月28日二、交替標志的平均數在社會經濟統計中,有時把社會經濟現象的總體單位,分為具有某種標志的單位和不具有這種標志的單位兩組。統計中,用“是”、“否”或“有”、“無”來表示的標志,稱為交替標志,也稱是非標志。第十九頁,共八十四頁,2022年,8月28日交替標誌
Qualitativevariables-proportions
定性變量-比例Qualitativevariablesaresummarizedbyatableofproportionsorpercentages.Whiletherearetheconceptsoflocationandvariabilityforsuchvariables,therearenosinglenumbersummariesforthelocationandvariability.Generallythelocationissummarizedbygivingthepercentagesinthemostcommongroups.第二十頁,共八十四頁,2022年,8月28日交替標誌or是非標誌分組單位數變量值具有某一屬性不具有某一屬性10合計—為研究是非標誌總體的數量特征,令指總體中全部單位只具有“是”或“否”、“有”或“無”兩種表現形式的標志,又叫是非標誌交替標誌第二十一頁,共八十四頁,2022年,8月28日是非標誌總體的指標具有某種標志表現的單位數所占的成數不具有某種標志表現的單位數所占的成數指是非標誌總體中具有某種表現或不具有某種表現的單位數占全部總體單位總數的比重成數第二十二頁,共八十四頁,2022年,8月28日是非標誌總體的均值均值第二十三頁,共八十四頁,2022年,8月28日1.簡單幾何平均數計算時要進行對數變換,即:幾何平均數(又稱“對數平均數”)第二十四頁,共八十四頁,2022年,8月28日幾何平均數(geomean(geomatricmean))是N個變量值連乘積的N次方根。第二十五頁,共八十四頁,2022年,8月28日
就用途而言,幾何平均方法直接用于個體數量相乘等于總數量的現象的平均。某產品的總合格率=各連續作業工序合格率之積若干年間總的1+利率(復利)=各年度1+利率之積
第一道工序第二道工序全工序投入制品1000個900個1000個合格產品900個810個810個合格率%909081
81%=90%90%向銀行借款1000元,年利率(復利)為10%,則:第一年利息額100元,第二年利息額110元,兩年合計210元。兩年后還款本利和與借款額的比例為1.21。
1.21=1.11.1
第二十六頁,共八十四頁,2022年,8月28日例某機械廠有鑄造車間、機加工車間、裝配車間三個連續流水作業車間。本月份這三個車間產品合格率分別為95%、92%、90%,求平均車間產品合格率。解:這說明該廠車間產品平均合格率為92.31%第二十七頁,共八十四頁,2022年,8月28日2.加權幾何平均數第二十八頁,共八十四頁,2022年,8月28日投資銀行某筆投資的年利率是按復利計算的,25年的年利率分配是:有1年為3%,有4年為5%,有8年為8%,有10年為10%,有2年為15%,求平均年利率。本利率(%)X年數f本利率的對數lgXf·lgX103
12.0128
2.0128105
42.0212
8.0848108
82.033416.2672110102.041420.4140115
22.0607
4.1214合計25-50.9002例第二十九頁,共八十四頁,2022年,8月28日這就是說,25年的平均本利率為108.6%,年平均利率即為8.6%。第三十頁,共八十四頁,2022年,8月28日△幾何平均數的特點如果數列中有一個標志值等于零或負值,就無法計算;受極端值的影響較和小;它適用于反映特定現象的平均水平,即現象的總標志值是各單位標志值的連乘積。第三十一頁,共八十四頁,2022年,8月28日△幾何平均數的特點如果數列中有一個標志值等于零或負值,就無法計算;受極端值的影響較和小;它適用于反映特定現象的平均水平,即現象的總標志值是各單位標志值的連乘積。第三十二頁,共八十四頁,2022年,8月28日72法則計算翻一番需要的時間時,可以用72除以增長速度的數值,得到時期數比如,每年增長10%,則7.2年翻一番;每年增長3%,則24年翻一番1.1^7.2=1.991.03^24=2.03通常,年利率都是10以下,此法很準72法則同樣還可以用來算貶值,設年通貨膨脹率是8%,那么72/8=9,9年後你現在的一元錢就只能買五毛錢的東西了。第三十三頁,共八十四頁,2022年,8月28日以20天為週期對國際油價進行評估國際油價連續20天日均漲幅或跌幅超過4%,就應考慮對國內成品油價格進行調整1.04^20=2.190.96^20=0.44該準則意味著:在連續的20天之內,如果油價上漲超過1倍,或下跌了一半以上,就要考慮調整國內油價第三十四頁,共八十四頁,2022年,8月28日三、次序統計量(位置平均數)㈠眾數㈡中位數㈢四分位數和百分位數第三十五頁,共八十四頁,2022年,8月28日眾數(mode):出現次數最多即出現頻率最高的變量值。身高人數(CM)(人)
152115421552156415711582159216012161716281634身高人數(CM)(人)
1643165816651673168716911705171217231741總計
83152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174第三十六頁,共八十四頁,2022年,8月28日眾數的確定方法某年級83名女生身高資料
身高人數(CM)(人)
152115421552156415711582159216012161716281634
身高人數(CM)(人)
1643165816651673168716911705171217231741總計
83第三十七頁,共八十四頁,2022年,8月28日
身高人數比重(CM)(人)(%)
150-15533.61155-1601113.25160-1653440.96165-1702428.92170以上1113.25
總計83100某年級83名女生身高資料眾數的確定方法概約眾數:眾數所在組的組中值,在本例為162.5cm第三十八頁,共八十四頁,2022年,8月28日眾數的原理及應用83名女生身高原始數據83名女生身高組距數列第三十九頁,共八十四頁,2022年,8月28日
當數據分布存在明顯的集中趨勢,且有顯著的極端值時,適合使用眾數。在數據分布的集中趨勢不明顯或存在兩個以上分布中心時,不適合使用眾數(前者無眾數,后者為雙眾數或多眾數,也等于沒有眾數)。眾數的原理及應用第四十頁,共八十四頁,2022年,8月28日出生1981.01980.01979.01978.01977.01976.01975.0160140120100806040200413名學生出生時間分布直方圖眾數的原理及應用沒有突出地集中在某個年份第四十一頁,共八十四頁,2022年,8月28日192.5190.5188.5186.5184.5182.5180.5178.5176.5174.5172.5170.5168.5166.5164.5162.5160.5158.5156.5154.5152.5150.5148.56050403020100眾數的原理及應用413名學生的身高分布直方圖出現了兩個明顯的分布中心第四十二頁,共八十四頁,2022年,8月28日413名學生身高分布條形圖第四十三頁,共八十四頁,2022年,8月28日413名學生身高分布疊加線圖第四十四頁,共八十四頁,2022年,8月28日STAT
在研究身高時,男生與女生不能合成一個總體,而是應當作為兩個總體分別進行統計。
當數據分布呈現出雙眾數或多眾數時,可以斷定這些數據來源于不同的總體。第四十五頁,共八十四頁,2022年,8月28日第四十六頁,共八十四頁,2022年,8月28日眾數的應用可以用來平均名詞型變量:如性別變量只有兩個值,男和女.在美國婦女比男子多.所以可以說平均人口是女人.一項對大學生的研究包括了10個心理學專業的學生,20個英語專業的學生和5個數學專業的學生.我們就無法計算這些專業的平均數的中位數,但我們可以指出眾數是英語專業,因為它是出現頻數最多的那個塊專業.眾數用來描述分類變量,特別是許多個值的分類變量.例如在某一特別的街區,宗教的眾數是穆斯林,人種的眾數是亞裔,而社會階級的眾數是”中上等”第四十七頁,共八十四頁,2022年,8月28日三、次序統計量(位置平均數)㈠眾數㈡中位數㈢四分位數和百分位數第四十八頁,共八十四頁,2022年,8月28日152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174
中位數(median):位于變量值序列中點的數值中位數第四十九頁,共八十四頁,2022年,8月28日中位數的確定方法對于未分組數據:中位數位置為某年級83名女生身高資料
身高人數累計(CM)(人)人數
1521
11542315525156491571101582121592141601226161733162841163445
身高人數累計(CM)(人)人數
164348165856166561167364168771169172170577171279172382174183
總計
83第五十頁,共八十四頁,2022年,8月28日中位數的確定方法
身高人數累計(CM)(人)人數
150-15533155-1601114160-1653448165-1702472170以上1183
總計83某年級83名女生身高資料第五十一頁,共八十四頁,2022年,8月28日中位數的作用及用法中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。566668920中位數為6第五十二頁,共八十四頁,2022年,8月28日中位數的作用及用法中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。566668920中位數為(6+6)/2=6第五十三頁,共八十四頁,2022年,8月28日中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。中位數的作用及用法第五十四頁,共八十四頁,2022年,8月28日中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。中位數的作用及用法第五十五頁,共八十四頁,2022年,8月28日中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。中位數的作用及用法第五十六頁,共八十四頁,2022年,8月28日中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。中位數的作用及用法第五十七頁,共八十四頁,2022年,8月28日中位數一定存在;中位數與算術平均數相近;中位數不受極端值影響;變量值與中位數離差絕對值之和最小。中位數的作用及用法
變量值3
4
5
5
6
9
10中位數5平均值6與中位數離差-2-100145與平均數離差-3-2-1-1034絕對數值之和
13
14第五十八頁,共八十四頁,2022年,8月28日中位數與累計次數分布在累計次數分布曲線上,縱軸上50%所對應的點,其橫軸坐標就是中位數。第五十九頁,共八十四頁,2022年,8月28日結婚年齡中位數HK第六十頁,共八十四頁,2022年,8月28日第六十一頁,共八十四頁,2022年,8月28日第六十二頁,共八十四頁,2022年,8月28日三、次序統計量(位置平均數)㈠眾數㈡中位數㈢四分位數和百分位數(四)箱線圖第六十三頁,共八十四頁,2022年,8月28日百分位數:提供了數據值如何在最小值至最大值之間分布的信息.對不含多個重復數值的數據來說,第P個百分數把數據分成兩部分:大約P%的觀察值小于第P個百分數;大約(100-P)%的觀察值大于第P個百分數
四分位數(quartile
將數據等分為4部分)和百分位數(percentile將數據等分為100部分)。中位數也是一個分位數(二分位數,將數據等分為兩部分)。第六十四頁,共八十四頁,2022年,8月28日第六十五頁,共八十四頁,2022年,8月28日第六十六頁,共八十四頁,2022年,8月28日MeasuresofRelativeStandingandBoxPlots
相對位置的測定和箱線圖PercentileThepthpercentileofasetofmeasurementsisthevalueforwhichatmostp%ofthemeasurementsarelessthanthatvalueatmost100(1-p)%ofallthemeasurementsaregreaterthanthatvalue.ExampleSuppose600isthe78%percentileofaGMATscore.Then60020080078%ofallthescoresliehere22%第六十七頁,共八十四頁,2022年,8月28日152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174第一個四分位數Q1
第二個四分位數Q2
第三個四分位數Q3
分位數的確定及用途第六十八頁,共八十四頁,2022年,8月28日分位數的確定及用途25%25%25%25%75%即四分之三的數據小于等于Q3第六十九頁,共八十四頁,2022年,8月28日三、次序統計量(位置平均數)㈠眾數㈡中位數㈢四分位數和百分位數(四)箱線圖第七十頁,共八十四頁,2022年,8月28日BoxPlots箱線圖Thisisapictorialdisplay畫圖thatprovidesthemaindescriptivemeasuresofthemeasurementset:L-thelargestmeasurementQ3-TheupperquartileQ2-ThemedianQ1-ThelowerquartileS-ThesmallestmeasurementSQ1Q2Q3LAnadjustmenttothisgeneraldescriptionofaboxplotmaybeneededinthepresenceofoutliers.Seethenextexample.第七十一頁,共八十四頁,2022年,8月28日由於箱型圖可用來幫助判斷資料是否有無離群值存在,因此,須將簡易箱形圖的繪製步驟加以修改。1. 須規定判斷離群值的內限與外限的範圍資料分佈之內限上界=Q3+1.5
IQR,其中IQR=Q3-Q1資料分佈之內限下界=Q1-1.5
IQR資料分佈之外限上界=Q3+3
IQR資料分佈之外限下界=Q1-3
IQR如下圖:第七十二頁,共八十四頁,2022年,8月28日圖3-16離群值的判斷第七十三頁,共八十四頁,2022年,8月28日Example4.12-GMATscoresCreateaboxplotforthedataregardingtheGMATscoresof200applicants(seefileXm04-12)第七十四頁,共八十四頁,2022年,8月28日440670S410Q1530Q2560Q3590L700IQR=Q3-Q1=590-530=60Fences={Q1-1.5(IQR),Q3+1.5(IQR}={440,670}Theoutliersare700,and410.Therefore,thewhiskerswillextendtothetwoextremevaluesthatarenotoutliers(440and670).Observe.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 深入理解教育領域中的大數據庫解析
- 從心理角度理解學生學習行為的驅動力
- 教育心理學與在線課程學習成效的關系
- 小學班班通培訓課件
- 智慧城市背景下綠色智能辦公樓的發展
- 教育政策在高校文化傳承中的作用
- 從新政策看未來學校教育模式的創新
- 大數據在學生個性化教學計劃制定中的作用
- 抖音商戶數據分析師直播數據看板制度
- 抖音商戶直播時段選擇依據制度
- 2025年四川省高考生物試卷真題(含答案解析)
- 2024年遼寧省高校畢業生“三支一扶”計劃考試真題
- 北京市大興區2025年初中學業水平考試地理真題(含答案)
- 第三代社保卡培訓
- 辦公室應聘題庫及答案
- 2025年河北中考地理真題含答案
- 鐵礦尾礦清運方案(3篇)
- 國開機考答案 管理學基礎2025-06-27
- 2025年浙江省中考數學試卷真題(含官方標準答案)
- 國家開放大學《思想道德與法治》社會實踐報告范文一
- 【9語安徽中考卷】2025年安徽省中考招生考試真題語文試卷(真題+答案)
評論
0/150
提交評論