




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 第二章第二章單變量統計描述分析單變量統計描述分析第一節第一節 分布分布 統計表統計表 統計圖統計圖 第二節第二節 集中趨勢測量法集中趨勢測量法第三節第三節 離散趨勢測量法離散趨勢測量法4分布:分布:變量的各個取值出現的次數(頻數)或變量的各個取值出現的次數(頻數)或頻次(頻率),稱為頻數或頻次分布頻次(頻率),稱為頻數或頻次分布 常用統計表和統計圖來表示分布。常用統計表和統計圖來表示分布。5分布:分布:變量的各個取值出現的次數(頻數)或變量的各個取值出現的次數(頻數)或頻次(頻率),稱為頻數或頻次分布頻次(頻率),稱為頻數或頻次分布 常用統計表和統計圖來表示分布。常用統計表和統計圖來表示分布
2、。6一、數據的計量尺度一、數據的計量尺度 統計數據統計數據是對客觀現象計量的結果。是對客觀現象計量的結果。n 按照對事物計量的按照對事物計量的精確精確程度,可將所采用的程度,可將所采用的計量計量尺度尺度由低級到高級分為由低級到高級分為四個層次四個層次: 定類尺度定類尺度(Nominal Level) 定序尺度定序尺度(Ordinal Level) 定距尺度定距尺度(Interval Level) 定比尺度定比尺度(Ratio Level)7(一)定類尺度(一)定類尺度(列名尺度):按照事物的某種(列名尺度):按照事物的某種屬屬性性對其進行平行的分類或分組。對其進行平行的分類或分組。 例例1:人
3、口的性別(男、女);企業的所有制性人口的性別(男、女);企業的所有制性質(國有、股份、民營等)質(國有、股份、民營等) 特點:特點: 1.1.定類尺度只定類尺度只測度測度了事物之間的了事物之間的類別差類別差,而對各,而對各類之間的其他差別卻無法從中得知,類之間的其他差別卻無法從中得知,因此各類因此各類地位相同,順序可以任意改變;地位相同,順序可以任意改變; 2.2.對定類尺度的計量結果,可以且只能計算每一對定類尺度的計量結果,可以且只能計算每一類別中各元素個體出現的頻數類別中各元素個體出現的頻數(frequency)。 注意:注意: 對事物進行分類時,必須符合對事物進行分類時,必須符合窮盡窮盡
4、和和互斥互斥要求。要求。8n(二)定序尺度二)定序尺度(順序尺度):是對事物之間(順序尺度):是對事物之間等級等級或或順序順序差別的一種測度。差別的一種測度。 例例2:產品等級(一等品、二等品產品等級(一等品、二等品) 考試成績(優、良、中、可、差)考試成績(優、良、中、可、差) 特點:特點: 1.1.不僅可以測度類別差(分類),還可以測度不僅可以測度類別差(分類),還可以測度次序差(比較優劣或排序);次序差(比較優劣或排序); 2.2.無法測出類別之間的準確差值,因此該尺度的無法測出類別之間的準確差值,因此該尺度的計量結果只能排序,不能進行算術運算。計量結果只能排序,不能進行算術運算。9(三
5、)定距尺度三)定距尺度(間隔尺度):是對事物類別或次(間隔尺度):是對事物類別或次序之間序之間間距間距的測度。的測度。 例例3:100分制考試成績;分制考試成績; 攝氏溫度對不同地區溫度的測量攝氏溫度對不同地區溫度的測量 特點:特點: 1.1.不僅能將事物區分為不同類型并進行排序,而不僅能將事物區分為不同類型并進行排序,而且可準確指出類別之間的差距是多少;且可準確指出類別之間的差距是多少; 2.2.定距尺度通常以自然或物理單位為計量尺度,定距尺度通常以自然或物理單位為計量尺度,因此測量結果往往表現為數值;因此測量結果往往表現為數值; 3.3.計量結果可以進行加減運算計量結果可以進行加減運算(
6、(加減運算有意義加減運算有意義) ); 4.4.“0 0”是測量尺度上的一個測量點,并不代表是測量尺度上的一個測量點,并不代表“沒沒有有”10 (四)四)定比尺度定比尺度(比率尺度):是能夠測算兩(比率尺度):是能夠測算兩個測度值之間個測度值之間比值比值的一種計量尺度。的一種計量尺度。 例例4:電視收看時長;職工月收入;距離、重電視收看時長;職工月收入;距離、重量量 特點:特點: 1.1.與定距尺度屬于同一層次,計量結果也表現為數與定距尺度屬于同一層次,計量結果也表現為數值;值; 2.2.除了具有其他三種計量尺度的全部特點外,還具除了具有其他三種計量尺度的全部特點外,還具有可計算兩個測度值之間
7、比值的特點;有可計算兩個測度值之間比值的特點; 3.3.“0 0”表示表示“沒有沒有”,即它有一固定的絕對,即它有一固定的絕對“零零點點”,因此它可進行加、減、乘、除運算(而定距尺,因此它可進行加、減、乘、除運算(而定距尺度只可進行加減運算)度只可進行加減運算) (四)定比尺度(四)定比尺度11 1.高層次的計量尺度高層次的計量尺度可以計量可以計量低層次計量尺度低層次計量尺度能夠計量的事物,但反之不行;能夠計量的事物,但反之不行; 2.可將高層次計量尺度的可將高層次計量尺度的計量結果轉換計量結果轉換為低層為低層次計量尺度的計量結果,但不能反過來。次計量尺度的計量結果,但不能反過來。 指出下面變
8、量的測量尺度:指出下面變量的測量尺度:n學生住址距學校的距離;學生住址距學校的距離;n學生某門課的一次測驗成績學生某門課的一次測驗成績(5(5分制);分制);n學生的出生地;學生的出生地;n按年級分類的高校學生按年級分類的高校學生n每周學生學習的小時數每周學生學習的小時數12二、統計表二、統計表(頻數分布表、(頻數分布表、百分比分布表百分比分布表)制作統計表的要求制作統計表的要求1.要有表號、表頭、標識行、主體行、表尾要有表號、表頭、標識行、主體行、表尾2.表的兩端不封口表的兩端不封口3.簡單明了,中間不畫線簡單明了,中間不畫線4.百分比分布表要有樣本單位總數百分比分布表要有樣本單位總數 一般
9、用得比較多的是百分比分布表,一般用得比較多的是百分比分布表, 因為百分比分布表可以還原成頻數分布表因為百分比分布表可以還原成頻數分布表13n統計表統計表家庭結構家庭結構頻次頻次百分比百分比核心家庭核心家庭直系家庭直系家庭聯合家庭聯合家庭其它其它1050 720 110 250 49.3 33.8 5.2 11.7總數總數2130100.0家庭結構的頻次分布家庭結構的頻次分布 (地,地,2010.6)表頭表頭標識行標識行主體行主體行源自源自表尾表尾(表(表2-1)14不同類型變量的取值特點及統計表特點n不同類型變量的取值特點不同類型變量的取值特點定類變量定類變量變量值是啞元,不是連續實數。變量值
10、是啞元,不是連續實數。定序變量定序變量變量值可以比較大小,不連續。變量值可以比較大小,不連續。定距變量定距變量離散型:觀測值不多離散型:觀測值不多連續型:觀測值眾多連續型:觀測值眾多15統計表統計表(頻數分布表、(頻數分布表、百分比分布表百分比分布表)怎么樣制作統計表?怎么樣制作統計表?n定類變量定類變量n定序變量定序變量1.定距定距/定比變量定比變量16各類變量所對應統計表的特點各類變量所對應統計表的特點定類變量定類變量 百分比統計表中最后要注明統計總百分比統計表中最后要注明統計總數。數。 變量的取值次序可根據需要調整。變量的取值次序可根據需要調整。定序變量定序變量 定序變量的取值有大小次序
11、之分,定序變量的取值有大小次序之分,應保留其變化趨勢,不要打亂。應保留其變化趨勢,不要打亂。17定距變量定距變量 離散型定距變量的制表方法與定序離散型定距變量的制表方法與定序變量的制表方法相同。變量的制表方法相同。 將連續型定距變量的變量值分為若將連續型定距變量的變量值分為若干區間或組,然后統計每個組內的干區間或組,然后統計每個組內的頻次或百分數頻次或百分數組距式分組。組距式分組。定距變量分組的注意問題定距變量分組的注意問題1. 等距分組與非等距分組:一般采用等距分組與非等距分組:一般采用等距分組,有時非等距分組更能反映等距分組,有時非等距分組更能反映現象的本質。現象的本質。182. 組數:組
12、數:調查總數調查總數N分組數分組數K50 100100 250250以上以上6 107 1210 203. 決定分點的精度:分組點的小數點精決定分點的精度:分組點的小數點精確位數比原統計資料高一位。確位數比原統計資料高一位。19標明組界標明組界:根據分組要求得到的分組:根據分組要求得到的分組點,其精度與原始數據相同,前后分點,其精度與原始數據相同,前后分組點不連續。組點不連續。真實組界真實組界:將標明組界的精度提高一:將標明組界的精度提高一位,使前后分組點連續。位,使前后分組點連續。例:設一統計資料中變量年齡的取值例:設一統計資料中變量年齡的取值范圍為范圍為18歲,按歲,按2歲一組,寫出標明歲
13、一組,寫出標明組界和真實組界。組界和真實組界。20標明組界標明組界真實組界真實組界1 23 45 67 80.5 2.52.5 4.54.5 6.56.5 8.5問題:真實組距是否違反變量值必須互斥問題:真實組距是否違反變量值必須互斥的原則?的原則?注意:只有定距變量的統計表存在分組問注意:只有定距變量的統計表存在分組問題!題!規定:組限重迭的組距式分組規定:組限重迭的組距式分組各組不各組不包括它的上限包括它的上限21例:例: 100個同齡兒童的身高統計個同齡兒童的身高統計(單位:米單位:米)1.431.431.331.391.371.441.381.421.411.401.391.361.4
14、21.441.421.301.411.331.431.371.401.441.271.371.331.361.401.461.391.361.381.381.441.561.421.461.381.311.491.491.431.351.411.391.401.361.431.421.321.381.391.411.481.441.411.341.381.511.361.401.411.361.331.371.451.391.441.421.341.431.381.451.401.441.321.441.401.461.461.371.481.361.471.421.471.381.431.4
15、21.391.411.391.451.411.371.491.471.371.501.431.40表表2-522步驟步驟1:收集數據,寫成數據表。:收集數據,寫成數據表。步驟步驟2:找出數據中最大值:找出數據中最大值L,最小值最小值S。步驟步驟3:根據表:根據表2-4取合適的分組數。取合適的分組數。此處此處K=10。步驟步驟4:計算組距:計算組距h = (LS) K。結結果比原始數據多精確小數點后一位。果比原始數據多精確小數點后一位。23步驟步驟5:根據組距:根據組距h和分點精度比原統和分點精度比原統計數據高一位的原則,將數據分組。計數據高一位的原則,將數據分組。步驟步驟6:計算各組的中心值:
16、計算各組的中心值bi。 bi = (第第i組真實下界值第組真實下界值第i組真實上界值組真實上界值) 2步驟步驟7:作頻次分布表。:作頻次分布表。統計表的特點統計表的特點不需要文字敘述就能反映出資料的不需要文字敘述就能反映出資料的特性及資料間的關系。有較高的精特性及資料間的關系。有較高的精確性,但不直觀。確性,但不直觀。24組號組號真實組界限真實組界限中心值中心值頻次頻次ni相對頻次相對頻次=nini123456789101.2651.2951.2951.3251.3251.3551.3551.3851.3851.4151.4151.4451.4451.4751.4751.5051.5051.5
17、351.5351.5651.281.311.341.371.401.431.461.491.521.55147222424106110.010.040.070.220.240.240.100.060.010.01總和總和ni=1001表表2-625統計表的特點統計表的特點不需要文字敘述就能反映出資料的不需要文字敘述就能反映出資料的特性及資料間的關系。有較高的精特性及資料間的關系。有較高的精確性,但不直觀。確性,但不直觀。26三、統計圖三、統計圖272829例:考察馬薩諸塞州例:考察馬薩諸塞州New Bedford地方地方法庭判決的法庭判決的72犯人在服完刑一年到兩年犯人在服完刑一年到兩年半的時
18、間里是否又因新的罪行被判決。半的時間里是否又因新的罪行被判決。結果結果24個犯了新罪,而剩下的個犯了新罪,而剩下的48個在數個在數據收集時還沒有。據收集時還沒有。新罪新罪無新罪無新罪新罪新罪無新罪無新罪33%67%33%67%圖圖2-1圖圖2-230w 統計圖統計圖(分布圖分布圖)定類變量:圓瓣圖定類變量:圓瓣圖(圓餅圖圓餅圖);條形;條形圖圖圓瓣圖:用圓形代表現象的總體,圓瓣圖:用圓形代表現象的總體,用圓瓣代表現象中一種情況,其大用圓瓣代表現象中一種情況,其大小代表變量取值在總體中所占的百小代表變量取值在總體中所占的百分數。分數。條形圖:用長條的高度來表示資料條形圖:用長條的高度來表示資料類
19、別的次數或百分數。一般畫成等類別的次數或百分數。一般畫成等寬長條。若變量是定類變量,則長寬長條。若變量是定類變量,則長條排列次序可以任意,條形離散。條排列次序可以任意,條形離散。31條形圖優點:易于顯示每一變量的觀測值。條形圖優點:易于顯示每一變量的觀測值。條形圖缺點:不易顯示總的觀測數。條形圖缺點:不易顯示總的觀測數。圖圖2-4不易于顯示第一類外的其它類觀測數,不易于顯示第一類外的其它類觀測數,且變量值越多,等高不等寬的條形圖越復且變量值越多,等高不等寬的條形圖越復雜。雜。注意:上述條形圖的值都是從注意:上述條形圖的值都是從0開始,然而開始,然而有時也不是這樣。有時也不是這樣。32思考:怎樣
20、為兩個分類變量作圖?思考:怎樣為兩個分類變量作圖?例:馬薩諸塞州例:馬薩諸塞州New Bedford地方法地方法庭的法官庭的法官Robert Kane在馬薩諸塞州在馬薩諸塞州大學大學Robert P. Waxler教授鼓勵下,讓教授鼓勵下,讓在他的法庭上被判罪的犯人選擇進監在他的法庭上被判罪的犯人選擇進監獄或上由獄或上由Robert教授教的文學課。印教授教的文學課。印地安那大學的地安那大學的Roger教授跟蹤調查了教授跟蹤調查了選擇聽課的選擇聽課的32人,發現以后又有人,發現以后又有6人人犯了新罪;而選擇去監獄的犯了新罪;而選擇去監獄的40人中,人中,18人在被釋放后又犯了新罪。人在被釋放后又
21、犯了新罪。(來源:來源:The New York Times, Oct. 6, 1993)330 05 510101515202025253030文學課文學課監獄監獄新罪新罪無新罪無新罪罪犯數罪犯數(人人)罪犯數罪犯數(人人)5040302010 文學課文學課 監獄監獄34 (2) 定序變量:條形圖定序變量:條形圖(長條按序排列,長條按序排列,條形可以離散,也可以緊挨條形可以離散,也可以緊挨)。 (3) 定距變量:直方圖;折線圖。定距變量:直方圖;折線圖。 直方圖:由緊挨著的長條組成,直方圖:由緊挨著的長條組成,但長條的寬度有意義。以長條的寬度但長條的寬度有意義。以長條的寬度表示組距,條形的長
22、度表示頻次密度表示組距,條形的長度表示頻次密度或相對頻次密度或相對頻次密度(頻率密度頻率密度) ,長條的,長條的面積來表示頻次或相對頻次。面積來表示頻次或相對頻次。35頻次密度頻次密度=頻次頻次 組距組距(條寬條寬)相對頻次密度相對頻次密度=相對頻次相對頻次(頻率頻率)組距組距(條寬條寬)注意:直方圖僅適用于定距變量。當注意:直方圖僅適用于定距變量。當變量取值是等距分組時,直方圖和條變量取值是等距分組時,直方圖和條形圖在本質上是相同的;但在非等距形圖在本質上是相同的;但在非等距分組的情況下,直方圖和條形圖完全分組的情況下,直方圖和條形圖完全不同,尤其應該注意。不同,尤其應該注意。36(1) 定類變量:餅形圖;條形圖。定類變量:餅形圖;條形
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 護理的研究生
- 衛生城市創建檔案體系
- 2025至2030中國智能坐浴盆行業發展趨勢分析與未來投資戰略咨詢研究報告
- 2025至2030中國無線氣體檢測技術行業發展趨勢分析與未來投資戰略咨詢研究報告
- 2025至2030中國數控橋式鋸行業發展趨勢分析與未來投資戰略咨詢研究報告
- 2025至2030中國抽屜式洗碗機行業發展趨勢分析與未來投資戰略咨詢研究報告
- 2025至2030中國手動工具行業市場發展分析及競爭格局與投資價值評估報告
- 2025至2030中國建筑信息模型(BIM)提取軟件行業發展趨勢分析與未來投資戰略咨詢研究報告
- 2025至2030中國廢玻璃行業市場發展現狀及投資前景與戰略報告
- 商務會議服務及場地租賃合同書
- Python數據科學與機器學習結合試題及答案
- 海鮮水產電商商業計劃書
- 托育轉讓合同協議書
- 2025江西中考:政治必背知識點
- 裝飾音在樂理考試中的應用試題及答案
- 購犬協議書范本
- 通信汛期安全生產課件
- 物業工程服務意識培訓
- 提高分級護理的巡視率
- 中國心力衰竭診斷和治療指南(2024)解讀
- 失重致血管細胞衰老和心臟代謝異常及干預策略的研究
評論
0/150
提交評論