




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、LOGO第二章第二章 數據的組織與展示數據的組織與展示LOGO本章主要內容本章主要內容一、什么是變量?一、什么是變量?二、數據的測量層次二、數據的測量層次三、不同類型數據的展示方法三、不同類型數據的展示方法LOGOu概念(概念(Concept):人們對事物本質的認識,是研究的基):人們對事物本質的認識,是研究的基本單位,具有抽象性。本單位,具有抽象性。u定義(定義(Definition):將概念呈現、描述出來,從而明確):將概念呈現、描述出來,從而明確認識對象。認識對象。u操作化定義(操作化定義(Operational definition):用一系列可以觀):用一系列可以觀察、可以測量的指標
2、來模擬或表述定義,使得非量化的概念得察、可以測量的指標來模擬或表述定義,使得非量化的概念得以運算并得以操作測量。以運算并得以操作測量。u幾個容易混淆的概念幾個容易混淆的概念LOGO概念概念抽象定義抽象定義操作化定義操作化定義都市化都市化現代都市的生活現代都市的生活形態形態婦女就業人數、子女數、婦女就業人數、子女數、交通;通訊手段等交通;通訊手段等個人現代化個人現代化一個人由于經濟、一個人由于經濟、工業等現代因素工業等現代因素所產生的內部變所產生的內部變化化對時間、效率、家庭、親對時間、效率、家庭、親屬、消費、自信等具體問屬、消費、自信等具體問題的看法題的看法子代中心子代中心經濟上、感情上經濟上
3、、感情上和生活上對子代和生活上對子代過分的偏重過分的偏重子代撫育費與家庭平均消子代撫育費與家庭平均消費的比較、子代過生日的費的比較、子代過生日的花費與長輩生日花費的比花費與長輩生日花費的比較、花在子代閑暇時間的較、花在子代閑暇時間的多少等多少等LOGOn 變量(變量(Variables)在統計學中表示研究對象的特征,在統計學中表示研究對象的特征,變量下的各種表現形式或不同取值,就是變量值。變量下的各種表現形式或不同取值,就是變量值。變量變量變量變量變量值變量值性別性別家庭子女數家庭子女數重要性重要性文化程度文化程度男;女男;女1個;個;2個;個;3個;個;非常重要;一般;不重要非常重要;一般;
4、不重要大學;中學;小學;文盲大學;中學;小學;文盲變量取值時注意的問題:變量取值時注意的問題: 窮盡性窮盡性 互斥性互斥性LOGO變量的類型變量的類型 連續型變量連續型變量離散型變量離散型變量年齡年齡 收入收入民族民族 職業職業LOGO7二、變量的測量層次史蒂文斯在史蒂文斯在1951年創立了被廣泛采用的測量層次分年創立了被廣泛采用的測量層次分類法,對社會現象各種不同性質和特征的測量分類法,對社會現象各種不同性質和特征的測量分為四種,定類測量、定序測量、定距測量和定比為四種,定類測量、定序測量、定距測量和定比測量,不同測量層次對應的測量對象則分別稱為測量,不同測量層次對應的測量對象則分別稱為定類
5、變量、定序變量、定距變量和定比變量。定類變量、定序變量、定距變量和定比變量。LOGO8 定類測量其在本質上是一種分類體系,即將調查對象的不其在本質上是一種分類體系,即將調查對象的不同屬性或特征加以區分,變項的值只能把研究同屬性或特征加以區分,變項的值只能把研究對象分類,對象分類,即只能決定研究對象是同類抑或不即只能決定研究對象是同類抑或不同類,具有等于或不等于的數學特質。同類,具有等于或不等于的數學特質。如對人們的性別、民族、婚姻狀況、職業等的測如對人們的性別、民族、婚姻狀況、職業等的測量就是定類測量的例子。量就是定類測量的例子。LOGO9n 定類變量實質是一種分類體系,分類既要具有窮定類變量
6、實質是一種分類體系,分類既要具有窮盡性,又要具有互斥性。所分的類別是相互排斥,盡性,又要具有互斥性。所分的類別是相互排斥,又要對可能的各種情況包羅無遺,每個調查者屬又要對可能的各種情況包羅無遺,每個調查者屬于其中的一種情況。于其中的一種情況。LOGO10 定類變量的兩種屬性定類變量的兩種屬性n 對稱性對稱性。是指甲對乙的關系也就是乙對甲的關系,。是指甲對乙的關系也就是乙對甲的關系,如果甲和乙同類,乙一定與甲同類。如果甲和乙同類,乙一定與甲同類。n 傳遞性傳遞性。指的是如果甲與乙同類,而乙與丙同類,。指的是如果甲與乙同類,而乙與丙同類,那么甲一定與丙同類。那么甲一定與丙同類。LOGO11 定序測
7、量其取值按照某種其取值按照某種邏輯順序邏輯順序將調查對象排列出高將調查對象排列出高低或大小,確定其等級及次序。其取值不僅低或大小,確定其等級及次序。其取值不僅具有等于不等于的特征,還具有大于或小于具有等于不等于的特征,還具有大于或小于的特征。的特征。如文化程度、收入水平(高、中、低)、城市如文化程度、收入水平(高、中、低)、城市規模(特大城市、大城市、中等城市、小城規模(特大城市、大城市、中等城市、小城市等等市等等)LOGO12n除了具有定類測量區分事物類別的特征外,除了具有定類測量區分事物類別的特征外,還能反映事物或現象的高低、大小、強弱還能反映事物或現象的高低、大小、強弱等等等級序列等級序
8、列上的差異。其數學特征是大于上的差異。其數學特征是大于或小于,因此具備或小于,因此具備不對稱性不對稱性。傳遞性關系。傳遞性關系依然存在。依然存在。LOGO13 定距測量定距測量也稱為間距測量或區間測量。它不僅能夠將社會現也稱為間距測量或區間測量。它不僅能夠將社會現象或事物區分出不同的類別、不同的等級,而且象或事物區分出不同的類別、不同的等級,而且可以確定它們相互之間的可以確定它們相互之間的距離和數量等級差異距離和數量等級差異。如測量人的智商:如測量人的智商:張三張三120-李四李四110=10測量溫度:測量溫度:廈門廈門28-南京南京24=4南京南京24-濟南濟南24=0LOGO14n注意:定
9、距測量所得的值可以為注意:定距測量所得的值可以為0,但,但這個這個0不具備數學中不具備數學中0的含義。的含義。如如0度,我們不能說沒有溫度,表示的度,我們不能說沒有溫度,表示的是一個特定的數字。是一個特定的數字。LOGO15 定比測量定比測量n 定比測量除了具有上述定比測量除了具有上述3種層次測量的全部性質種層次測量的全部性質外,還有一個絕對的外,還有一個絕對的0值。因此,它測量得到的值。因此,它測量得到的數據既能進行加減運算,又能進行乘除運算。數據既能進行加減運算,又能進行乘除運算。n 如張三的月收入是如張三的月收入是3000元,李四的月收入是元,李四的月收入是2000元。元。(1)在分析的
10、時候,即可以說張三的收入高于李四的收)在分析的時候,即可以說張三的收入高于李四的收入(入(定序定序),(),(2)也可以得到張三的月收入比李四高)也可以得到張三的月收入比李四高1000元(元(定距定距),(),(3)還可以說張三的月收入是李四)還可以說張三的月收入是李四月收入的月收入的1.5倍。倍。(定比定比)LOGO16四種測量層次的數學特性定類測量定類測量定序測量定序測量定距測量定距測量定比測量定比測量類別區分(類別區分(=、)次序區分(、次序區分(、)距離區分(距離區分(+、-)比例區分(比例區分(、)LOGO17請判斷下列變量屬于哪種類型的變量n 他們的年齡分別是:他們的年齡分別是:1
11、7,18,22,24,27,29,32.n 他們是:中年,青年,老年,兒童,青少年,他們是:中年,青年,老年,兒童,青少年,.n 他們的月收入分別是:他們的月收入分別是:3000,5000,6000,2000,8000,1000,.n 他們的收入分別是:他們的收入分別是:1000-2000,2000-3000,3000-4000,n 他們的態度分別是:同意,不同意,說不清,同他們的態度分別是:同意,不同意,說不清,同意,不同意,不同意,同意,意,不同意,不同意,同意,LOGO1.在社會學研究中,一般不區分定距和定比變量,在社會學研究中,一般不區分定距和定比變量,而是當作一類,稱作定距變量。而是
12、當作一類,稱作定距變量。2.一個變量的層次并不是唯一的,高層次的變量必一個變量的層次并不是唯一的,高層次的變量必然會包含低層次的所有特征。測量層次愈高愈好,然會包含低層次的所有特征。測量層次愈高愈好,統計分析時愈方便統計分析時愈方便。 3.3.變量之間是可以相互轉換的,這對于后期的數據變量之間是可以相互轉換的,這對于后期的數據處理很重要:定距層次的轉換為定序;定序層次的處理很重要:定距層次的轉換為定序;定序層次的轉換為定距層次。轉換為定距層次。 100名男性青年的身高表名男性青年的身高表 單位:厘米單位:厘米三、數據的組織與展示三、數據的組織與展示 166 181 173 171 168 16
13、4 178 167 156 194 169 175 183 168 165 180 170 172 167 175 173 169 174 172 171 169 173 184 173 169 170 181 185 168 174 187 167 174 169 165 167 172 174 173 155 179 164 158 165 162 157 175 182 168 176 161 171 163 176 159 171 178 172 169 158 163 166 168 160 178 170 164 160 170 166 178 171 167 162 169 16
14、5 171 165 168 176 174 163 177 164 170 161 179 177 162 149 169 166 153 177 164 統計調查收統計調查收集來的資料往往集來的資料往往是沒有次序的原是沒有次序的原始資料始資料(參見右表參見右表),使原始資料有,使原始資料有序化,列表和作序化,列表和作圖是兩種基本方圖是兩種基本方法,得到的分別法,得到的分別就是統計表和統就是統計表和統計圖。計圖。 LOGO三、數據的組織與展示三、數據的組織與展示n(一)定類數據的組織與展示(一)定類數據的組織與展示n(二)定序數據的組織與展示(二)定序數據的組織與展示n ( (三三) ) 定距
15、數據的組織與展示定距數據的組織與展示LOGO(一)定類數據的組織與展示(一)定類數據的組織與展示1、定類變量的組織:頻數分布表、定類變量的組織:頻數分布表先分類、建立頻數分布表、計算每一類別的百分比先分類、建立頻數分布表、計算每一類別的百分比 性別性別 頻次頻次 百分比(百分比(%) 男男 女女 2747 1559 63.8 36.2 總計總計 4306 100表表1:微博用戶的性別統計表(:微博用戶的性別統計表(N=4306)(資料來源:(資料來源:SSI在線樣本庫,調查地包括在線樣本庫,調查地包括北京、上海、廣州、深圳、成都、沈陽、西北京、上海、廣州、深圳、成都、沈陽、西安、杭州八市)安、
16、杭州八市) 表頭表頭 表號表號標識行標識行 主體行主體行表尾表尾表表2:我國社會福利主要費用情況:我國社會福利主要費用情況 單位:億元單位:億元項目項目1998199920002001(一)優撫對象補助金額(一)優撫對象補助金額國家支出集體供給(二)農村傳統救濟金額(二)農村傳統救濟金額國家支出集體供給(三)城鄉各種福利院支出(三)城鄉各種福利院支出國家支出集體供給680324356 298 70 22820210399914511403285 7920623113794 1076 607469317 83234287 190 97 1081695 386 295 121 174405264
17、141合計合計 1180 1430 1680 1781 資料來源|:2003中國統計年鑒第838頁。 標題部分標題部分 1、標題置于表格正上方、標題置于表格正上方 2、總標題所示要點與表中項目一致,在需要時還應表、總標題所示要點與表中項目一致,在需要時還應表明資料所屬的時間和地區明資料所屬的時間和地區 3、表號:左、表號:左 ;單位:右;單位:右 4、對分頁的同一表格,在每頁上端都要寫標題,加、對分頁的同一表格,在每頁上端都要寫標題,加(續一)、(續二)(續一)、(續二) 欄目部分欄目部分 1、先局部后整體、先局部后整體 2、若欄目較多,可加以編號;統計數字間有計算關系、若欄目較多,可加以編號
18、;統計數字間有計算關系的,可用計算式表達。的,可用計算式表達。統計表的制作規則統計表的制作規則 線格部分線格部分 1、統計表上下兩端線應以粗線標劃,表的、統計表上下兩端線應以粗線標劃,表的左右兩側開口。左右兩側開口。 2、各欄間用直線標劃,大項目間線條較粗,小欄目、各欄間用直線標劃,大項目間線條較粗,小欄目線條較細;各行間不必劃線條。線條較細;各行間不必劃線條。 數字部分數字部分 1、表中數字要對準位數,小數點對齊。、表中數字要對準位數,小數點對齊。 2、不存在某數字時,用、不存在某數字時,用“”表示;缺少某項數字表示;缺少某項數字時,用時,用“”表示。表示。 3、數字較大時,加分位點。、數字
19、較大時,加分位點。 其他規則其他規則 1、資料來源寫在表格下方。、資料來源寫在表格下方。 2、有說明解釋需要時,在表下方注釋。、有說明解釋需要時,在表下方注釋。 3、單位有數種時而不能在表右上角劃一標注時,可在、單位有數種時而不能在表右上角劃一標注時,可在標識欄中注明,也可注釋說明。標識欄中注明,也可注釋說明。LOGO2.定類數據的圖示定類數據的圖示n1.條形圖n2.對比條形圖n3.餅圖LOGO(二)定序變量的數據組織(二)定序變量的數據組織表表3:微博用戶的教育程度統計(:微博用戶的教育程度統計(N=4306) 受教育程度受教育程度頻數頻數百分比百分比 初中及以下初中及以下 高中、職高、技校
20、高中、職高、技校 大專大專 大學本科大學本科 研究生及以上研究生及以上 17 237 8662752 434 0.4 5.5 20.1 63.9 10.1 總計總計4306100(資料來源:(資料來源:SSI在線樣本庫,調查地包括北京、上在線樣本庫,調查地包括北京、上海、廣州、深圳、成都、沈陽、西安、杭州八市)海、廣州、深圳、成都、沈陽、西安、杭州八市)累積頻數表(累積頻數表(CF)向上累計向上累計以變量數以變量數列首組的頻數為始點,逐列首組的頻數為始點,逐個累計各組的頻數,展示個累計各組的頻數,展示小于該組上限的頻數和小于該組上限的頻數和。向下累計向下累計以變量數以變量數列末組的頻數為始點,
21、逐列末組的頻數為始點,逐個累計各組的頻數,展示個累計各組的頻數,展示大于該組下限的頻數和。大于該組下限的頻數和。 受教育程度受教育程度頻數頻數百分比百分比Cfcf 初中初中 高中、職高、技校高中、職高、技校 大專大專 大學本科大學本科 研究生及以上研究生及以上 17 237 8662752 434 0.4 5.5 20.1 63.9 10.1 0.4 5.9 26.0 89.9100.0100.0 99.6 94.1 74.0 10.1 總計總計4306100LOGO(三三)定距和定比變量統計表定距和定比變量統計表定距和定比變量的兩種類型:定距和定比變量的兩種類型: 離散型變量離散型變量取值為
22、有限個或列為有限個,如子女數取值為有限個或列為有限個,如子女數 連續型變量連續型變量取值為有限或無限區間內的任意實數,即取值為有限或無限區間內的任意實數,即變量的取值連續,如身高變量的取值連續,如身高若變量為離散型變量,且取值相對較少,可以按照定類或若變量為離散型變量,且取值相對較少,可以按照定類或定序統計表方式統計頻次或百分比。定序統計表方式統計頻次或百分比。若變量為連續型變量,則需要將變量值分為若干個區間或若變量為連續型變量,則需要將變量值分為若干個區間或組,統計每一個組內的頻次或百分比。組,統計每一個組內的頻次或百分比。 數據分組時需要考慮的幾個問題:數據分組時需要考慮的幾個問題: A
23、組數組數 B 組距組距 C 組限組限LOGO如何制作分組統計表如何制作分組統計表1、確定組數:一般調查總數、確定組數:一般調查總數N與分組數有如下經驗關系與分組數有如下經驗關系調查總數調查總數N 分組數分組數K50100610100250712250以上以上10202、確定組距:分為等距分組與非等距分組,一般來說為確定組距:分為等距分組與非等距分組,一般來說為等距分組等距分組等距分組組距計算公式:組距(等距分組組距計算公式:組距(h)=(最大值(最大值-最小值)最小值)/組數組數u斯特格斯(斯特格斯(Sturges)經驗公式確定組數:經驗公式確定組數: K=1+3.322lgNLOGOi+i2
24、ib 第 組上限值 第 組下限值3、確定組限:一個組的最小值叫下限,最大值叫上限、確定組限:一個組的最小值叫下限,最大值叫上限各組中心值各組中心值bi計算公式計算公式4、分組原則:不重復、不遺漏,組上限不在內、分組原則:不重復、不遺漏,組上限不在內5、中心值計算、中心值計算缺上限開口組組中值bi=下限+鄰組組距/2缺下限開口組組中值bi=上限-鄰組組距/2LOGO收入組收入組組中值組中值百分比百分比1000元以下元以下20.21000-2000150045.12000-3000250022.83000-400035007.64000元以上元以上4.3*地區殘疾人月收入統計表地區殘疾人月收入統計
25、表 ( N=1000)5004500LOGO分組統計表例表分組統計表例表例:某車間例:某車間50名工人日加工零件數名工人日加工零件數 117 122 124 129 139 107 117 130 122 125 110 118 123 126 133 134 127 123 118 112 108 131 125 117 122 133 126 122 118 108 112 134 127 123 119 113 120 123 118 112 137 114 120 128 124 115 139 128 124 121 LOGO分組步驟:分組步驟:1、確定組數:、確定組數:K=1+3.
26、322lg5072、計算組距、計算組距: h=(L-S)/K=(139-107)/7=4.6 53、確定組限,編制頻數分布表、確定組限,編制頻數分布表組號組號日加工零件數日加工零件數中心值中心值頻數頻數頻率(頻率(%)累計百分比累計百分比% cf1105-110107.53662110-115112.5510163115-120117.5816324120-125122.51428605125-130127.51020806130-135132.5612927135-140137.548100合計合計50100表表1:工人日加工零件頻數分布表:工人日加工零件頻數分布表 100名男性青年的身高表名男性青年的身高表 單位:厘米單位:厘米三、數據的組織與展示三、數據的組織與展示 166 181 173 171 168 164 178 167 156 194 169 175 183 168 165 180 170 17
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 成功心理定律
- 腫瘤患者夏季防暑指南
- 工程人員培訓
- 郵政綜柜培訓
- 羊水栓塞的產科護理查房
- 2025年中國內部防火門行業市場全景分析及前景機遇研判報告
- 腎內科飲食指導
- 中醫腫瘤消融方案
- 住院患者心理健康教育
- 無人機安裝工程安全協議
- 無人機應急救援應用-深度研究
- 康復醫學科治療技術操作規范2023版
- 磷酸鐵及磷酸鐵鋰異物防控管理
- 小兒扁桃體腺樣體摘除術后的飲食護理干預
- OptiStruct結構分析與工程應用
- 《我國稅收制度》課件
- 2025年貴安發展集團有限公司招聘筆試參考題庫含答案解析
- 行政副總崗位職責
- 《鐵路軌道維護》課件-起道作業
- 生豬肉質檢測與評價合同(二零二四年度)
- 2024年變壓器性能檢測服務合同
評論
0/150
提交評論