社會調查研究方法教案第10章定量資料整理.docx_第1頁
社會調查研究方法教案第10章定量資料整理.docx_第2頁
社會調查研究方法教案第10章定量資料整理.docx_第3頁
社會調查研究方法教案第10章定量資料整理.docx_第4頁
社會調查研究方法教案第10章定量資料整理.docx_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第10章 定量資料整理(2學時)當我們運用前述的各種方法收集到一批數據資料后,接下來的任務就是要對這些資料進行統計分析。在這一章中,我們將按定量資料分析的程序,對原始數據的整理、錄人,以及單變量分析、雙變量統計表格的制作做簡要的介紹。第一節 資料的整理與錄入 、資料的審核 資料的審核是資料處理的第一步工作。它是指研究者對所收集的原始資料(主要是問卷)進行初步的審閱,校正錯填、誤填的答案,剔出亂填、空白和嚴重缺答的廢卷。其目的是使得原始資料具有較好的準確性、完整性和真實性,從而為后續資料整理錄人與統計分析工作打下較好的基礎。 資料的審核工作包含兩方面的內容:一是檢查出問卷資料中的問題;二是重新向被調查者核實。 二、資料的編碼 在前面介紹問卷設計時,我們曾指出,編碼就是給每個問題及答案一個數字作為它的代碼。從資料處理的角度看,編碼就是用阿拉伯數字來代替問卷中每一個問題的回答,或者說是將問卷中的答案轉換成數字的過程。表10一l就是一份問卷中前幾個問題的答案和編碼。表101 資料轉換示例 轉換成的數字(編碼)A1 你的性別: 男 女 1A2 你的年齡:_28_周歲 28A3 你的文化程度: 小學及以下 初中 高中及中專 大專以上 3A4 你的婚姻狀況未婚 已婚 離婚 喪偶 其他 2 表格式問題的答案進行轉換時還要特別注意它的方向性,比如(見表102)。表102 對婚事花費態度的調查 在每一行所在選項下打“”非常同意同意無所謂不同意很不同意1、婚事應該盡量辦的簡單一些2、結婚式人生大事,應該辦的隆重熱鬧,花再多錢也值得3、就是有錢,婚事也不應該大操大辦 對于贊同節儉辦婚事的看法,我們按1非常問意,2同意,3無所謂,4不同意,5很不同意來賦值;而對贊同婚事大操大辦的看法,我們則按5非常同意,4同意,3無所謂,2不同意,1很不同意來賦值。這樣上例三種看法的賦值情況如表103。表103 三種看法的賦值非常同意同意無所謂不同意很不同意看法112345看法254321看法312345 所以,對于這個回答者的答案,我們應該將其轉換為:2、2、1。 每一個回答者在這一量表上的三個得分(每行一個答案所對應的碼值)加起來,就構成他對婚事操辦方式的態度得分。按我們上述賦值方式,則一個回答者在該量表上的得分越高,表明他的態度越傾向干婚事大操大辦。 在對問卷中的問題進行編碼時,要給不同的問題分配合適的欄碼,即指定該問題的編碼值在整個數據文件中所處的位置。這種欄碼有時在問卷設計時就印在問卷上(每頁的右邊,用一條豎線與問題及答案隔開),但也有很多情況下是在問卷收回后編碼時再指定。欄碼的指定方法是從問卷的第一個項目或問題開始,先根據每一個項目或問題答案數碼的位數,束確定該項日或問題所占有的寬度,再根據的后順序來確定其在整個數據排列中所處的位置,這樣從頭依次往后排列。表104就是指定欄碼的一個例子。表104 編碼制定例 寬度 欄碼A1 你的性別: 男 女 1 1A2 你的年齡:_周歲 2 23A3 你的文化程度: 1 4小學及以下 初中 高中及中專 大專以上 A4 你的婚姻狀況未婚 已婚 離婚 喪偶 其他 1 5 第一個問題的答案代碼只有1和2,是一位數,故寬度為1。因是第一個問題,故序號為1。第二個問題是“年齡”,一般情況下,人們的年齡不會超過100歲,是2位數,寬度為2,接上題序號,給定欄碼23號,第三與第四個問題的答案均為一位數,故按順序分別給予4號和5號。需要說明的是,在給年齡、工資收入、時間、人數等定距變量分配欄碼時,一定要根據實際情況,確定合適的寬度。 三、數據錄入 數據錄入的方式主要有兩種:一是直接從問卷上將編好碼的數據輸入計算機;另一種是先將問卷上編好碼的數據轉錄到專門的登錄表上,然后再從登錄表上將數據輸入計算機。登錄表的橫欄為問題及變量名,且都有給定的欄碼,縱欄為個案記錄,表106就是登錄表的一部分。表106 數據登錄表(部分)城區個案號A1A2A3A4A5A6A7125678910111214個案12038723832211個案24044124123410個案33102415025221個案46003612837100 四、數據清理 1有效范圍清理 對于問卷中的任何一個變量來說,它的有效的編碼值往往都有某種范圍,而當數據中的數字超出了這一范圍時,可以肯定這個數字一定是錯誤的。比如,如果在數據文件的“性別”這一變量欄中,出現了數字5或者7、8等,我們馬上可以判定這是錯誤的編碼值。因為根據編碼手冊中的規定,“性別”這一變量的隕值是1男,2女,0無回答。凡是超出這三者范圍的其他的編碼值,都肯定是錯誤的。要檢查出所有不符合要求的編碼值,我們只需在計算機上,用spss軟件(或其他軟件)執行一條統計各變量頗數分布的命令。計算機很快就能給出下述形式的結果:A5 Valid CumValue Label Value Frequency Percent Percent Percent 1 316 31.4 31.5 31.5 2 428 42.5 42.6 74.1 3 121 12.0 12.1 86.2 4 128 12.7 12.7 98.9 7 9 0.9 0.9 99.8 7 2 0.2 0.2 100.0 0 3 0.3 Missing Total 1007 100.0 100.0 Valid cases 1004 Missing cases 3 2邏輯一致性清理邏輯一致性清理則是從另一種角度來查找數據中所存在的問題。它比有效范圍清理要稍微復雜一些。其基本思路是依據問卷中的問題相互之間所存在的某種內在的邏輯聯系,來檢查前后數據之間的合理性要查找和清理有著上述錯誤的個案,需要在SPSS軟件中,執行條件選擇命令(IF)。比如,先用IF命令將所有回答“沒有孩子”的個案挑出來,單獨做頻數統計;再按前述有效范圍清理的方法,找到那些在“孩子的年齡”變量上編碼值不為零的個案;同樣地,先用IF命令將未婚者挑出來,單獨做頻數統計;然后找到那些在變量子女數日或者子女年齡上,出現有非零編碼值的個案。再根據這些個案的編號找來原始問卷進行核對,糾正錯誤。邏輯一致性清理還可以采取SPSS中構成新變量的命令(即compute命令)來進行。讀者可參考有關SPSS統計分析的著作。3數據質量抽查盡管采取了上述兩種方法對數據進行清理,但仍會有一些錯誤的數據無法查出來。人們往往采用隨機抽樣的方法,從樣本的全部個案中,抽取部分個案,進行這種形式的校對工作。用這一部分個案校對的結果,來估計和評價全部數據的質量。第二節 統計表的制作一、統計表的構成與制作 1、統計表的構成從統計表的結構上看,通常都由表號、總標題、橫行標題、縱欄標題、數字注釋和資料來源等要素組成。表號式表的序號,位于表頂端的左角。其作用是便于指示和查找。總標題是表的名稱。作用是簡要說明表中資料的內容,指明資料的時間與空間范圍等。橫行標題是橫行的名稱,對于頻數統計表來說,一般用來統計所要說明的主題;而對于交互分類統計表來說,它也是表示其中一個變量的類別。數字是統計表的實質性內容,是對調查資料進行統計匯總、整理和計算的結果體現。注釋或資料來源是對表中資料的一種說明。表107、表108是一般統計表的兩個例子。 表號 總標題表107 1990年全國城鄉人口及其比重人口數(億)比重() 縱欄標題市2.1118.69橫行標題鎮0.857.54 數字鄉8.3473.77合計11.30100.0 資料來源:中國人口統計年鑒(1991年).北京:中國統計出版社,1992.14注釋和資料來源 表號 總標題表108 年齡與生育意愿交互分類()青 年35歲以下中年3655歲老年56歲及以上 縱欄標題不生510橫行標題生一個6053 生兩個358577 數字三個以上0920(n)(100)(100)(100)2、統計表的制作統計表的制作原則是:科學、規范、簡明、實用、美觀。具體的說,在制作統計表時,應注意以下幾個方面:首先,表的標題要簡短明了,要能確切說明表中數據的內容,使人一目了然。其次,表的縱欄標題與橫行標題要準確反映變量取值的含義,他們的排列順序也應具有一定的邏輯性。第三,表中的數據資料必須注明計量單位。第四,對于一般的頻數分布表,則應列出合計欄,一邊獲得整體情況的資料。最后,各種表格均應以橫線為主,能夠不用豎線的盡量不用。表109 1990年全國城鄉人口及其比重人口數(億)比重()市2.1118.69鎮0.857.54鄉8.3473.77合計11.30100.0表1010 住戶人口密度與婆媳沖突間的關系()婆媳沖突住 戶 密 度高中低高54.819.67.1中26.253.950.0低19.026.542.9(n)(42)(102)(56)G=+0.463 Z=3.346 p0.001(一端檢定)二、單變量統計表單變量統計表的制作要求,我們剛才已經介紹了,為了加深印象,在這里再舉個例子。例:單變量單表(在一個企業進行的調查,對調查對象年齡的描述)在被調查者中,青年和中年人占了絕大多數,約占總體比率的95.6%;其中又以3039歲的人最多,其人數比率接近一半;4049歲和1829歲的被調查者人數比率接近,在25%左右;而調查對象在50歲以上的人非常少,這說明本單位職工的年齡結構比較合理。表1011 調查對象的年齡構成 N=431頻數(人)有效百分比(%)1829歲1062463039歲1934484049歲1132625059歲184260歲及以上102 三、雙變量統計表1、交互分類表的形式要求雙變量統計表格叫交互分類表,也叫列聯表,我們在前面舉過一個例子,見表1010。它的形式要求主要有7點:(1)每個表的頂端要有表號和標題。(2)表格中的線條一定要規范、簡潔,最好不用豎線。(3)表中的百分比符號有兩種簡便處理的方法:一種是在表頂端的右角,也即是標題的盡頭出,標上一個“()”符號(見表1010),它表示此表中的數字都是百分比;另一種方式是在表中每一縱欄數字的頭上(也就是上方變量的每個取值下面)寫上一個“”,這樣就可以省去在表中每一個數字后都標上一個“”的麻煩。(4)在表的下端用括號標出每一縱欄所對應的頻數,以指示每一欄百分比所具有的基礎(個案的多少),同時也可供讀者據此計算每一類別中的個案數目。(5)表內百分比通常保留一位小數。對那些整數形式的百分比,仍要在后面寫出0。(6)對交互分類的兩個變量的安排,通常是將自變量、或被看作自變量的、或用來做解釋的那個變量放在上層,而將因變量、或被看作因變量的、或被解釋的那個變量放在表的左側。表中百分比的方向一般情況下是按自變量的方向,即縱欄方向。(7)交互分類的兩個變量的變量值應有所限制,特別是不能同時具有多個變量值。2、交互分類表舉例例(對某企業關于改制的調查),自變量:年齡,因變量:“改制是大勢所趨”觀念:經過分析,可以看出年齡與職工對“改制是大勢所趨”觀念的認知相關。1829歲的人中,有90.4%的人贊成這個觀點;3039歲的人有72.2%的人贊成;4049歲的人有66%的人贊成;50歲及以上的被調查者由于人數較少

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論