




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
資料處理目錄任務一原始資料的審核復查與問卷編碼A任務二數據錄入B任務三數據清理C任務四數據轉化D任務一原始資料的審核復查與問卷編碼
本任務主要學習原始資料的審核、復查、問卷編碼方法。通過學習,掌握編碼手冊的制作方法,學會對問卷進行編碼。一、原始資料的審核與復查方法實地審核及時,效果較好;但要求調查員個人處理各種情況的能力要比較強。系統審核調查工作便于統一安排和管理;審核的標準比較一致;但周期較長。原始資料的審核,就是指研究者對調查所收集回的原始問卷資料進行初步的審查與核實,校正錯填、誤填的答案,并亂填、空白和嚴重缺答的問卷剔除出來,作為廢卷處理。原始資料的復查是指研究者按照一定的方法,從所回收的調查資料中隨機抽取一定比例(一般為5%~15%)的個案資料,并由研究者自己或委派另外的調查員對個案資料進行第二次調查。原始資料的審核二、問卷編碼方法編碼,就是給每個問題及其答案分配數字作為其代碼。編碼手冊,就是把編碼規則用一定的方式呈現出來,以方便編碼員在進行問卷編碼時隨時查閱,按照統一的規則進行編碼,減少資料轉換過程中的人為誤差,提高資料轉換工作的質量。編碼手冊的構成:一般由提問項目、變量名、變量名標簽、寬度、欄碼、答案賦值、未填寫及個別特殊值賦值等七項內容構成。編碼手冊的表頭如下:編碼分類預編碼后編碼提問項目變量名【名稱】變量名標簽【標簽】寬度【寬度】【窗口錄入時用】欄碼【程序錄入時用】答案賦值【值】未填寫【值】特殊值賦值【值】1.變量取名規則與變量名標簽(1)在SPSS12.0之前,SPSS變量名長度不能超過8個字符;從SPSS12.0開始,變量名長度最多可達64個字符。(2)首字符不能是數字,其后可以字母、數字,或除“?”、“-”、“!”和“*”以外的字符。但“.”不能作為變量名的最后一個字符。(3)變量名不能與SPSS的保留字相同。SPSS的保留字有ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。(4)系統不區分變量名中的大小寫字符。例如,變量ABC和變量abc會被系統認為是同一個變量。(5)變量名中不能有空格。變量名標簽最多可用120個字符。2.問題寬度和欄碼確定規則問題寬度是指某一具體問題的答案代碼的位數。問題欄碼則是指某個具體問題的答案代碼在計算機數據文件中所處的位置。欄碼的確定規則是從第一個項目(通常是問卷編號)開始,根據問題順序及其寬度依次確定其在整個數據排列中所處的位置。舉例:QN1-3W014W025-6
001168302321205042410010023456023.答案編碼規則根據問卷中問題形式的不同,答案代碼的賦值形式也略有不同。(1)填空式問題:直接用回答者所填寫的數字作為答案的代碼值。(2)單項選擇式問題:直接用問卷設計時對每一答案的預編碼作為它們的代碼值。如果預編碼所用代號是A、B、C、D等,而非數字時,應先將A、B、C、D等符號轉換為1、2、3、4等數字,再用數字作為相應答案的代碼值。(3)多項選擇式問題:在對多項選擇式問題的答案進行編碼時,一般應先將多項選擇式問題轉化為若干個單項選擇式問題。如果是多項任選式問題,那么有多少個選項就轉化成多少個問題。答案賦值方法有二:一是仍用原來的選項及編號作為答案的代碼值,未選中的用0表示;二是將每個選項轉換成二項選擇式問題,然后用單項選擇式問題的編碼規則進行編碼。如,用1表示“選中”,用0表示“未選中”。如果是多項限選式問題,那么限選幾項就可以轉化成幾個單項選擇式問題,并用原來的答案編號作為答案的代碼值。比如,限選項三項的問題,就轉換成三個小問題,三個變量名分別如下:
第一個變量:第一選
第二個變量:第二選
第三個變量:第三選
(4)矩陣式或表格式問題
矩陣或表格中包含多少個小問題,就轉化為多少個變量。對備選答案進行后編碼,用后編碼作為答案的代碼值。例如,12.你和知心好友一起從事下列活動的情況怎樣?(請在每一行合適的格中打√)經常有時很少從未有過1.學習2.娛樂3.聊天4.運動5.旅游例如,12.你和知心好友一起從事下列活動的情況怎樣?(請在每一行適當的方框內打√)經常有時很少從未有過①學習
□
□
□
□②娛樂
□
□
□
□③聊天
□
□
□
□④運動
□
□
□
□⑤旅游
□
□
□
□12.1.你和知心好友一起學習的情況怎樣?
①經常②有時③很少④從未有過12.2.你和知心好友一起娛樂的情況怎樣?
①經常②有時③很少④從未有過12.3.你和知心好友一起聊天的情況怎樣?
①經常②有時③很少④從未有過12.4.你和知心好友一起運動的情況怎樣?
①經常②有時③很少④從未有過12.5.你和知心好友一起旅游的情況怎樣?
①經常②有時③很少④從未有過(5)未填寫及特殊值處理習慣上,用0作為未填寫問題答案的代碼;用9作為特殊值的代碼。比如,研究者把“月收入”這一變量的答案數碼確定為四位數碼,可某份問卷上所填寫的收入是15000元,這時可以設定用9999表示月收入超過1萬的情況,即把月收入1萬元以上的當作特殊值來處理。請注意:具體某個問題要用多少個0或9來表示,要視問題的寬度而定。【實作訓練】對給定問卷進行編碼。給問卷制作編碼手冊,請看制作好的編碼手冊(節選):多項任選式問題的另一種編碼方式:不常用
仍用原來的選項及編號作為答案的代碼值,未選中的用0表示。變量名變量名標簽寬度欄碼答案賦值未選中W11_1日常交往的主要對象1201‘親戚’2‘朋友’3‘鄰居’4‘同事’5‘很少交往’6‘其他人’0W11_2日常交往的主要對象1210W11_3日常交往的主要對象1220W11_4日常交往的主要對象1230W11_5日常交往的主要對象1240W11_6日常交往的主要對象1250(二)根據編碼手冊進行問卷編碼三、注意事項問卷編碼工作關系資料處理質量的高低和數據的有效性,編碼時應認真細致,盡可能降低出錯的概率。高質量的編碼工作應當滿足如下兩個要求:第一,最大限度的利用問卷資料;第二,在不損失問卷原有信息的前提下,盡可能對問卷信息進行簡化處理,以減少后續工作中的數據錄入量。編碼時,代碼值是研究者自己設定的,不同研究者雖然可以根據自己的偏好做不同的賦值。但在賦值時應當遵循公認的習慣作法。未填寫問卷的答案以及特殊答案的賦值應當選用答案賦值中不容易出現的數字。任務二數據錄入
本任務主要學習數據錄入方法,包括從SPSS數據編輯窗口錄入數據的方法和利用SPSS程序錄入數據的方法。通過學習,學會從SPSS數據編輯窗口中錄入數據,能夠編制SPSS程序。【相關知識】一、SPSS入門知識
SPSS是英文StatisticalPackageforSocialScience的簡稱,意即社會科學統計軟件包。SPSS是世界著名的統計分析軟件之一,被廣泛運用于經濟、財政、金融、營銷、會計、管理及人文社會科學等領域。SPSS的三個重要窗口:數據編輯窗口、輸出窗口和語句窗口。數據編輯窗口輸出窗口語句窗口輸出窗口即查看器,是用于顯示與管理SPSS統計分析結果、報表和圖形的窗口。語句窗口即語法編輯器,用于編制SPSS程序。語句窗口界面從上至下依次是標題欄、菜單欄、工具欄、語句編輯區和狀態欄。變量視窗:用于編輯變量。數據視窗:用于編輯數據。注意:在數據視窗中輸入數據之前應當先在變量視窗中定義變量。啟動SPSS的方法主要有3種:
一是使用程序菜單打開SPSS,單擊“開始”按鈕,找到并單擊“所有程序”,找到并單擊“SPSSStatistics”,單擊“SPSSStatistics”。二是找到并雙擊桌面上的SPSS快捷圖標。三是雙擊SPSS文件(假定用戶已創建過SPSS文件),或者將鼠標置于SPSS文件上,單擊鼠標右鍵,彈出快捷菜單,再用左鍵單擊“打開”命令。退出SPSS,可以使用以下3種方法:一是直接單擊SPSS窗口右上角的“關閉”按鈕。二是單擊SPSS窗口標題欄上的圖標,在彈出的快捷菜單中選擇“關閉”命令。三是在桌面狀態欄上,用鼠標右鍵單擊SPSS文件最小化圖標,在彈出的快捷菜單中選擇“關閉”命令。二、數據錄入方法數據錄入的兩種主要方式直接錄入:直接從問卷上將已編好的數碼輸入到計算機。
轉錄錄入,即先將問卷上已編好的數碼謄抄到專門的登錄表上,再從登錄表上將數碼輸入到計算機。從SPSS軟件中直接錄入數據的方法方法一:直接從SPSS數據編輯窗口中錄入數據。此時,需要先在變量視窗中對變量的名稱、類型、寬度、小數位、變量標簽、變量值標簽、缺失值、顯示列寬、對齊方式以及測量尺度等項目進行定義,然后再在數據視窗中錄入數據。方法二:在SPSS程序中錄入數據。SPSS數據錄入程序主要由datalist、variablelabel(variablelabels)、valuelabel(valuelabels)、missingvalue(missingvalues)、begindata、enddata等基本命令語句構成。【實作訓練】
在SPSS中創建1個名為“昆明市低保制度實施狀況調查(居民)問卷”的數據文件,并在此數據文件中直接錄入任務一中已經編好碼的問卷信息。操作過程:(一)啟動SPSS從程序菜單中啟動SPSS,如右圖所示。(二)在SPSS數據編輯窗口中創建數據文件1.定義變量點擊變量視圖,依據《昆明市低保制度實施狀況調查(居民)問卷編碼手冊(節選)》,在變量視圖對變量逐個進行定義。2.錄入數據切換到“數據視圖”。在第一行中錄入第一份問卷的數字信息(指已編好的代碼);在第二行中錄入第二份問卷的數字信息;依次類推,直接把所有的問卷信息都輸入完畢。(三)利用SPSS程序創建數據文件三、數據錄入過程中的常見錯誤1.沒有在英文(半角)狀態下輸入。2.一個內容錄入后沒有打空格,就像錄入多個英語單詞時,一個單詞錄入后不打空格一樣,SPSS程序會不認識。3.整個命令的全部內容錄入后,沒有命令結束符(即沒打英文輸入狀態下的句號)。4.變量名不正確。例如,變量名前后不一致,在前面是W01,后面卻變成了Wo1;又如,變量名中出現了空格。5.物理斷行不正確。要斷行時應選擇在變量與下一個變量之間,不能將變量與其定義內容分開。6.將斜杠“/”與變量名分開了。“/”后面應緊跟變量名,不能分開。四、運行錯誤分析與糾錯方法
逐條執行命令,以便鎖定錯誤范圍。
首先執行第1條命令,看看有無錯誤,有錯則改正;無錯誤了,則執行第1-2條命令,有錯則在第2條命令中找錯誤并改正;無錯誤了,則執行第1-3條命令,依次類推。錯誤分析舉例運行內容:title社區青少年調查運行結果:錯誤#1.命令名:title社區青少年調查行中第一個單詞未被識別為anSPSSStatistics命令。停止執行該命令。修正:在title與標簽之間加一個空格,或者用英文輸入狀態下的引號把文字括起來,最后加命令結束符。title社區青少年調查.title‘社區青少年調查’.運行內容:title
社區青少年調查.
DATA
LIST/QN1-3
W01
4
W02
5
W03
6
W04
7
W05
8
W06
9
W07
10-12
W08
10-15
W09
16
W10
17
W11
18-20運行結果:錯誤#6045,位于列14。文本:-3在范圍指定中指定的起始列無效。停止執行該命令。修正如下:(注意劃線的地方)DATALIST/QN1-3W014W025W036W047W058W069W0710-12W0810-15W0916W1017W1118-20.運行內容:title社區青少年調查.DATALIST/QN1-3W014W025W036W047W058W069W0710-12W0810-15W0916W1017W1118-20.variablelabelQN‘問卷調查’/W01‘性別’/W02‘年齡’/W03'社區環境'/W04'舉辦青少年活動'/W05'交通'/W06'尋求社區幫助'/W07'課外活動內容'/W08'你所期待的社區的模樣'/W09'晚間活動時長'/W10'夜間活動會是否會打擾'/W11'開展怎樣的活動利于青少年'運行結果:variablelabelQN‘問卷調查’/W01‘性別’/W02‘年齡’/W03'社區環境'/W04'舉辦青少年活動'警告#4461,位于列16。文本:QN‘問卷調查’在VARLABELS命令中指定了未知的變量名。將忽略此名稱及標簽。警告#4461,位于列31。文本:W01‘性別’在VARLABELS命令中指定了未知的變量名。將忽略此名稱及標簽。警告#4461,位于列43。文本:W02‘年齡’在VARLABELS命令中指定了未知的變量名。將忽略此名稱及標簽。/W05'交通'/W06'尋求社區幫助'/W07'課外活動內容'/W08'你所期待的社區的模樣'/W09'晚間活動時長'/W10'夜間活動會是否會打擾'/W11'開展怎樣的活動利于青少年'.修正方法:在變量名與標簽之間加一個空格,或者用英文輸入狀態下的引號把標簽文字括起來。將/與W09放在同一行。修正如下:variablelabelQN問卷調查/W01性別/W02年齡/W03社區環境/W04舉辦青少年活動/W05交通/W06尋求社區幫助/W07課外活動內容/W08你所期待的社區的模樣/W09晚間活動時長/W10夜間活動會是否會打擾/W11開展怎樣的活動利于青少年.運行內容:title社區青少年調查.DATALIST/QN1-3W014W025W036W047W058W069W0710-12W0810-15W0916W1017W1118-20.variablelabelQN問卷調查/W01性別/W02年齡/W03社區環境/W04舉辦青少年活動/W05交通/W06尋求社區幫助/W07課外活動內容/W08你所期待的社區的模樣/W09晚間活動時長
/W10夜間活動會是否會打擾
/W11開展怎樣的活動利于青少年.valuelabelW011‘男’,2‘女’/W021‘12歲以下’2‘13~18歲’3‘19~24歲’/W031‘很好’2‘還行’3‘一般’4‘很差’/W041‘經常性’2‘偶爾’3‘沒有過’/W051‘方便’2‘沒有固定路線’/W061‘不會’2‘會’3‘看情況’/WO91‘一小時’2‘二至三小時’3‘看情況’/W101‘會’2‘還好’3‘不會’運行結果:(注意變量值標簽的引號格式)valuelabelW011‘男’,2‘女’/W021‘12歲以下’2‘13~18歲’3‘19~24歲’/W031‘很好’2‘還行’3‘一般’4‘很差’/W041‘經常性’2‘偶爾’3‘沒有過’/W051‘方便’2‘沒有固定路線’/W061‘不會’2‘會’3‘看情況’/WO91‘一小時’2‘二至三小時’3‘看情況’/W101‘會’2‘還好’3‘不會’.警告#4474.命令名:valuelabel(ADD)VALUELABELS命令指定了未知的變量名。將忽略此名稱。Theerrorisassociatedwith'WO9'修正如下:valuelabelW011'男'2'女'/W021'12歲以下'2'13~18歲'3'19~24歲'/W031'很好'2'還行'3'一般'4'很差'/W041'經常性'2'偶爾'3'沒有過'/W051'方便'2'沒有固定路線'/W061'不會'2'會'3'看情況'/W091'一小時'2'二至三小時'3'看情況'/W101'會'2'還好'3'不會'.五、注意事項SPSS23.0可以同時打開多個數據編輯窗口、輸出窗口和語句窗口。如果當前打開了多個數據編輯窗口、輸出窗口或語句窗口,可以直接單擊某個窗口的標題欄或最小化圖標來激活它。“列”為顯示列寬,是和數據顯示狀態相關的,與“寬度”(變量答案代碼的位數)是兩個不同的概念。但如果要使變量值完整地顯示出來,那么顯示列寬一般要大于或等于變量寬度,同時還要大于或等于變量名的長度。SPSS23.0變量有3種基本類型:數字型(SPSS17.0寫的是數值型)、日期型和字符串型。數字型變量又分為標準數字型、帶逗點的數字型、圓點數字型、科學記數法和帶美元符號的數字型變量等。定類測量、定序測量的結果為字符串,但變量類型依然可以選數字型,此時輸入的數字只是選項內容的代碼,沒有數字本身的含義;當把變量類型設定為字符串型時,在數據視圖中不僅可以輸入數字,也可以輸入字母、文字、符號等非數字內容,但編碼時一般用數字。定距測量和定比測量的結果為數字型(數值型),此時數字代表數字本身。為了防止突然斷電等意外情況導致的數據丟失,在輸入過程中應隨時保存數據。任務三數據清理
本任務主要學習數據有效范圍和邏輯一致性清理的方法。通過學習,學會數據的有效范圍清理和邏輯一致性清理。【相關知識】一、數據有效范圍清理數據有效范圍:是指變量的取值都有一定的范圍,其編碼值就在這個范圍內。比如,“性別”這一變量的取值有3種種情況:1=“男”,2=“女”,0=“未填寫”,相應地,其編碼值就只有0、1、2這3個數字,也即0、1、2是“性別”這一變量的有效范圍。在SPSS中,數據有效范圍清理的具體方法
通過執行變量的頻率分布統計命令,該命令位于菜單欄“分析”菜單的“描述統計”命令中,獲得變量的頻數頻率分布表。
觀察表中的有效值一列,看看是否有超出有效范圍的數字出現。
如果有,則應當返回到數據視圖中,將光標置于待查找變量一列的任何單元格中,在“編輯”菜單中選擇“查找”命令,將超出有效范圍的數字找出來,再看看該數字所在行對應的問卷編號,最后找到相應的原始問卷,根據原始問卷的信息對計算機文件中數字進行糾正。二、數據邏輯一致性清理數據邏輯一致性清理:是指利用變量與變量之間內在的邏輯關系,對前后數據的合理性進行檢驗。其前提條件就是要弄清問卷中不同變量之間的關系。數據邏輯一致性清理的前提條件:就是要弄清問卷中不同變量之間的關系。數據邏輯一致性清理的方法:
在SPSS中,對于相倚問題,可以直接用“交叉表分析”命令,獲得兩個相倚變量的交叉表,以觀察表是否有不應當出現的統計數字。
如果有,則使用菜單欄“數據”菜單中的“選擇個案”命令,選出不需要回答后續性問題的個案,并在其中查找不應該出現的數字,最后與原始問卷進行核對并修正。
對于存在數量關系的兩個或多個變量,可以通過創建新變量的方法檢查其邏輯一致性。【實作訓練】
利用《昆明市低保制度實施狀況調查》SPSS數據文件(截取了232個個案的信息),練習數據的有效范圍清理和邏輯一致性清理。操作過程:(一)預備工作:改變w01、w42的編碼值,創設仿真情境。(二)數據的有效范圍清理第一步:依次點擊:分析(A)→描述統計→頻率(F)…,對w01[性別]作頻率統計。第二步:將光標置于w01所在列的任意一個單元格。第三步:點擊菜單欄“編輯”菜單中的“查找”命令,查找到超出有效范圍的數字。(三)數據的邏輯一致性清理第一步:依次點擊:分析(A)→描述統計→交叉表(C)…,做w42與w44交叉表。第二步:依次點擊如下2個命令:數據(D)→選擇個案…,在彈出的“選擇個案”對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國程控交換機式緊急電話行業投資前景及策略咨詢研究報告
- 新疆新源縣達標名校2024-2025學年初三考前全真模擬密卷英語試題試卷(5)含答案
- 信陽市固始縣2025年三年級數學第二學期期末綜合測試試題含解析
- 甘肅省渭源縣重點中學2023-2024學年中考數學考試模擬沖刺卷含解析
- 廣東省廣州市石井新市學片2023-2024學年中考試題猜想數學試卷含解析
- 2025公司項目負責人安全培訓考試試題及參考答案AB卷
- 2024-2025公司廠級安全培訓考試試題附參考答案【培優B卷】
- 2024-2025項目部安全培訓考試試題及參考答案【基礎題】
- 2024-2025企業員工崗前安全培訓考試試題附答案【考試直接用】
- 2025年新進廠員工安全培訓考試試題及完整答案1套
- FZ/T 52019-2011萊賽爾短纖維
- 止血包扎(課件)
- 國開電大 管理概論 形考任務一(畫組織結構圖)
- 三自由度并聯機器人結構設計
- 倉儲裝卸服務合同
- 式雙鉤五點安全帶培訓課件
- 名片設計 課件
- 鉗工實操評分表(凹凸配合)
- 社會組織管理概論全套ppt課件(完整版)
- 陜西省城市規劃管理技術規定(定稿)
- 部編版七年級下冊歷史復習提綱(重點考察知識點)
評論
0/150
提交評論