




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
StatisticalProgramforSocialSciencesSPSSforWindows第一講SPSS簡介及數據編碼錄入1簡介SPSS是StatisticalProgramforSocialSciences的簡稱,即社會科學統計程序,由美國SPSS公司1970年代推出,迄今已有近30年的歷史。是國際著名三大社會科學統計軟件包之一(SAS、SPSS、Statis)。2進入SPSS之前的準備工作2-1-1數據資料的形式:矩陣式數據數據要求每一橫行為一個個案(Case),縱列按變量排列,形成矩陣格式。2-1數據資料的形式及編碼編碼錄入2-1-2編碼的概念:根據一定的規則將研究資料轉換為可進行統計分析的數碼資料的過程。問題025:您認為打工的外地人對北京市的社會秩序是否有影響?(單選)1□有很大影響2□有較大影響3□沒有影響4□不好說4編碼答案2-1-3編碼的步驟:1)確定變量;變量:用來反映文意概念的量化形式。在統計中往往指最小的分析單位。編碼就是對變量進行編碼。變量由兩個部分構成:變量名和變量值。要注意區分何為變量,何為變量值。在調查問卷中還要注意區分問題和變量。問題009:您有幾個兒子?幾個女兒?1□兒子_______人2□女兒________人23問題變量1變量2變量1的值變量2的值2)制作編碼表直接過錄0-1編碼變量名:一個數據文件中,一個變量只能有一個唯一名稱。碼位:某一變量在數據文件中占據的欄位碼數:某一變量由幾位數組成。該變量是數值型(Numeric)——如定距、定比,還是字串型(String),如定類、定序。前者在統計中可以做高級運算,后者則不可以。不適于被訪人回答的問題的編碼。一般采用7,97,997等。被訪人回答不知道時的編碼。一般采用8,98,998等。被訪人拒絕回答某變量時的編碼。一般采用9,99,999等。問卷中出現漏答時的處理編碼。一般采用9,99,999等。231000113)編碼:根據編碼表對問卷進行編碼,而后將編碼結果記錄在問卷上或編碼紙上。2-2數據錄入外部式錄入內部式錄入采用DOS、WPS、CCED等軟件,按ASCII碼方式錄入成文本文件(*.dat;*.txt)。這種錄入方式的特點是,數據之間沒有間隔,錄完一個數碼后自動后移,錄入速度較快。缺點是容易錯位。采用SPSS數據編輯器(SPSSDataEditor)錄入。其優點是不容易錯位,缺點是不能自動后移,錄入速度慢,數據錯誤不容易修改。一、按照問卷處理的步驟進行描述
1、數據輸入
1)數據編碼在進行問卷調查之后,首先要對問卷資料進行整理,包括對調查所得的各種原始資料進行審查、檢驗和分類匯總。在完成了資料的基本整理以后,就要開始對資料進行編碼。所謂資料的編碼就是使用一個規定的數字或字符代表一個種類回答。對資料進行編碼,可以使眾多的資料簡化為一連串數字,使這些資料能輸入并存儲在計算機中,便于進一步分析研究。例如,我們正在進行一項消費者對某種商品評價的調查,要求被調查者回答以下問題:①消費者的性別。②消費者的職業。③消費者的年齡。④消費者對此商品綜合評價分數(0~10)。編碼說明書如下:編碼的含義為:①用數字1代表男性;2代表女性。②根據分析的需要,將消費者的職業分為工人、農民、軍人、機關干部、學生、公司職員、教師和其他8大類,并分別用數字1~8代表。③根據分析的需要,將消費者的年齡分為18歲以下、19~30歲、31~45歲、46歲以上四組,并分別用數字1~4代表。④根據分析需要,用數字1~10分別代表消費者對商品評價的。舉一個具體例子:消費者甲,男性,職業是農民,年齡為36歲,對商品評價為10分。其編碼為10203010。在資料編碼中,應把握好以下問題:①正確掌握分類的尺度,避免過細導致過于復雜,或者過粗造成資料信息流失。②為保證每一類回答都有類可歸,又避免分類過細,可設置一個“其他”的分類。③每一個問題中的分類應含義明確,避免與其他分類產生交叉。④對錯誤或疏漏的回答可作為特殊的分類,并指定一個特殊的數字或字符代表,如用0或-1等,而不應將其歸入其他類中。但是在多項選擇題中就要注意到,不同的題型使用不同的方法進行分析的時候,編碼也會有所不同,用二分法進行編碼時和用分類法進行編碼時就會有所不同,根據對一個題目的拆分內容不同編碼也不同,具體的說明在數據錄入部分會說明。2)數據錄入編碼結束以后,就要把數據錄入到電腦中,但是在此之前還需要對變量進行定義。這些在SPSS中都可以在DataView中完成,包括對變量名、變量類型、變量標簽、指標簽、缺失值和變量尺度等變量的屬性進行規定,規定好以后就可以輸入問卷數據了。需要特別注意的是字符型變量的錄入。字符型變量仍然可以轉化為數字錄入,但是必須在DataView中對本變量的Value進行規定,用0表示男,1表示女。定義好之后在錄入的時候就不必輸男或女,只需要輸入1或0就可以了。在具體處理各種類型問題的數據錄入的時候,情況要區分為單項選擇題、多項選擇題和開放題型三種情況。①單項選擇題:單選題情況比較簡單,只需要將各題的選項數字錄入到所對應的題目序號位置就可以了。但是要注意的是,輸入的時候按照一行一份問卷(即一行一個個案),一列一個問題(即一列一個變量)進行錄入。②多項選擇題:多選題比單選題要復雜,通常的處理方法有如下兩種:二分法和分類法。當一個多項選擇題沒有規定要選多少個選項的時候,對多選題的錄入采用二分法。二分法要求按照選項來把問題拆開,有幾個選項就拆為幾個變量,然后每個變量再分別賦值,選擇了則賦值為1,不選則賦值為0。比如下面的題目,4、(代表題號)選擇您喜歡的顏色_____(可以多選)。紅色、橙色、黃色、綠色、藍色、其他。根據二分法,就可以處理成這樣:選擇您喜歡的顏色?4.1紅色:1=有選,0=沒選4.2橙色:1=有選,0=沒選4.3黃色:1=有選,0=沒選4.4緣色:1=有選,0=沒選4.5藍色:1=有選,0=沒選4.6其他:1=有選,0=沒選這樣對這道題進行拆分之后,就可以像處理單項選擇題一樣來處理多選題了。當一個多項選擇題規定要了選擇的項目數時,就采用分類法。它是多選題中要求要選擇幾個選項,就定義幾個單選變量。每個變量的選項都和多項選擇題的選項相同。每個變量代表被調查者的一次選擇,即記錄的是被選中的選項的代碼。比如,有一道多選題(設為題1),請選出三個最喜歡的洗滌劑品牌,1汰漬,2碧浪,3立白,4雕牌,5其他。這時則設置三個單選變量,1.1、1.2、1.3,如果被調查者選擇的是汰漬,雕牌和其他,則變量值1.1取值為1,1.2取值為4,1.3取值為5。不過此時要注意,在對數據進行分析的時候,一定要把這幾個變量打包在一個集里,SPSS才能識別這是對多選題的處理。關于多項選擇題的分析,將在最后一部分的實例中進行詳細說明。
量表分析
在社會調查研究中,常常涉及到需要測量一些比較抽象的量,例如“經濟地位”、“傳統價值觀”、“現代化成都”、“生活態度”、“興趣愛好”等等。這樣就需要圍繞有關的研究目的或主題設計合理的問卷,那么根據設計出的問題(這里主要是指量表的設計)得到的問卷結果數值是否可靠、準確?這就涉及到問卷信度和效度的分析問題,而在SPSS中,可以很方便地進行這一方面的分析。因此,在進行問卷調查前,應先對問卷進行信度和效度的分析。經驗上,如果克朗巴哈系數大于0.9,則認為量表的內在信度很高,如果克朗巴哈系數大于0.8,則認為是克接受的,如果系數大于0.7,則認為量表的設計存在一定的問題,但仍有一定的參考價值;如果克朗巴哈系數小于0.7,則認為量表設計存在很大問題應考慮重新設計。用SPSS進行信度分析時注意的問題:由于綜合評價量表中通常包含若干個子方面,因此,信度分析應針對各個方面主格進行,不可直接對整個量表進行分析。如果某特征下設的多個評估項目并非全部同向,存在反向計分題時,應對它們進行反向處理后再進行信度分析。對于事先設計好的量表進行預測試,就可以用得到的數據在SPSS中進行信度分析,選擇菜單項Analyze下的Scale,ReliabilityAnalysis,把參與信度分析的表量選擇好,并且選擇信度系數和要輸出的統計量,就可以對量表進行信度分析了。在進行了信度和效度分析之后,還可以進行問卷的難易度和鑒別度進行分析,這些主要是在進行一些試卷研究的分析中采用的。如果在問卷中有一個題目是以量表的形式出現的,那么分析問卷中的此題可以用因子分析來進行,如現要對遠程學習者對教育技術資源的了解和使用情況進行了解,設計一個李克特量表,遠程學習者對于教育技術資源的了解和使用。將該量表發放給20人回答,可以得到回收后的原始數據,然后就可以用SPSS進行因子分析的操作,具體操作步驟如下:①錄入數據②因子分析(1)選擇“AnalyzeDataReductionFactor…”命令,將變量“A1”到“A10”選入“Variables”框中(2)設置描述性統計量(3)設置對因子的抽取選項,即選擇因子模型的估計方法,在本題目中選擇主成分法
(4)設置因子轉軸,即選擇因子載荷矩陣的旋轉方法,在本題目中選擇方差最大旋轉法
(5)設置因子分數,即計算因子得分,并且使用回歸法來求因子得分
(6)設置因子分析的選項③結果分析當SPSS把結果輸出時,就可以對結果進行分析了!
(1)KMO及Bartlett’檢驗
(2)對共同度的分析,即公共因子對原始變量的方差貢獻(3)陡坡圖,SPSS中顯示出來的圖示可以較為直觀得保留的因子數目,即當從第幾個因素以后,坡線甚為平坦,因而以保留幾個因素較為適宜。(4)整體解釋的變異數——未轉軸前的數據(5)未轉軸的因素矩陣(6)轉軸后的因素矩陣,旋轉后的載荷矩陣就可以明顯地看出各個因子了,在本題目分析總A1、A8、A6、A5、A4為因子一,A10、A9、A7為因子二,A3、A2為因子三。題項在其所屬的因素層面順序是按照因素負荷量的高低排列。
(7)因素轉換矩陣④結果說明
根據因素的特征值和旋轉后的因素矩陣,采用了主成份分析法抽取出3個因素作為共同因素,并使用因素轉軸方法中的Varimax最大旋轉法,轉軸后去掉了因素負荷量小于0.1的的系數,按照從大到小的順序進行排列,使得變量與因素的關系豁然明了。并且可以分析得到,稱第一個因子為電腦網絡資源因子,第二個因子為互動交流資源因子,第三個因子為錄音資源因子。四、問卷分析實例下面對一份問卷進行具體的分析,來體現SPSS在問卷處理中的作用。問卷見下:小學生與電視傳播調查問卷[1]一、姓名:二、性別:1、男2、女三、年級:四、年齡
[1]本問卷選自《調查研究中的統計分析法》一書五、在學校和班里是否擔任職務?1、少先隊干部2、班干部3、課代表4、學習小組長5、其他(請具體列出)六、你是否曾經獲得榮譽稱號?1、區、市級三好學生2、校級三好學生3、區、市級優秀少先隊員4、校級優秀少先隊員5、班里的學習積極分子6、其他(請具體列出)7、未曾獲得榮譽稱號七、你是否曾在各種比賽中獲獎?1、在教學競賽中獲獎2、在英語競賽中獲獎3、在作文競賽中獲獎4、在體育競賽中獲獎(包括田徑、球類、棋類、航模類)5、在文藝競賽中獲獎(包括唱歌、舞蹈、戲劇、朗誦、演講)6、在攝影競賽中獲獎7、在知識、智力競賽中獲獎8、在書法、繪畫、工藝競賽中獲獎9、其他(請具體列出)10、未曾獲得任何獎八、爸爸的職業(只選一項)1、國家干部2、工程技術人員3、社會科學工作者4、醫務工作者5、教育工作者6、新聞工作者7、文藝工作者8、體育工作者9、工人(司機、技術工人等)10、農民11、解放軍12、服務員13、個體經營者14、司法工作者(法官、警察)15、宗教工作者16、合資企業管理人員積案17、其他(請具體列出九、爸爸的文化程度(只選一項)1、大專以上2、高中或中專3、初中4、小學5、不識字或初識字十、媽媽的職業1、國家干部2、工程技術人員3、社會科學工作者4、醫務工作者5、教育工作者6、新聞工作者7、文藝工作者8、體育工作者9、工人10、農民11、解放軍12、服務員13、個體經營者14、司法工作者(法官、警察)15、宗教工作者16、合資企業管理人員積案17、家庭婦女18、其他(請具體列出)十一、媽媽的文化程度:1、大專以上2、高中或中專
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 自用加油站管理制度
- 營銷實訓室管理制度
- 蒸汽壓縮機管理制度
- 薪資結構及管理制度
- 蛋雞場運營管理制度
- 裝置大檢修管理制度
- 論排污許可管理制度
- 設備應收款管理制度
- 設備管理部管理制度
- 設計流程化管理制度
- JG/T 283-2010膨脹玻化微珠輕質砂漿
- 前臺訂機票管理制度
- 浪潮新員工培訓體系大綱
- 2025年7月浙江省普通高中學業水平考試歷史仿真模擬卷01(含答案)
- 2024福建省閩投深海養殖裝備租賃有限責任公司招聘7人筆試參考題庫附帶答案詳解
- 法人變更交接協議書
- 地七年級下冊全冊知識要點總復習-2024-2025學年七年級地理教學課件(人教版2024)
- 2024-2025學年部編版四年級語文下冊期末模擬試卷
- 車牌過戶協議書范本
- 2025年中考歷史考試綱要解讀
- 2025年統編版八年級下冊道德與法治期末復習課件327張
評論
0/150
提交評論