




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數據處理數據處理 統計分析統計分析 軟件軟件 EXCEL SPSS Markway數據分析軟件與應用開課的意義開課的意義第一篇數據分析的基本問題基本內容n統計數據的概念與種類n數據分析的基本內容n數據分析的基本方法n數據分析的基本程序n數據分析軟件介紹n參考書目第第1章數據分析概述章數據分析概述1.1統計數據的概念與種類統計數據的概念與種類n概念:統計數據是對現象特征進行計量的結果,即變量值。n特征: 1、統計數據是指由多個數據構成的數據集; 2、統計數據既可以是數字的,也可以是文字的。n種類: 1、品質數據(定類數據、定序數據) 2、數值型數據(定距數據、定比數據)1.2數據分析的基本內容數
2、據分析的基本內容n數據結構分析n數據分布特征分析n數據對比關系分析n數據之間相互關系的分析n數據變動規律及特征的分析n數據的綜合評價與分析數據相互關系的分析方法數據相互關系的分析方法1.3數據分析的主要方法數據分析的主要方法n指標法: 總量指標、相對指標、平均指標和變異指標等。n模型法: 時間序列模型、回歸分析模型、綜合評價模型等。n圖表法:統計圖根據其用途可以分為以下幾類:(1)反映數據分布特征的圖形:條形圖、直方圖、折線圖、箱線圖、莖葉圖等。(2)反映數據依存關系的圖形;散點圖、比較圖。(3)反映變動趨勢的圖形:線圖(4)綜合評價圖:雷達圖統計圖的選用統計圖的選用1.4數據分析的基本程序數
3、據分析的基本程序n1、明確數據分析的目標;n2、正確收集數據;n3、數據的加工與整理;n4、選擇合適的統計方法分析數據;n5、正確解釋分析結果。運用數據分析軟件進行數據分析的基本過程 (舉例)n1、建立數據文件n2、根據分析目的,選擇需要對數據進行處理的工具,對數據進行分析處理n3、用圖表展示處理結果n4、分析結果解釋與說明第第2章常用數據分析軟件介紹章常用數據分析軟件介紹常用數據分析軟件介紹1、Excel 2、SAS(Statistical Analysis System)3、馬克威(Markway)分析系統4、SPSS 5、Stata 6、Datax關于SPSSnSPSS的英文原名為:St
4、atistical Package for Social Sciences,譯為社會科學統計軟件包。n2002年將英文全稱更改為:Statistical Product and Service Solutions,譯為統計產品與服務解決方案。n 2009年,SPSS公司宣布重新包裝旗下的SPSS產品線,定位為預測統計分析軟件(Predictive Analytics Software)PASW,并與2009年7月被 IBM公司收購,因此此后的版本均已“IBM SPSS Statistics+數字序號”為全名。n注:IBM(國際商業機器公司)或萬國商業機器公司,簡稱IBM(Internation
5、al Business Machines Corporation)??偣驹诩~約州阿蒙克市公司,1911年創立于美國,是全球最大的信息技術和業務解決方案公司。關于馬克威數據分析系統n馬克威分析系統是中國第一套完全自主知識產權的大型統計分析和數據挖掘系統。n特點:1、將數據挖掘、統計分析、圖形展示和智能報表融為一體;2、提供獨創的優化算法體系和完備的數據挖掘模型;3、將可視化數據分析與數據挖掘有機地融合在一起;4、在設計上充分考慮了中國用戶的實際情況和使用習慣。n功能:1、數據輸入;2、數據處理;3、統計分析;4、數據挖掘;5、統計制圖;6、統計報表。參考書目n 1、Excel數據統計與分析范例
6、應用 楊世瑩/編著 中國青年出版社n2、 Excel在會計和財務中的應用,崔杰等編著,清華大學出版社n 3、財務管理中的計算機應用,劉蘭娟主編,上海財經大學出版社n4、經濟管理數據分析實驗教程SPSS18.0操作與應用 吳培樂/主編 科學出版社n5、馬克威(Markway)軟件與統計分析教程/魏振軍主編n6、 Excel數據透視表應用大全 Excel Home/編著 人民郵電出版社 第二篇第二篇Excel與數據處理與分析與數據處理與分析第第3 3章章EXCEL20102010數據分析基礎數據分析基礎3.1Excel 2010數據分析功能概述數據分析功能概述n(1)使用“數據透視圖表”完成數據整
7、理與分析n(2)使用“數據分析”工具完成數據整理與分析n(3)利用Excel函數完成數據整理與分析n 單一函數的調用n 函數的組合應用n(4) Excel圖表在數據整理與分析中的應用n(5)其他Excel數據處理功能介紹3.1.1Excel數據透視圖表工具及其功能數據透視圖表工具及其功能n有效管理大規模數據,即以友好方式查看大量數據表格,展開和折疊所關注的數據,快速查看摘要數據的明細信息,建立交叉表并通過行列互換展示原數據的不同匯總結果等。n對數據進行整理,即對數據進行快速分類匯總。按分類和子分類表現數據頻數分布狀況。n對數據進行同步計算,即對多項數據同步計算差異、百分比、差異百分比等分析指標
8、。3.1.2Excel數據分析工具及其功能數據分析工具及其功能名稱名稱 說說 明明方差分析方差分析包括單因素方差分析、可重復雙因素方差分析、無重復雙因素方差分析相關系數相關系數用于計算相關數據之間的相關系數協方差協方差用于計算數據之間的協方差描述統計描述統計用于計算一組數據的描述性統計量指數平滑指數平滑用于計算時間序列中的指數平滑值傅利葉分析傅利葉分析解決線性系統問題,并能通過快速傅利葉變換(FFT)分析周期性數據F檢驗檢驗用于比較兩個樣本總體方差直方圖直方圖在給定數據單元格區域和接收區間的情況下,計算數據分組的頻數和累計頻數移動平均移動平均根據時間序列計算移動平均數回歸回歸用于計算回歸系數和
9、回歸方程檢驗統計量抽樣抽樣從輸入區域抽取總體的一個隨機樣本t-檢驗檢驗提供了3種不同的假設檢驗,即雙樣本等方差假設檢驗、雙樣本異方差假設檢驗、平均值的成對二樣本分析Z-檢驗檢驗雙樣本平均差檢驗3.1.3常用常用Excel數據分析函數數據分析函數n 函數是某一特殊功能或較復雜的運算寫成的Excel內建子程序,用于簡化輸入公式。 n Excel2010提供了數學和三角函數、文字函數、 日期與時間函數、統計函數、財務函數、邏輯函數、查找引用與數據庫函數、工程函數、信息函數等多種不同功能的函數。其中用于數據整理與分析的函數就有80多個。n單一函數的應用:NOW() 、TODAY() CONNTIF()
10、 、SUMIF()、 FORECAST() 、 HARMEAN() GEOMEAN()、財務函數n函數的組合運用:抽樣估計3.2Excel數據文件的建立數據文件的建立2、數據錄入格式:、數據錄入格式: 在Excel2010工作表中輸入統計分析數據,通常的格式是:每列對應于一個變量(字段),每行對應于一條記錄。此外,數據表中間要避免空白單元格。1、基本步驟:、基本步驟: (1)打開(啟動)Excel2010; (2)錄入統計數據; (3)保存數據文件,退Excel2010。3、數據輸入技巧:、數據輸入技巧:(1)在多個單元格中同時輸入相同信息。選定單元格;輸入內容;按“Ctrl+Enter”鍵(
11、2)快速輸入當前日期和時間;按“Ctrl+;”鍵;按“Ctrl+Shift+;”鍵(3)數據自動填充工具的應用;(4)輸入零開頭的數據(5)輸入分數數據4、獲取外部數據、獲取外部數據 選擇“數據”選項卡在“獲取外部數據”組中選擇要導入的文件類型。 第第4章章EXCEL數據管理數據管理4.1數據表分頁數據表分頁4.2數據項組合數據項組合(1)品質數據組合(2)日期型數據的組合(3)取消組合4.3數據數據的編輯與處理的編輯與處理(1)數據分列(2)自定義填充序列 第第5章章EXCEL數據數據整理整理5.1Excel數據預處理數據預處理n審核:錯誤檢查、圈釋無效數據n篩選:高級篩選n排序:自定義排序
12、5.2Excel品質數據整理品質數據整理n單一變量頻數分布統計;(例1)n雙變量列聯交叉頻數分布統計;(例2)n品質數據整理結果的圖示:條形圖、餅圖。5.3Excel數值型數據整理數值型數據整理n單變量值分組(例3)n組距式分組(例4)n數值型數據整理結果的圖示: 直方圖、折線圖、累計次數分布圖(例5)。 第第6章章EXCEL數據數據分析分析6.1Excel計算描述性統計量計算描述性統計量1.用用“數據分析數據分析”工具計算描述性統計量工具計算描述性統計量2.用用Excel函數計算描述性統計量函數計算描述性統計量3.利用利用“分類匯總分類匯總”工具計算描述性統計工具計算描述性統計量量6.2Ex
13、cel抽樣推斷抽樣推斷 1.抽取隨機樣本抽取隨機樣本 用用Excel抽取隨機樣本,可直接借助抽取隨機樣本,可直接借助“數數據分析據分析”工具完成,其中后者簡單快捷。工具完成,其中后者簡單快捷。 2.總體參數估計總體參數估計 組合使用組合使用Excel函數做參數估計函數做參數估計 用用“數據分析數據分析”工具做區間估計工具做區間估計6.3Excel相關與回歸分析相關與回歸分析1.相關分析相關分析(1)用)用Excel繪制散點圖(繪制散點圖(XY散點圖)散點圖)(2)計算相關系數)計算相關系數2.回歸分析回歸分析(1)通過添加趨勢線進行回歸分析)通過添加趨勢線進行回歸分析(2)使用)使用“函數函數
14、”進行回歸分析進行回歸分析(3)使用)使用“數據分析數據分析”工具進行回歸分析工具進行回歸分析6.4Excel時間序列分析時間序列分析1.通過移動平均法測定長期趨勢通過移動平均法測定長期趨勢2.利用數學模型測定長期趨勢利用數學模型測定長期趨勢(1)用)用“數據分析數據分析”工具建立趨勢方程測定長工具建立趨勢方程測定長期趨勢期趨勢 (2)通過添加趨勢線建立趨勢方程測定長期趨)通過添加趨勢線建立趨勢方程測定長期趨勢。勢。6.5Excel在會計中的應用在會計中的應用1、EXCEL在憑證中的應用在憑證中的應用2、EXCEL在會計賬簿中的應用在會計賬簿中的應用3、 EXCEL在會計報表中的應用在會計報表
15、中的應用4、 EXCEL在工資核算中的應用在工資核算中的應用5、EXCEL在應收賬款管理中的應用在應收賬款管理中的應用6、EXCEL在固定資產管理中的應用在固定資產管理中的應用7、EXCEL在財務管理中的應用在財務管理中的應用8、EXCEL在財務分析中的應用在財務分析中的應用 第第7章章EXCEL數據數據分析圖形繪制分析圖形繪制7.1Excel繪圖基礎繪圖基礎1.創建圖形的一般步驟創建圖形的一般步驟第一步,按要求建立數據文件;第二步,選定數據區域,單擊【插入】選項卡;第三步,根據繪圖目的在“插入”菜單的“圖表”區選擇合適的圖表類型。第四步,對生成的初始圖形進行編輯與修飾。7.1Excel繪圖基
16、礎繪圖基礎1.創建圖形的一般步驟創建圖形的一般步驟第一步,按要求建立數據文件第一步,按要求建立數據文件;第二步,選定數據區域,單擊【插入】選項卡第二步,選定數據區域,單擊【插入】選項卡;第三步,根據繪圖目的在第三步,根據繪圖目的在“插入插入”菜單的菜單的“圖表圖表”區選擇合適的圖表類型。區選擇合適的圖表類型。第四步,對生成的初始圖形進行編輯與修飾。第四步,對生成的初始圖形進行編輯與修飾。7.1Excel繪圖基礎繪圖基礎2.圖形的編輯和修飾圖形的編輯和修飾圖形的編輯與修飾需要使用圖形的編輯與修飾需要使用“圖表工具圖表工具”選項卡。選項卡。3.圖形中數據系列的操作圖形中數據系列的操作(1)數據系列
17、的增刪)數據系列的增刪(2)缺失數據的處理)缺失數據的處理(3)使用次坐標)使用次坐標(4)創建組合圖)創建組合圖 適用條件: 當多個數據點的數據值都小于餅圖的 5% 時,為更明顯的區分各個扇區,可以采用復式餅圖。7.2復式餅圖7.3比較柱狀圖 比較柱狀圖用于分析兩個總體在按某一標志分組情況下各比較柱狀圖用于分析兩個總體在按某一標志分組情況下各部分之間的差異。部分之間的差異。股價圖經常用來顯示股價的波動。創建股價圖要求必須按正確的順序組織數據。各種類型圖表的數值排列順序:盤高-盤低-收盤圖;開盤-盤高-盤低-收盤圖;成交量-盤高-盤低-收盤圖;成交量-開盤-盤高-盤低-收盤圖7.4股價圖股價圖
18、(續) “ “氣泡圖氣泡圖”用用于展示三個變量之于展示三個變量之間的關系。繪制時間的關系。繪制時將一個變量放在縱將一個變量放在縱軸、一個變量放在軸、一個變量放在縱軸、第三個變量縱軸、第三個變量用氣泡的大小來表用氣泡的大小來表示。示。7.5氣泡圖7.6雷達圖 “雷達圖”是一種多指標綜合評價統計圖形。在經濟管理活動中,利用雷達圖可以比較不同國家或區域之間的經濟實力和發展程度,也可以比較不同地區和單位工作或成績的差別等。7.7洛倫茨曲線洛倫茨曲線 “羅倫茨曲線”是20世紀初美國經濟學家、統計學家洛倫茨(M.E.Lorentz)根據意大利經濟學家帕累托(V.Pareto)提出的收入分配公式繪制的描述收
19、入和財富分配平均程度的曲線。 繪制依據:一定區域家庭戶數累計百分比和相應的家庭收繪制依據:一定區域家庭戶數累計百分比和相應的家庭收入累計百分比。入累計百分比。繪制羅倫茨曲線的基本方法繪制羅倫茨曲線的基本方法繪制洛倫茨曲線的基本方法是:(1)對居民家庭按人均收入水平分組,并按從低到高順序排列;(2)計算各組家庭數(或人數)占全部總戶數的比重,并在此基礎上計算各組的累計頻數(比重);(3)以收入不高于某水平的家庭數(或人數)占總戶數(或總人數)的比重為X軸,以與其相應的家庭(或人口)擁有的收入在總收入中所占的比重為Y軸,建立平面直角坐標 進行繪制。7.8帕累托圖帕累托圖 “帕累托圖”是1897年意
20、大利經濟學家帕(Vilfredo.E.Pareto)提出,在意大利有80%的財富為20%的人所擁有,并且這種經濟趨勢存在普遍性。這就是80/20法則、帕累托法則。 80/20法則說明:原因和結果、投入和產出以及努法則說明:原因和結果、投入和產出以及努力和報酬之間本來就是不平衡的。很多情況下,力和報酬之間本來就是不平衡的。很多情況下,80%的產出來自于的產出來自于20%的投入,的投入,80%的結果歸結的結果歸結于于20%的起因,的起因,80%的成功歸功于的成功歸功于20%的努力。的努力。7.8帕累托圖帕累托圖 “帕累托圖”是1897年意大利經濟學家帕(Vilfredo.E.Pareto)提出,在
21、意大利有80%的財富為20%的人所擁有,并且這種經濟趨勢存在普遍性。這就是80/20法則、帕累托法則。 80/20法則說明:原因和結果、投入和產出以及努法則說明:原因和結果、投入和產出以及努力和報酬之間本來就是不平衡的。很多情況下,力和報酬之間本來就是不平衡的。很多情況下,80%的產出來自于的產出來自于20%的投入,的投入,80%的結果歸結的結果歸結于于20%的起因,的起因,80%的成功歸功于的成功歸功于20%的努力。的努力。7.9量量-本本-利分析圖利分析圖 量本利分析是通過成本-銷量-利潤之間的關系分析,找出三者之間的聯系規律,從而有效地制定經營決策,為目標控制提供依據。 7.10盈虧平衡
22、分析圖盈虧平衡分析圖 盈虧平衡分析主要在于確定公司達到盈虧平衡式的銷售水平 。即分析銷量高于或低于盈虧平衡銷量時的盈利和虧損狀況。 7.11迷你圖迷你圖 小結一、用Excel做數據的整理(一)品質數據的整理 運用“數據透視圖表”工具(二)數值型數據的整理 1、運用“數據透視圖表”工具 2、運用“數據分析”工具 3、“FREQUENCY”函數(三)數據整理結果的圖示:條形圖、餅圖、直方圖、累計頻數分布折線圖。二、用Excel做數據的分析(一)描述性統計量的計算 分類匯總功能、“數據分析”工具、函數(二)數據的相關性分析 “數據分析”工具、函數(三)數據變動趨勢分析 “數據分析”工具、函數(三)數
23、據分析中的圖形應用:盒圖、雷達圖、散點圖、折線圖、比較柱狀圖、氣泡圖、復式餅圖等。第三篇SPSS與數據整理與分析第八章SPSS軟件使用基礎 通過本章的學習和實驗,了解SPSS的運行環境、特點及主要功能。掌握SPSS的安裝、啟動、退出、主要界面設置、數據文件的建立與管理等操作,為進一步的實驗奠定基礎。8.1 SPSS軟件概述軟件概述8.1.1SPSS的發展與現狀 nSPSS的英文原名為:Statistical Package for Social Sciences,譯為社會科學統計軟件包。n2002年將英文全稱更改為:Statistical Product and Service Solutio
24、ns,譯為統計產品與服務解決方案。n 2009年,SPSS公司宣布重新包裝旗下的SPSS產品線,定位為預測統計分析軟件(Predictive Analytics Software)PASW,并與2009年7月被 IBM公司收購,因此此后的版本均已“IBM SPSS Statistics+數字序號”為全名。n注:IBM(國際商業機器公司)或萬國商業機器公司,簡稱IBM(International Business Machines Corporation)??偣驹诩~約州阿蒙克市公司,1911年創立于美國,是全球最大的信息技術和業務解決方案公司。10.1.2 Spss軟件的特點nSpssnSta
25、tistical Package for the Social Science即 “社會科學統計軟件包 ” 特點:除數據輸入需要鍵盤以外,其余操作大多是通過“菜單”、“圖形按鈕”、“對話框”等來完成。10.1.3SPSS的常用界面的常用界面n 數據編輯窗口、結果觀察窗口、對象編輯窗口、草稿輸出窗口、命令語句窗口和腳本編寫窗口。n 其中最常用的是數據編輯窗口、結果觀察窗口、對象編輯窗口三個窗口。 數據編輯窗口(Data Editor)用法簡介n數據編輯窗口進入:三種方式;n數據編輯窗口的組成:標題欄、工具欄、編輯欄、編輯區及狀態欄等n數據編輯窗口工具欄介紹n凍結數據表中的列 結果觀察(SPSS
26、Viewer)窗口簡介n窗口進入;n窗口的組成:標題欄、工具欄、導航欄、分析結果區。n結果觀察窗口工具欄介紹 對象編輯(SPSS Object)窗口簡介n窗口進入:右鍵方式、雙擊方式;n樞紐表(Pivoting Trays)窗口、圖形編輯(Chart Editor)窗口。nInteractive graph編輯狀態。 8.2 SPSS數據文件的建數據文件的建立與操作立與操作8.2.1 建立建立spss數據文件數據文件第一步,打開第一步,打開spss,進入數據編輯窗口(,進入數據編輯窗口(Data View)界面;)界面;第二步,定義變量與數據編碼,其中第二步,定義變量與數據編碼,其中變量名變量
27、名(name)、(變量標簽)、(變量標簽)label、變量值、變量值( values)三項內容的定義和設置必不可少;三項內容的定義和設置必不可少;第三步,在數據輸入模式下,用鍵盤將數據直接第三步,在數據輸入模式下,用鍵盤將數據直接輸入,或打開其他格式的數據文件,輸入前點輸入,或打開其他格式的數據文件,輸入前點擊視圖(擊視圖(View)菜單中的)菜單中的 值標簽值標簽(Value Value LabelsLabels)選項選項;第四步,保存數據文件,待分析使用。第四步,保存數據文件,待分析使用。Spss變量名的定義規則n變量名中不能有空格;變量名中不能有空格;n變量名允許有變量名允許有64字符(
28、字符(32個漢字),首個漢字),首寫必須是字母或漢字,除首寫自字符外寫必須是字母或漢字,除首寫自字符外其他可以是字母、數字、小數點或其他其他可以是字母、數字、小數點或其他任意非標點符號的字符;任意非標點符號的字符;n避免避免“.”、“-”作為變量名結尾。作為變量名結尾。n不區分大小寫。不區分大小寫。Spss的變量類型的變量類型n數值型:標準數值型、帶逗號的數值型數值型:標準數值型、帶逗號的數值型、圓點數值型、科學計數法、帶美元符號、圓點數值型、科學計數法、帶美元符號的數值型、自定義類型。的數值型、自定義類型。n字符型:字符串可以包括數字、字母、字符型:字符串可以包括數字、字母、特殊字符,最長為
29、特殊字符,最長為32767個字符。個字符。n日期型:日期型:16種。種。變量標簽與值標簽變量標簽與值標簽n變量標簽與值標簽,用于變量名和變量值的輔變量標簽與值標簽,用于變量名和變量值的輔助說明。助說明。n變量標簽(變量標簽(Variable Labels)在統計分析結)在統計分析結果中,可以在與變量名相對應的位置顯示該變果中,可以在與變量名相對應的位置顯示該變量的標簽,或直接以變量標簽代替變量名顯示,量的標簽,或直接以變量標簽代替變量名顯示,有助于理解和分析輸出結果。有助于理解和分析輸出結果。n變量值標簽(變量值標簽(Value Labels),分類變量經),分類變量經常需要定義值的標簽。對于
30、提高數據錄入效率常需要定義值的標簽。對于提高數據錄入效率非常有用。非常有用。輸入數據輸入數據n輸入數據的方法輸入數據的方法n直接錄入直接錄入n復制粘貼復制粘貼n直接打開直接打開職工序號職工序號性別性別婚姻狀況婚姻狀況年齡年齡基本工資基本工資1男男13021002女女12822503女女13529004女女14030055男男14431006女女22119807男男15036008女女2191900企業職工情況模擬資料企業職工情況模擬資料數據文件建立舉例數據文件建立舉例8.2.2 數據文件的編輯與管理數據文件的編輯與管理n插入變量與刪除變量;n插入記錄與刪除記錄;n數據的剪貼、復制和粘貼;n撤銷
31、操作。n查看文件和變量信息 依次單擊【文件(依次單擊【文件(F)】)】【顯示數據文【顯示數據文件信息(件信息(I)】)】【工作文件(【工作文件(W)】)】n數據文件的打開與保存;數據文件的打開與保存;n數據庫文件的轉換。數據庫文件的轉換。n數據的審核與修改數據的審核與修改 數據輸入錯誤的類型:數值定義范圍內的數據輸入錯誤的類型:數值定義范圍內的錯誤、錯誤、數值定義范圍外的錯誤、邏輯錯誤數值定義范圍外的錯誤、邏輯錯誤。 第二類錯誤的檢查:數據排序:第二類錯誤的檢查:數據排序: 第三類錯誤,邏輯錯誤的檢查與糾正:編制第三類錯誤,邏輯錯誤的檢查與糾正:編制交叉頻數分布表。交叉頻數分布表。數據的審核與
32、修改數據的審核與修改n數據的合并數據的合并 (復制、粘貼)(復制、粘貼)第九章SPSS在數據整理中的應用 9.1 數據預處理的數據預處理的SPSS應用應用 數據預處理是指在數據正式整理之前對數據進行的選擇、排序、轉置、重組、合并、拆分、加權處理、分類匯總、變量計算等數據處理工作。其目的在于為整理和分析做好準備。通過本節的學習,能夠利用SPSS中的“數據”菜單和“轉換”菜單提供的一些專用功能實現數據的預處理。9.1.1數據文件的處理數據文件的處理1、數據的合并、數據的合并 選擇【數據(選擇【數據(D)】)】【合并文件【合并文件(G)】【添加變量添加變量(V)】或或添加添加個案個案(C)】2、數據
33、文件分組、數據文件分組 依次選擇【數據依次選擇【數據(D)】【拆分文件【拆分文件(F)】3、加權處理、加權處理 選擇【數據(選擇【數據(D)】)】【加權個案(【加權個案(W)】)】數據文件的處理數據文件的處理(續)(續)4、數據文件的結構重組、數據文件的結構重組 依次選擇【數據(依次選擇【數據(D)】)】【重組(【重組(R)】)】9.1.2 變量處理變量處理1、計算變量、計算變量 依次選擇【轉換(依次選擇【轉換(T)】)】【計算變量(【計算變量(C)】)】2、變量值重新編碼、變量值重新編碼 依次選擇【轉換(依次選擇【轉換(T)】)】【重新編碼為不同【重新編碼為不同變量(變量(R)】)】3、建立
34、變量集合、建立變量集合 選擇菜單【實用程序(選擇菜單【實用程序(U)】)】【定義變量集【定義變量集(E)】)】Spss函數n根據函數功能和處理的變量類型,根據函數功能和處理的變量類型,SPSS函數函數大致可分為:算術函數、統計函數、分布函數大致可分為:算術函數、統計函數、分布函數、邏輯函數、字符串函數、缺失值函數、日期、邏輯函數、字符串函數、缺失值函數、日期函數和其它函數。函數和其它函數。9.2 數據整理的數據整理的SPSS應用應用 數據整理就是對數據進行分類分組,并統計各組的頻數和頻率的過程。不同類型的數據,整理所采用的方法也不同。對定類數據和定序數據主要是做分類整理;對定距數據和定比數據則
35、主要做分組整理。通過本節的學習,能夠利用SPSS中的“轉換(T)”和“分析(A)”菜單完成數據的加工整理。 1、定類數據和定序數據統稱為品質數據。品質數據定類數據和定序數據統稱為品質數據。品質數據整理主要是對數據做分類處理,數據分類結果通常表整理主要是對數據做分類處理,數據分類結果通常表現為頻數分布表和頻數分布圖?,F為頻數分布表和頻數分布圖。 2、單一變量次數分布表的編制單一變量次數分布表的編制 依次選擇:依次選擇:【分析(【分析(A)】)】【描述統計(【描述統計(D)】)】【頻率(【頻率(F)】)】 3、雙變量交互次數分布表的編制雙變量交互次數分布表的編制 依次選擇:依次選擇:依次選擇【分析
36、(依次選擇【分析(A)】)】【描述統計【描述統計(D)】)】【交叉表交叉表(C)】)】 4、品質數據頻數分布圖:、品質數據頻數分布圖: 條形圖和餅圖條形圖和餅圖 9.2.1 品質數據整理品質數據整理1、數值型數據整理就是對數值型數據進行分組處理的過數值型數據整理就是對數值型數據進行分組處理的過程。所謂數據分組,就是根據統計研究的需要,將數程。所謂數據分組,就是根據統計研究的需要,將數據按照某種特征或標準分成不同的組別。據按照某種特征或標準分成不同的組別。2、單項式次數分布表的編制、單項式次數分布表的編制(同品質數據整理)(同品質數據整理)3、組距式次數分布表的編制組距式次數分布表的編制 方法一
37、:運用重新編碼過程;方法一:運用重新編碼過程; 依次選擇【轉換(依次選擇【轉換(T)】)】【重新編碼為不同變量(【重新編碼為不同變量(R)】)】對分組結果的取對分組結果的取值范圍進行定義值范圍進行定義 方法二:運用可離散化過程。方法二:運用可離散化過程。4 4、數值型數據頻數分布圖:直方圖與莖葉圖、數值型數據頻數分布圖:直方圖與莖葉圖9.2.2 數值型數據整理數值型數據整理9.3 調查調查數據整理數據整理 在所有數據分析軟件中,SPSS的調查數據分析功能具有明顯的優勢,該軟件所設置的多選題處理模塊,為調查問卷中多選題的分析提供了方便而快捷的工具。通過本節,掌握問卷調查數據的整理內容、基本方法和
38、相應的SPSS操作技巧。n1、問卷數據整理的內容n 一是頻數統計;二是交叉分析。n2、問卷數據的錄入技巧 單選題的錄入:一個問題占一列。 多選題的錄入:需要對問題進行分解,方法通常有兩種:n第一,多選項二分法(Multiple Dichotomies Method)。n第二,多選項分類法(Multiple Category Method)。n3、問卷數據處理需要使用的SPSS過程n“頻率(F)”、“交叉表(C)”和“多重響應(U)”。9.3.1問卷調查數據整理基本問題問卷調查數據整理基本問題 1、單選題整理:頻率統計(同一般數據整理)、單選題整理:頻率統計(同一般數據整理) 2、多項選擇題的整
39、理(多重響應分析)、多項選擇題的整理(多重響應分析) (1)將多選題的各選項定義為一個數據集。)將多選題的各選項定義為一個數據集。即:即:依次選擇依次選擇【分析(分析(A)】【多重響應多重響應(U)】【定義變量集(定義變量集(D)】 (2)頻率分析:頻率分析:依次選擇【分析(依次選擇【分析(A)】)】 【多重響應【多重響應(U)】【頻率(【頻率(F)】)】 (3)交叉分析:)交叉分析:依次選擇依次選擇【分析(分析(A)】 【多重響應多重響應(U)】【交叉表(交叉表(C)】9.3.2調查數據整理的操作步驟調查數據整理的操作步驟第十章SPSS在基礎統計分析中的應用 10.1數據特征的數據特征的SP
40、SS測定測定 對整理好的數據,通過描述性分析挖掘數據所表現的特征是統計分析中最基本的工作。SPSS軟件的描述性統計分析功能集中在“描述統計”菜單中。主要包括:“描述(D)”、“探索(E)”和比率(R)等過程。通過本節學習,熟練掌握使用SPSS軟件進行描述性統計分析的基本方法和操作技巧,并能對SPSS輸出的描述性統計量給出合理的解釋。 一、一、描述統計量包括三類:即反映數據集中趨勢的統計量、反映數據離散程度的統計量和反映數據分布狀態的統計量。 二、二、 SPSS軟件的“頻率(F)”、“描述(D)”、“探索(E)”、“均值(M)”過程,以及報告菜單均可以完成描述統計量的計算,其中“描述(D)”過程
41、使用最為方便。其步驟為: 依次選擇依次選擇【分析(【分析(A)】)】【描述統計】【描述統計】 【描【描述(述(D)】)】10.1.1計算描述統計量計算描述統計量 一、SPSS的“探索(E)”分析過程是對變量進行深入和詳盡統計分析的重要工具,它在一般描述性統計指標的基礎上,增加了關于數據其他特征的文字與圖形描述,如莖葉圖、箱圖等,分析結果更加細致全面,有助于用戶深入理解和分析數據的分布特征。二、箱線圖與莖葉圖通過箱形圖描述數據分布;通過莖葉圖描述頻數分布。三、操作步驟 依次選擇【分析(依次選擇【分析(A)】)】【描述統計】【描述統計】【探索【探索(E)】10.1.2探索性分析探索性分析一、相對數
42、分析也稱為相對指標分析,是通過計算兩個相互聯系的總量指標之比值,反映現象發展過程的程度、結構、速度、密度和普遍程度等。二、二、利用SPSS進行相對數分析,是通過“比率(R)”分析工具完成的。其步驟為: 依次選擇依次選擇【分析【分析(A)】【描述統計】【描述統計】【比【比率率(R) 】10.1.3相對數分析相對數分析10.2 抽樣估計的抽樣估計的SPSS實現實現 統計研究的目的是分析說明某一現象總體的數量特征。但許多場合只能從總體中抽取一個樣本作為總體的代表,對樣本進行調查,再根據抽樣分布的原理,利用樣本資料對總體的數量特征進行科學的估計與推斷。SPSS中沒有專門的參數估計過程,而是將參數估計的
43、功能融入到不同的分析過程中。通過本章學習,能夠利用SPSS提供的相關功能完成數據的抽樣和參數估計。 抽樣推斷就是根據樣本統計量對總體的有關數量特征做出估計。所以在對總體指標(參數)進行推斷之前,首先要抽取樣本。利用SPSS軟件抽取隨機樣本的基本步驟為: 依次選擇【數據(依次選擇【數據(D)】)】【選擇個案【選擇個案】 10.2.1 抽取樣本抽取樣本 點估計,也叫定值估計,就是直接以樣本統計量 來估計總體參數。當已知一個樣本的觀察值時便可得到總體參數的一個估計值。點估計既是抽樣估計的方法之一,也是區間估計的重要基礎。運用SPSS軟件對總體參數進行點估計的基本步驟為: 選擇菜單【分析(選擇菜單【分
44、析(A)】)】【描述統計】【描述統計】【探【探索(索(E)】 10.2.2 點估計點估計 區間估計不僅以樣本估計量為依據,而且考慮了估計量的分布,所以它能給出所作估計的精度,也能說明估計結果的把握程度,是參數估計的主要方法。運用SPSS進行總體均值、方差、標準差和總體比例區間估計的基本步驟為: 依次選擇【分析(依次選擇【分析(A)】)】【描述統計】【描述統計】【描述(描述(D)】,進一步,進一步在主對話框中,單擊【在主對話框中,單擊【Bootstrap(B) 】10.2.3 區間估計區間估計10.3假設檢驗假設檢驗的的SPSS實現實現 假設檢驗是在小概率原理的基礎上,以樣本統計量的值來推斷總體
45、參數的一種統計推斷方法。假設檢驗有兩種情況:一是當總體分布已知時,根據樣本數據對總體分布的統計參數進行推斷,這叫做參數假設檢驗,簡稱參數檢驗;二是當總體分布未知時,根據樣本數據對總體分布形式或特征進行推斷,這叫做非參數假設檢驗。本節主要介紹參數假設檢驗的SPSS應用。包括但樣本t檢驗、兩獨立樣本t檢驗和兩配對樣本t檢驗。 單樣本t檢驗是利用來自某一個正態總體的樣本數據,來推斷該總體的均值是否與指定的檢驗值之間存在顯著差異。使用SPSS進行單樣本t檢驗的基本步驟為: 依次選擇【分析(依次選擇【分析(A)】)】【比較均值(【比較均值(M)】)】【單樣本【單樣本T檢驗(檢驗(S)】)】10.3.1單
46、樣本單樣本t檢驗檢驗 兩個獨立樣本t檢驗是利用來自兩個正態總體的兩個獨立樣本的數據來推斷兩個總體的均值是否存在顯著差異的一種統計推斷方法。通過本實l利用SPSS進行兩個獨立樣本t檢驗的基本步驟為: 依次選擇【分析(依次選擇【分析(A)】)】【比較均值(【比較均值(M)】)】【獨立樣本【獨立樣本T檢驗(檢驗(T)】)】10.3.2兩個獨立樣本兩個獨立樣本t檢驗檢驗 配對樣本t檢驗是利用來自兩個正態總體的配對樣本數據來推斷兩個總體均值是否存在顯著性差異。它與獨立樣本t檢驗的主要區別是樣本必須匹配。即兩組樣本的樣本容量相同;兩組樣本的觀測值先后順序一一對應。運用SPSS完成配對樣本t檢驗的基本步驟為
47、: 依次選擇【分析(依次選擇【分析(A)】)】【比較均值(【比較均值(M)】【配對樣本【配對樣本T檢驗(檢驗(P)】)】10.3.3配對樣本配對樣本t檢驗檢驗10.4 方差分析方差分析的的SPSS實現實現 方差分析(Analysis of Variance,ANOVA)是研究分類型自變量對數值型因變量影響的一種統計方法。它是通過檢驗各總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。根據分析中分類自變量的多少,方差分析可分為單因素方差分析和多因素方差分析。通過本章學習,加深對方差分析原理的理解,并在此基礎上熟練掌握使用SPSS進行方差分析的方法和步驟。 當方差分析中只涉及一個分
48、類自變量時稱為單因素方差分析。單因素方差分析研究的是一個分類型自變量對一個數值型因變量的影響。運用SPSS軟件進行單因素方差分析的基本步驟為: 依次選擇【分析(依次選擇【分析(A)】)】【比較均值(【比較均值(M)】)】【單因素【單因素ANOVA】10.4.1單因素方差分析單因素方差分析 多因素方差分析用來研究兩個及兩個以上分類變量是多因素方差分析用來研究兩個及兩個以上分類變量是否對觀測變量產生顯著影響。多因素方差分析不僅能夠否對觀測變量產生顯著影響。多因素方差分析不僅能夠分析多個因素對觀測變量的獨立影響,而且能夠分析多分析多個因素對觀測變量的獨立影響,而且能夠分析多個因素的交互作用對觀測變量
49、產生的顯著影響。在多因個因素的交互作用對觀測變量產生的顯著影響。在多因素方差分析中,兩因素方差分析最為常見。素方差分析中,兩因素方差分析最為常見。利利用用SPSS軟軟件進行兩因素方差分析的件進行兩因素方差分析的基本基本步驟步驟為:為: 依次選擇【分析(依次選擇【分析(A)】)】【一般線性模型(【一般線性模型(G)】)】【單變量(【單變量(U)】)】10.4.2無交互作用的無交互作用的多因素方差分析多因素方差分析10.5 相關與回歸分析相關與回歸分析的的SPSS實現實現 相關與回歸分析是研究現象之間相關關系的重要方法。相關分析用于研究具有相關關系的變量之間相互關系的密切程度,回歸分析則是在相關分
50、析的基礎上,通過建立回歸方程分析相關變量之間的一般數量變動關系,即當自變量發生一個單位的變化時,因變量平均會發生多大的變化。通過本章學習,掌握使用SPSS軟件進行相關與回歸分析基本方法和操作步驟。 相關分析是對具有相關關系的變量之間相互關系的描述和相關分析是對具有相關關系的變量之間相互關系的描述和度量,其方法主要有圖表法和指標法兩種。而指標法則是度量,其方法主要有圖表法和指標法兩種。而指標法則是通過計算相關系數和相關指數,精確的描述變量之間相互通過計算相關系數和相關指數,精確的描述變量之間相互關系的密切程度。關系的密切程度。 1、圖表法是通過繪制散點圖的方式,直觀地反映變量、圖表法是通過繪制散
51、點圖的方式,直觀地反映變量之間相關關系的方向和程度,繪制散點圖的之間相關關系的方向和程度,繪制散點圖的SPSS操作步驟操作步驟為:為:10.5.1相關分析相關分析相關分析(續)nStep打開數據文件,依次選擇【圖形(G)】【舊對話框(L)】【散點/點狀(S)】;nStep選擇“矩陣分布”圖表類型,點擊【定義】按鈕;nStep從左邊的變量框中,將變量Y、X1、X2全部移入“矩陣變量(M)框中。點擊【確定】按鈕,相關分析(續) 2、指標法則是通過計算相關系數和相關指數,精確、指標法則是通過計算相關系數和相關指數,精確的描述變量之間相互關系的密切程度。利用的描述變量之間相互關系的密切程度。利用SPS
52、S計算計算相關系數的步驟為:相關系數的步驟為: nStep依次選擇【分析(A)】【相關(C)】【雙變量(B)】,nStep從左上方的變量框中,將變量Y、X1、X2全部移入“變量(V)框中。在“相關系數”框中Pearson復選框前打鉤,在顯著性水平框中點選“雙側檢驗(T)”,并在最下方的“標記顯著性水平相關(F)”前打鉤。nStep點擊【確定】按鈕,完成操作。 回歸分析(回歸分析(Regression analysis)是通過建立回歸模)是通過建立回歸模型(型(Regression model)分析相關關系變量之間的一般)分析相關關系變量之間的一般數量變動關系。根據變量之間的變動關系形式,回歸分
53、析數量變動關系。根據變量之間的變動關系形式,回歸分析分為線性回歸分析和曲線回歸分析。線性回歸分析根據因分為線性回歸分析和曲線回歸分析。線性回歸分析根據因變量的多少又分為一元線性回歸分析和多元線性回歸分析變量的多少又分為一元線性回歸分析和多元線性回歸分析。 利用利用SPSS建立回歸方程的步驟如下建立回歸方程的步驟如下 :10.5.2 線性回歸線性回歸n打開數據文件,依次選擇【分析(A)】【回歸(R)】【線性(L)】,從左邊的待分析變量框中,將變量Y移入“因變量(D)框中,將變量X移入“自變量(I)框;nStep單擊【統計量(S)】按鈕,在彈出統計量設置子對話框。依次勾選如下幾個復選框:“估計(E
54、)”、“置信區間”、“協方差矩陣(V)”、“模型擬合度(M)”、“Durbin-Watson(U)”;單擊【繼續】;nStep點擊【確定】按鈕,完成操作。 (一)(一)對于變量之間的非線性相關,除了通過繪制散點對于變量之間的非線性相關,除了通過繪制散點圖的方式粗略地考察相關的形式外,主要還是通過建立曲圖的方式粗略地考察相關的形式外,主要還是通過建立曲線回歸方程進行分析。線回歸方程進行分析。 (二)建立曲線回歸模型時,首先要解決的問題是確定變(二)建立曲線回歸模型時,首先要解決的問題是確定變量之間關系的類型和形式。對于變量之間關系類型和形式量之間關系的類型和形式。對于變量之間關系類型和形式的確定
55、,除了根據一定的專業知識和實踐經驗來判斷外,的確定,除了根據一定的專業知識和實踐經驗來判斷外,繪制散點圖,并觀察散點圖的形狀和特點是一種簡單而直繪制散點圖,并觀察散點圖的形狀和特點是一種簡單而直觀的方法。觀的方法。 (三)利用(三)利用SPSS建立曲線回歸方程的步驟如下建立曲線回歸方程的步驟如下 :10.5.3 曲線回歸曲線回歸Step打開數據文件,依次選擇【分析(A)】【回歸(R)】【曲線估計(C)】,進入曲線估計對話框。將商品流通費用率選入“因變量(D)”框,將商品銷售額 選入自變量欄的“變量(V)”框。 Step在“模型“框中,勾選擬配合的曲線模型。Step勾選“在等式中包含常量(I)”
56、和“根據模型繪圖(O)”選項。Step選擇“顯示ANOVA表格(Y)”項,表示輸出各個曲線擬合模型檢驗的方差分析表和各回歸系數顯著性檢驗結果。Step單擊【保存】按鈕,在彈出的對話框中選擇需要保存的統計量:“預測值(P)”、“殘差”和“預測區間(D)”。單擊【繼續】按鈕,返回主對話框。Step單擊【確定】按鈕,完成操作。10.6列聯分析列聯分析的的SPSS實現實現 列聯分析是用于研究品質變量之間相互關系的主要方法。當數值型變量經過了離散化處理,列聯分析也可用來測定品質變量與數值型變量之間的依存關系。列聯分析主要包括列聯表分析、卡方檢驗和關聯度測量三個方面。通過本節學習,熟練掌握運用SPSS軟件
57、完成列聯分析的基本操作,并能對輸出結果做準確的解釋和分析。第一步,打開數據文件,依次選擇【分析(第一步,打開數據文件,依次選擇【分析(A)】)】【描【描述統計】述統計】 【交叉表(【交叉表(C)】)】;第二步,將第二步,將被影響的被影響的變量和變量和原因變量原因變量分別移入分別移入“行行(s)”和和“列(列(C)”框中框中;第三步,第三步,單擊【單元格(單擊【單元格(E)】)】 按鈕,在按鈕,在“計數計數”框中框中選擇選擇“觀察值(觀察值(O)”選項;在百分比框中選擇選項;在百分比框中選擇“列(列(C)”選項選項;第四步;第四步;單擊【統計量(單擊【統計量(S)】)】”按鈕按鈕,同時選擇同時選
58、擇“卡方卡方(H)”、“相依系數(相依系數(O)”和和“Phi 和和Cramer變量變量”選項。選項。利用利用SPSS進行列聯分析的基本步驟:進行列聯分析的基本步驟:第十一章SPSS高級統計分析11.1聚類分析聚類分析的的SPSS實現實現聚類分析介紹方法依據:“物以類聚,人以群分 ”方法特征:聚類分析是一種建立分類的多元統計方法,它能夠將一批樣本(或變量)根據其諸多數據特征,按照在性質上的親疏程度在沒有先知知識的情況下進行自動分類,產生多個分類結果。類內部的個體在特征上具有相似性,不同類間個體特征的差異性較大。聚類過程中親疏程度的度量:計算個體間的距離,計算方法因變量類型不同而不同。 定距型變量個體間距離的計算:有7種方法,其中最常用的是歐氏距離(Euclidean distance); 計數變量個體間距離的計算:卡方(Chi-Square measure)距離、Phi方( Phi-Square measure)距離; 二值變量個體間距離的計算:簡
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 設立專項獎懲管理制度
- 設計公司薪金管理制度
- 訪客接待前臺管理制度
- 診所醫保病案管理制度
- 診所老板日常管理制度
- 試劑管理庫存管理制度
- 財務進項發票管理制度
- 貨場大門車輛管理制度
- 貨物防盜措施管理制度
- 游戲培訓協議書范本模板
- 托克遜縣寶源長石礦廠新疆托克遜縣桑樹園子南山銅礦3萬噸/年采礦項目環評報告
- 陜西省西安高中2025屆高二化學第二學期期末達標檢測試題含解析
- 2025年江西報業傳媒集團有限責任公司招聘筆試沖刺題(帶答案解析)
- (2025)《公共基礎知識》試真題庫與答案
- 江西省南昌市第一中學教育集團2023-2024學年八年級下學期數學期末試卷(含答案)
- 瓦斯抽采考試題庫及答案
- 教研員考試題庫及答案
- 關于衛生院“十五五”發展規劃(完整本)
- 地生中考模擬試題及答案
- 中醫調理高血壓課件
- 商業招商運營管理制度
評論
0/150
提交評論