2.spss軟件使用方法課件_第1頁
2.spss軟件使用方法課件_第2頁
2.spss軟件使用方法課件_第3頁
2.spss軟件使用方法課件_第4頁
2.spss軟件使用方法課件_第5頁
已閱讀5頁,還剩68頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統計分析軟件SPSS應用方法2.spss軟件使用方法SPSS一、SPSS概述二、SPSS數據創建三、SPSS統計分析1、基本統計分析2、方差分析3、相關分析4、聚類分析2.spss軟件使用方法1SPSS簡介SPSSStatisticalPackagefortheSocialSciences社會科學統計軟件包StatisticalProductandServiceSolutions統計產品與服務解決方案68年開發,75年成立SPSS公司,2009年IBM收購,目前到IBMSPSS20.0版本次講解應用IBMSPSSforWindows19.02.spss軟件使用方法一、SPSS概述1、SPSS簡介2、SPSS窗口2.spss軟件使用方法1SPSS簡介SAS和SPSSSAS:為專業統計分析人員設計,功能強大,靈活多樣。SPSS:非專業人士,操作簡便,好學易懂,簡單實用。“易學易用易普及”大多數操作可通過鼠標拖曳、點擊“菜單”、“按鈕”和“對話框”來完成。無需掌握統計分析的各種復雜的數學運算過程,只需掌握各種方法的應用,分析結果的解釋。功能強大完整的數據輸入、編輯、統計分析、報表、圖形制作等功能。自帶11種類型136個函數。提供從簡單的統計描述到復雜的多因素統計分析方法。能非常方便地與其他軟件的數據進行轉換圖表功能強大,輸出結果美觀漂亮2.spss軟件使用方法

2SPSS窗口標題欄菜單欄工具欄

編輯欄 變量名欄觀測序號 窗 口 切 換 標 簽2.spss軟件使用方法2SPSS窗口變量序號名稱可變觀測序號變量序號變量屬性名稱2.spss軟件使用方法結果輸出窗口

2SPSS窗口導航窗口2.spss軟件使用方法二、統計數據創建數據屬性及定義、編輯SPSS數據創建案例:SPSS數據創建2.spss軟件使用方法1數據屬性及定義編輯SPSS數據特點:結構化(數據內容、數據結構)變量名、變量類型、變量名標簽、變量值標簽、缺失值的定義、度量的尺度、及數據的顯示屬性(顯示寬度、列寬度、對齊方式)2.spss軟件使用方法不超過8個字符、4個漢字變量名必須唯一,并且不區分大小寫如不指定變量名,則系統默認變量名以VAR開頭后面跟5個數字。如VAR00001、VAR0002等

1.1變量名(名稱)數據視圖變量視圖2.spss軟件使用方法1.2變量類型變量取值的類型數值型、字符型(不能進行算術運算)、日期型2.spss軟件使用方法1.3標簽標簽是對變量名的進一步解釋名稱限制字符不超過8個,標簽可達120個字符2.spss軟件使用方法1.4值值是對變量取值含義的進一步解釋2.spss軟件使用方法1.5缺失值缺失值兩種情況:數據中存在漏填數據數據中存在明顯錯誤或明顯不合理的數據(如年齡130)如果直接進行數據分析,SPSS將把缺失數據作為正常數據,造成非常大的誤差缺失數據處理步驟:1、指定缺失數據,指明哪些數據屬于缺失數據空缺數據,首先填一個特定標記數據(如99999,區別于該變量其他非缺失數據)2、統計分析時對缺失數據進行一定處理選擇缺失數據處理方法2.spss軟件使用方法2.SPSS數據創建直接錄入1、定義數據屬性;2、輸入數據打開現有數據(sav、excel、SAS、txt)2.spss軟件使用方法2.SPSS數據創建直接錄入1、定義數據屬性;2、輸入數據打開現有數據(sav、excel、SAS、txt)2.spss軟件使用方法2.SPSS數據創建2.spss軟件使用方法3.案例:SPSS數據創建1、定義變量屬性2、讀取excel數據文件2.spss軟件使用方法三、SPSS統計分析SPSS基本統計分析方差分析相關分析線性回歸分析聚類分析2.spss軟件使用方法1、基本統計分析基本統計分析,描述性統計分析是統計分析的第一步,做好這第一步是下面進行正確統計推斷的先決條件。SPSS的許多模塊均可完成描述性分析,但專門為該目的而設計的幾個模塊則集中在描述菜單中,包括:2.spss軟件使用方法1.1頻數分析頻數分析目的:基本統計分析往往從頻數分析開始。通過頻數分析能夠了解變量取值的狀況,對把握數據的分布特征是非常有用的。基本任務(1)編制頻數分布表頻數:即變量值落在某個區間(或某個類別)中的次數百分比:即各頻數占總樣本數的百分比有效百分比:即各頻數占有效樣本數的百分比,有效樣本數=總樣本-缺失樣本數累計百分比:即各百分比逐級累加起來的結果。最終取值為100。(2)繪制統計圖2.spss軟件使用方法1.1頻數分析頻數分析的基本操作(1)分析—描述統計—頻率(2)將頻數分析變量選擇到變量框中(3)單擊表格按鈕選擇繪制統計圖形,選擇餅圖2.spss軟件使用方法1.1頻數分析2.spss軟件使用方法1.1頻數分析輸出結果2.spss軟件使用方法1.2描述分析描述分析目的:獲取數據的均值、標準差、峰度等數據,進一步把握數據的集中趨勢、離散程度和分布形狀。基本描述統計量刻畫集中趨勢的統計量刻畫離散程度的統計量刻畫分布形態的統計量2.spss軟件使用方法1.2描述分析刻畫集中趨勢的統計量集中趨勢指一組數據向某一中心值靠攏的傾向。計算刻畫集中趨勢的統計量正是要尋找能夠反應數據一般水平的“代表值”或“中心值”。常用統計量:均值、中位數、眾數均值:即算術平均數,是反映某變量所有取值的集中趨勢或平均水平的指標。如某企業職工的平均月收入。中位數:即一組數據按升序排序后,處于中間位置上的數據值。眾數:即一組數據中出現次數最多的數據值。2.spss軟件使用方法1.2描述分析刻畫離散程度的統計量離散程度是指一組數據遠離其“中心值”的程度。

如果數據都緊密地集中在“中心值”的周圍,數據的離散程度較小,說明這個“中心值”對數據的代表性好;相反,如果數據僅是比較松散地分布在“中心值”的周圍,數據的離散程度較大,則此“中心值”說明數據特征是不具有代表性的。常用統計量:全距、方差、標準差全距:也稱極差,是數據的最大值與最小值之間的絕對離差。2.spss軟件使用方法1.2描述分析刻畫分布形態的描述統計量數據分布形態主要指數據分布是否對稱,偏斜程度如何,分布陡峭程度等。常用統計量:偏度、峰度偏度:描述變量取值分布形態對稱性的統計量。當分布為對稱分布時,正負總偏差相等,偏度值等于0;當分布為不對稱分布時,正負總偏差不相等,偏度值大于0或小于0。偏度值大于0表示正偏差值大,稱為正偏或右偏;偏度值小于0表示負偏差值大,稱為負偏或左偏。偏度絕對值越大,表示數據分布形態的偏斜程度越大。峰度:描述變量取值分布形態陡峭程度的統計量。當數據分布與標準正態分布的陡峭程度相同時,峰度值等于0;峰度大于0表示數據的分布比標準正態分布更陡峭,為尖峰分布;峰度小于0表示數據的分布比標準正態分布平緩,為平峰分布。2.spss軟件使用方法1.2描述分析計算基本描述統計量的操作(1)分析—描述統計—描述(2)將分析變量選擇到變量框中(3)單擊選項按鈕指定基本統計量2.spss軟件使用方法1.2描述分析2.spss軟件使用方法2、方差分析方差分析概述背景案例統計學原理相關統計量SPSS操作SPSS結果解讀方差分析案例2.spss軟件使用方法2.1方差分析概述2.1.1背景案例影響農作物產量的因素可能有多個,如品種、施肥量、地域特征等。在眾多的因素中,有些因素會對產量有明顯的影響,有些因素的影響不大。因此,找到中影響因素中起重要的和關鍵作用的因素是非常重要的。進一步,在掌握了關鍵因素后,如品種、施肥量等,還需要對不同品種、不同施肥量的產量進行比較,研究究竟哪個品種的產量高,施肥量究竟多少最為合適。在制定廣告宣傳策略時,不同方案所獲得的廣告效果可能是不一樣的。廣告效果可能會受到廣告形式、地區規模、播放時間段、播放頻率等因素的影響。需要研究在影響廣告效果的眾多因素中,哪些因素是主要的,哪些是次要的,哪些因素水平是最合理的。對這種類似問題的研究可以通過方差分析來實現。2.spss軟件使用方法2.1方差分析概述2.1.2方差分析相關概念觀測變量:農作物產量、廣告效果因素(控制變量):品種、施肥量、播放時間段等因素水平:因素的不同類別,如甲品種、乙品種就是品種這一變量的兩個水平。單因素方差分析、多因素方差分析2.spss軟件使用方法2.1方差分析概述2.1.3方差分析統計學原理觀測變量取值變化原因:1、控制變量;2、隨機變量如果相對于隨機變量引起的觀測值差異,控制變量引起的觀測值差異較大,則說明控制變量對觀測變量有顯著影響。在統計學中,控制變量和隨機變量引起的差異可以分別用一個統計量來表示。單因素方差分析中,分別用SSA、SSE來表示。SSA:組間差異(組間離差平方和),主要是由控制變量的不同水平造成的差異;SSE:組內差異(組內離差平方和),主要是由隨機變量引起的差異。SSA+SSE=SSTSST:總差異(總離差平方和)方差分析任務:判定SSA相對于SST(或SSE)的大小。SSA相對較大,則表明控制變量起到了顯著影響,若相對較小,則表明控制變量沒有顯著影響。2.spss軟件使用方法2.1方差分析概述2.1.3單因素方差分析統計學原理假設控制變量會對觀測值不會產生顯著影響,將總離差(SST)分解為組間離差平方和(SSA)和組內離差平方和(SSE)。比較SSA與SST的相對大小。SSA與SST的相對大小要受到樣本規模、控制變量水平數的影響,為消除這些因素的影響對SSA、SST要進行一定的處理(分別除以自由度),用統計量F來表示SSA的相對大小F==SSA/自由度組件均方差SSE/自由度總均方差方差分析-從觀測變量的部分取值推測觀測變量總體取值與隨機變量的關系。部分是否能夠代表總體情況?由于存在隨機抽樣和樣本數量較少等原因,通過分析樣本的出的結論不能直接用于總體。要進行假設檢驗。

F是隨機變量,服從一定的分布,其取值會因為具體的樣本的不同而不同。計算研究樣本的F值,即F的觀測值,并計算該F觀測值對應概率p值,如果p值很小(一般是小于0.05),說明F取到該觀測值的概率很小,是不可能發生的。則認為假設“控制變量對觀測值沒有顯著影響”是不對的,也就是,控制變量會對觀測變量產生顯著影響。2.spss軟件使用方法2.1方差分析概述2.1.4單因素方差分析基本假設:對總體分布的假設:總體服從正態分布各處理組總體方差相等(方差齊性或方差同質性)正態分布檢驗:根據大數定律和中心極限定理原理,假設滿足。方差齊性檢驗:對控制變量不同水平下觀測變量總體的方差是否相等進行假設檢驗,在SPSS中可以通過方差同質性檢驗進行。2.spss軟件使用方法2.2SPSS方差分析操作2.2.1方差分析數據形式離差分解時僅僅是對觀測水平這一列的數值進行分析,但是也要有存放控制變量的列。正確的數據格式是統計分析的前提。

觀測變量控制變量2.spss軟件使用方法2.2SPSS方差分析操作2.2.2SPSS操作步驟打開的數據格式分析——比較均值——單因素方差分析選擇觀測變量(因子)、控制變量(因變量)(只能選擇一個因子)選項,選擇“方差同質性檢驗”缺失值處理2.spss軟件使用方法2.3SPSS方差分析結果解讀

P值(顯著性)=0.515,遠大 于基準值0.05,說明假設“方 差齊性”正確,即控制變量不 同水平下各組的方差相同。

滿足方差分析的前提。

P值(顯著性)=0.000,遠小于基 準值0.05,說明假設“控制變量對觀 測變量沒有顯著影響,即廣告形式 對銷售額沒有顯著影響”正確,即控制變量不同水平下各組的方差相 同。結論:廣告形式對銷售額有顯著影響。2.spss軟件使用方法2.3SPSS方差分析結果解讀結論:廣告形式用報紙獲得的銷售額最高,宣傳品的效果最不好2.spss軟件使用方法3相關分析相關分析概述SPSS相關分析操作SPSS相關分析結果解讀SPSS相關分析案例2.spss軟件使用方法3.1相關分析概述家庭收入和支出、子女身高和父母身高的關系、一個人的身高和體重的關系?客觀事物之間關系:函數關系、統計關系函數關系:當一個或幾個變量取一定的值時,另一個變量有確定值與之相對應統計關系:非一一對應,當一個變量x取一定值時,另一變量y無法依確定的函數取唯一確定的值。相關分析:研究兩個變量相互關系的密切程度和變化趨勢,并用適當的統計指標描述。2.spss軟件使用方法3.1相關分析概述相關分析與方差分析的比較相同點:分析兩個變量之間是否有關系不同點:1、相關分析的兩個變量都是隨機變量(不能人為精確控制取值大小);回歸分析的控制變量是非隨機變量(其取值可以固定),觀測變量是隨機變量。2、相關分析的兩個變量都可以量化,可以用數值比較同一變量的不同取值的大小;回歸分析的觀測變量可以比較觀測值的大小,但是某些控制變量不能比較數值大小,如農作物品種。3、相關分析可以比較兩個變量的變化趨勢的異同,方差分析不能。4、相關分析的兩個變量一般都有眾多的不同取值,回歸分析的控制變量只有幾種可能的取值,可以根據控制變量的不同水平將觀測對象進行分組。2.spss軟件使用方法3.1相關分析概述相關分析工具:散點圖、數值散點圖:將數據以點的形式畫在直角坐標系上,通過觀察散點圖能夠直觀的發現變量間的相關關系及它們的強弱程度和方向。在實際分析中,散點圖經常表現出某些特定的形式。如絕大多數的數據類似于“橄欖球”的形狀,或集中形成一根“棒狀”,而剩余的少數數據點則零散地分布在四周。通常“橄欖球”和“棒狀”代表了數據對的主要結構和特征,可以利用曲線將這種主要結構的輪廓描繪出來,使數據的主要特征更突出。2.spss軟件使用方法3.1相關分析概述散點圖簡單散點圖:表示一對變量間統計關系的散點圖。矩陣散點圖:以矩陣形式在多個坐標軸上分別顯示多對變量間的統計關系。2.spss軟件使用方法

3.1相關分析概述矩陣散點圖:弄清各坐標軸所代表的變量。課題總數論文數專著數橫軸:從最底層一條向上依次為論文數、專注數、課題總數。縱軸:從最左側一條向右依次為課題總數、專注數、論文數。

課題總數 專著數 論文數2.spss軟件使用方法3.1相關分析概述相關系數以數值的方式精確的反映了兩個變量間線性相關的強弱程度。①相關系數r的取值在-1~+1之間;②r>0表示兩變量存在正的線性相關關系;r<0表示兩變量存在負的線性相關關系;③r=1表示兩變量存在完全正相關;r=-1表示兩變量存在完全負相關;r=0表示兩變量不存在相關,不代表兩變量之間不相關;④|r|>0.8表示兩變量有較強的線性關系;|r|<0.3表示兩變量之間的線性關系較弱。2.spss軟件使用方法3.1相關分析概述相關系數種類1.Pearson簡單相關系數(度量兩定距型變量的線性相關性)2.Spearman等級相關系數(度量定序變量間的線性相關關系)定序變量:區別等級次序的變量。定序變量能決定次序,例如文化程度可以分為大學、高中、初中、小學、文盲;年齡可以分為老、中、青。但是,定序變量在只具有大于或小于的性質,只能排列出它們的順序,而不能反映出大于或小于的數量或距離。比如大學究竟比高中高出多少,大學與高中之間的距離和初中與小學之間的距離是否相等,通常是沒有確切的尺度來測量的。定距變量:區別等級次序及其距離的變量。它除了包括定序變量的特性外,還能確切測量同一類別各個案高低、大小次序之間的距離,因而具有加與減的數學特質。2.spss軟件使用方法3.2SPSS相關分析操作3.2.1散點圖1、圖形-舊對話框-散點/點狀2、選擇散點圖類型3、制定X、Y軸變量或矩陣變量2.spss軟件使用方法3.2SPSS相關分析操作相關系數1、分析-相關-雙變量2、選擇變量(可選擇多個)3、選擇相關系數(可復選)2.spss軟件使用方法3.3SPSS結果解讀樣本相關系數假設“總體無線性相關”概率接近0,小于0.01,假設不對,即總體存在顯著線性相關2.spss軟件使用方法5、聚類分析聚類分析概述SPSS聚類分析操作SPSS聚類分析結果解讀SPSS聚類分析案例2.spss軟件使用方法5.1聚類分析概述5.1.1背景案例市場營銷中的市場細分和客戶細分問題。對客戶分類,可直接根據年齡、職業、收入、消費金額、喜好等方面進行分類,但存在主觀色彩,需要有豐富的行業經驗才能得到比較合理的客戶細分,否則得到的分組可能無法充分反映和展現客戶的特點,同一客戶小組中的客戶在某些方面的特征并不相似,而不同小組的客戶在某些方面卻又非常相似。這種客戶細分并沒有真正起到劃分客戶群的作用。為解決問題,客觀進行分類,應該從數據自身出發,充分利用數據進行客戶的客觀分組。使諸多特征相似的客戶分在同一組內,不相似的客戶分在不同的組。這時便可以采用聚類分析的方法。聚類分析是直接比較各事物之間的性質,將性質相近的歸為一類,將性質差別較大的歸入不同的類。聚類分析的原則是同一類中的個體有較大的相似性,不同類中的個體差異很大。通過分類,有利于我們抓住重點,從總體上去把握事物,找出解決問題的方法。2.spss軟件使用方法5.1聚類分析概述5.1.2聚類分析原理要做聚類分析,首先得按照聚類的目的,從對象中提取出能表現這個目的的特征指標;然后根據親疏程度進行分類。聚類分析是一種數值分類方法(即完全是根據數據關系)。要進行聚類分析就要首先建立一個由某些事物屬性構成的指標體系,或者說是一個變量組合。入選的每個指標必須能刻畫事物屬性的某個側面,所有指標組合起來形成一個完備的指標體系,它們互相配合可以共同刻畫事物的特征。簡單地說,聚類分析的結果取決于變量的選擇和變量值獲取的兩個方面。變量選擇越準確、測量越可靠,得到的分類結果越是能描述事物各類間的本質區別。2.spss軟件使用方法5.1聚類分析概述聚類分析是根據個體間的“親疏程度”對個體(樣本或變量)進行分類。“親疏程度”

度量方法——兩個角度:1、個體間的相似程度,通常用相關系數衡量;2、個體間的差異程度,通常通過某種距離衡量。不同的數據類型,所用距離類型不同。2.spss軟件使用方法5.1聚類分析概述5.1.3個體間距離度量方法(度量標準)變量類型不同,距離度量方法不同定距變量(區間變量)、計數變量、二分類變量2.spss軟件使用方法

5.1聚類分析概述5.1.3個體間距離度量標準

定距變量(區間變量)身高、體重連續變量可比較大小,可進行算術運算,衡量差值大小度量方法:歐氏距離、平方歐氏距離、夾角余弦等;默認2.spss軟件使用方法5.1.3個體間距離度量標準

計數(頻數)變量 非連續

如選修課程數,只能取整數度量標準:卡方測量;

Phi方度量默認2.spss軟件使用方法

5.1聚類分析概述5.1.3個體間距離度量標準二值變量(二分類)

變量取值有兩種可能, 分別表示兩種情況

如性別(1,2),婚姻狀況(1,2)度量標準:二元歐氏距離平方默認2.spss軟件使用方法5.1聚類分析概述5.1.4聚類分析方法:系統聚類(層次聚類)、K-均值聚類。 層次聚類:聚類過程按照一定層次進行。根據聚類對象的不同分為樣品聚類(Q聚類)和變量聚類(R聚類)。Q聚類:根據一系列觀測變量的測量值對個案進行分類,分類的依據是個案之間的“距離”。R聚類:對研究對象的觀察變量進行分類,它使得具有共同特征的變量聚集在一起,以便選擇其中具有代表性的變量,實現用較少變量刻畫研究對象的目的。2.spss軟件使用方法5.1聚類分析概述層次聚類聚類過程首先,每個個體自成一類;然后按照某種方法度量所有個體間的親疏程度,將其中最“親密”的個體聚成一小類,形成n-1各類;接下來再次度量剩余個體和小類之間的距離,將最“親密”的個體或小類聚成一類。重復上述過程,不斷將個體和小類聚集成越來越大的類,直到所有個體聚到一起,形成一個大類。隨著聚類的進行,類內的“親密”程度在逐漸降低

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論