方差分析原理及應用_第1頁
方差分析原理及應用_第2頁
方差分析原理及應用_第3頁
方差分析原理及應用_第4頁
方差分析原理及應用_第5頁
已閱讀5頁,還剩161頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

關于方差分析原理及應用導言方差分析是20世紀20年代英國統計學家R.A.Fisher發明的,用于兩個及兩個以上樣本均數差別的顯著性檢驗(C42=6,0.956=0.735)。由于各種因素的影響,研究所得的數據呈現波動狀,造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結果形成影響的可控因素。方差分析的基本思想是:通過分析研究中不同來源的變異對總變異的貢獻大小,從而確定可控因素對研究結果影響力的大小。方差分析主要用于:1、均數差別的顯著性檢驗,2、分離各有關因素并估計其對總變異的作用,3、分析因素間的交互作用,4、方差齊性檢驗。單就因素型實驗來說,我們可以按照三個維度將其進行如下的分類:自變量的個數和水平數、被試的選擇和分組方法、實驗的程序和安排。第2頁,共166頁,2024年2月25日,星期天心理實驗設計的類型分析科學研究在根本上是對被研究的對象進行觀察和在觀察基礎上的理論推斷。心理學研究中的觀察法、準實驗方法、自然實驗法和實驗室實驗法可以看作是一個維度上的不同區域,它們的區別就在于對研究對象存在條件的控制程度。第3頁,共166頁,2024年2月25日,星期天第4頁,共166頁,2024年2月25日,星期天第5頁,共166頁,2024年2月25日,星期天方差分析的基本原理方差分析作為一種統計方法,所依據的基本原理就是變異的可加性。可以將總變異分解成不同來源的變異,并根據其在總變異中所占比重對造成數據變異的情況進行解釋。第6頁,共166頁,2024年2月25日,星期天方差分析的基本原理第7頁,共166頁,2024年2月25日,星期天方差分析的基本原理第8頁,共166頁,2024年2月25日,星期天方差分析的基本原理在方差分析中,比較組間差異和組內差異,不能直接比較各自的離差平方和,因為離差平方和的大小與求離差平方和的項數(k或n)的大小有關。為消除項數的影響,分別求其均方,即將離差平方和除以各自的自由度,并以MS表示。它是總體方差的無偏估計。第9頁,共166頁,2024年2月25日,星期天方差分析的基本原理方差分析的基本條件1.總體服從正態分布(總體非正態時進行正態轉換或采用非參數方法。教育心理研究資料大部分為正態)2.變異的可加性(變異可以分解)3.各處理內的方差一致(用哈特萊Hartley法進行方差齊性經驗)第10頁,共166頁,2024年2月25日,星期天方差分析的基本原理方差分析的一些術語1.因素與處理(客觀與人為)2.水平(因素的不同等級)3.單元Cell(因素水平間的每一個組合。如性別(0,1)與年級(1,2,3)共產生6個cell4.因素的主效應和因素的交叉效應(A,B,A×B)5.均值比較(比較個因素對因變量的效應的大小,如A,B效應之和是否等與于A×B)6.協方差(在一般方差分析中,要求除研究因素之外其他條件保持不變.如作身高體重關系研究時要消除性別和年級的影響)7.重復測驗(同一文化的不同群體彼此不獨立,采用重復測驗的方差分析)第11頁,共166頁,2024年2月25日,星期天1.單因素完全隨機實驗設計實驗設計模式1.當實驗研究的自變量只有一個刺激變量(或由刺激條件引起的機體變量),且自變量的水平數為k時,就可以從同一個被試總體中隨機抽取k個樣本,每一樣本完成一個自變量水平的實驗處理。這樣得到的各組因變量的觀測值是互不關聯的,因此也叫做獨立組實驗設計。其自變量對因變量是否產生顯著影響,可以使用ONE-WAY方差分析來檢驗。第12頁,共166頁,2024年2月25日,星期天1.單因素完全隨機實驗設計實驗設計模式2.當實驗研究的自變量只有一個機體變量,且自變量的水平數為k時,就需要從k個被試總體中各自隨機抽取一個被試樣本,每一被試樣本各自完成某一相同的測量。這樣得到的各組因變量的觀測值也是互不關聯的,因此也屬于獨立組實驗設計,其結果也可以使用ONEWAY方差分析來處理。第13頁,共166頁,2024年2月25日,星期天第14頁,共166頁,2024年2月25日,星期天1.單因素完全隨機實驗設計第15頁,共166頁,2024年2月25日,星期天第16頁,共166頁,2024年2月25日,星期天第17頁,共166頁,2024年2月25日,星期天第18頁,共166頁,2024年2月25日,星期天2.單因素完全隨機區組實驗設計第19頁,共166頁,2024年2月25日,星期天第20頁,共166頁,2024年2月25日,星期天第21頁,共166頁,2024年2月25日,星期天單因素實驗設計練習第22頁,共166頁,2024年2月25日,星期天單因素實驗設計練習第23頁,共166頁,2024年2月25日,星期天單因素實驗設計SPSS操作One-WayANOVA過程激活Statistics菜單選CompareMeans中的One-WayANOVA...項,彈出One-WayANOVA對話框。從對話框左側的變量列表中選x,點擊

鈕使之進入DependentList框,選range點擊

鈕使之進入Factor框,點擊DefineRange鈕打開One-WayANOVA:DefineRange對話框,如為3組比較,故在Minimum處輸入1,在Maximum處輸入3,點擊Continue鈕返回One-WayANOVA對話框。如果欲作多個樣本均數間兩兩比較,可點擊該點擊對話框的PostHoc...鈕打開One-WayANOVA:PostHocMultipleComparisons對話框,這時可見在Tests框中有7種比較方法供選擇:第24頁,共166頁,2024年2月25日,星期天單因素實驗設計SPSS操作激活Least-significantdifference:最小顯著差法(LSD)。

可指定0-1之間任何顯著性水平,默認值為0.05;(Equalvarianceassumed)Bonferroni:Bonferroni修正差別檢驗法。

可指定0-1之間任何顯著性水平,默認值為0.05;(Equal)Duncan’smultiplerangetest:Duncan多范圍檢驗。只能指定

為0.05或0.01或0.1,默認值為0.05;Student-Newman-Keuls:Student-Newman-Keuls檢驗,簡稱N-K檢驗,亦即q檢驗。

只能為0.05;(Equal)Tukey’shonestlysignificantdifference:Tukey顯著性檢驗。

只能為0.05;(Equal)Tukey’sb:Tukey另一種顯著性檢驗。

只能為0.05;Scheffe:Scheffe差別檢驗法。

可指定0~1之間任何顯著性水平,默認值為0.05。(Equal)Tamhane”sT2等(Equalvariancenotassumed)第25頁,共166頁,2024年2月25日,星期天單因素實驗設計SPSS操作選用Student-Newman-Keuls顯著性檢驗法。在SampleSizeEstimate框中有Harmonicaverageofpairs和Harmonicaverageofallgroups兩選項,前者表示僅采用相互比較兩組的調和均數,后者表示采用所有組(含比較的兩組和尚未比較的其他組)的調和均數,本例選用前者,點擊Continue鈕返回One-WayANOVA對話框。點擊Option...鈕,這時可見在Statistics框中有2種選項:Descriptive要求系統給出個案數、樣本均值、標準差等描述統計量;Homogeneitv-of-vanriance要求系統進行方差一致性檢驗;對話框Mean-plot要求系統給出各實驗水平下因變量的均值分布圖。對話框MissingValue用于指定對樣本缺失值的處理方法。采用系統默認。第26頁,共166頁,2024年2月25日,星期天3.兩因素完全隨機實驗設計基本思想與單因素基本思想相同,但多因素中幾個因素對實驗結果的影響往往不是獨立的。在統計學中,將多個因素的不同水平的搭配實驗結果的效應,稱為交互作用。某個因素的改變引起的實驗結果的改變稱為主效應;由于交互作用引起的實驗結果的改變稱為交互效應。離差平方和的分解式是第27頁,共166頁,2024年2月25日,星期天3.兩因素完全隨機實驗設計實驗設計模式完全隨機實驗設計,就是多個實驗組各自參加一種實驗處理,而且被試的選擇、分組和實驗順序的編排都盡可能具有隨機性,這樣可以保證不同實驗處理之間的完全獨立性。在這種設計中,有多少個實驗處理(自變量的一個水平或多個自變量某一水平的一個結合),就要有多少個獨立的被試組。第28頁,共166頁,2024年2月25日,星期天第29頁,共166頁,2024年2月25日,星期天3.兩因素完全隨機實驗設計基本原理研究問題:如果在研究文章的生字密度的同時,想探討主題熟悉性對學生閱讀理解的影響。研究者的假設是:當主題熟悉性不同時,生字密度對閱讀理解的影響可能發生變化。A因素包含a1(主題熟悉)a2(主題不熟悉);B因素包含b1(5:1)b2(10:1)b3(20:1)。24名被試隨機分配到6種實驗結合中.第30頁,共166頁,2024年2月25日,星期天第31頁,共166頁,2024年2月25日,星期天第32頁,共166頁,2024年2月25日,星期天3.兩因素完全隨機實驗設計第33頁,共166頁,2024年2月25日,星期天第34頁,共166頁,2024年2月25日,星期天第35頁,共166頁,2024年2月25日,星期天3.兩因素完全隨機實驗設計第36頁,共166頁,2024年2月25日,星期天第37頁,共166頁,2024年2月25日,星期天4.兩因素隨機區組實驗設計基本原理研究問題:如果研究者在研究文章的生字密度的和主題熟悉性對學生閱讀理解的影響時,想分離出聽讀理解能力對閱讀理解成績的可能影響。先將24名學生進行聽讀測驗分為4個區組,隨機分配每一區組的6名學生,每個學生接受一種實驗結合.研究者的假設是:當主題熟悉性不同時,生字密度對閱讀理解的影響可能發生變化。A因素包含a1(主題熟悉)a2(主題不熟悉);B因素包含b1(5:1)b2(10:1)b3(20:1)。第38頁,共166頁,2024年2月25日,星期天第39頁,共166頁,2024年2月25日,星期天第40頁,共166頁,2024年2月25日,星期天第41頁,共166頁,2024年2月25日,星期天第42頁,共166頁,2024年2月25日,星期天第43頁,共166頁,2024年2月25日,星期天第44頁,共166頁,2024年2月25日,星期天多因素實驗設計SPSS操作Multivariate過程多元方差分析:因變量不止一個,且因變量之間又不是相互獨立時,進行的方差分析稱為多元方差分析。基本原理仍然是通過檢驗兩個或多個樣本均數之間差異是否顯著,以對綜合結論的作出提供依據,SPSS中需調用Multivariate命令進行。調用此過程可進行多元方差分析。此外,對于一元設計,如涉及混合模型的設計、分割設計(又稱列區設計)、重復測量設計、嵌套設計、因子與協變量交互效應設計等,此過程均能適用。

第45頁,共166頁,2024年2月25日,星期天多因素實驗設計SPSS操作Multivariate過程數據準備激活數據管理窗口,定義變量名統計分析激活Analyze菜單選GeneralLinearModel中的Multivarite...項,彈出Multivarite對話框.首先指定供分析用的變量MS、MF,故在對話框左側的變量列表中選變量MS、MF

,點擊

鈕使之進入DependentVariable框;然后選變量g點擊

鈕使之進入Factor(s)框中。第46頁,共166頁,2024年2月25日,星期天多因素實驗設計SPSS操作Multivariate過程統計分析點擊Options...鈕,彈出Multivarite:Options對話框,選擇需要計算的指標。在Factor(s)欄內選變量g,點擊

鈕使之進入DisplayMeansfor框,要求計算平均值指標;在MatricedWithinCell欄內選Correlation、Covariance、SSCP項,要求計算單元內的相關矩陣、方差協方差矩陣和離均差平方和交叉乘積矩陣;在ErrorMatrices欄內也選上述三項,要求計算誤差的相關矩陣、方差協方差矩陣和離均差平方和交叉乘積矩陣;在Diagnostics欄內選Homogeneitytest項,要求作變量的方差齊性檢驗。之后點擊Continue鈕返回MultivariteANOVA對話框,最后點擊OK鈕即可。第47頁,共166頁,2024年2月25日,星期天四、含協變量的實驗設計與協方差分析協變量方差分析是一種特殊的方差分析,它是將某些難以控制但可測量的隨機變量作為協變量,然后在方差分析過程中將其對觀測變量產生的影響從殘差項中分離出來,以便能更有效地突出控制變量的作用。協變量多半是屬于機體變量,而且是連續數值型變量,比如知識水平、智力商數、身體條件等等。協方差分析在功能上是對被試內變異進行分解,以減小殘差項。協方差分析還有一個假設前提,就是協變量與控制變量沒有交互作用,所以數據變異線性分解為:控制變量引起的變異、協變量引起的變異、隨機變量引起的變異。第48頁,共166頁,2024年2月25日,星期天一般的方差分析模型(ANOVA):總平方和組內平方和組間平方和SST=SSb+SSwF:=MSb/MSw主要特征:onedependent,morethanindependents第49頁,共166頁,2024年2月25日,星期天多元方差分析(MANOVA--Multivariate):definition:多元方差分析:因變量不止一個,且因變量之間又不是相互獨立時,進行的方差分析稱為多元方差分析。基本原理仍然是通過檢驗兩個或多個樣本均數之間差異是否顯著,以對綜合結論的作出提供依據,SPSS中需調用Multivariate命令進行。Generalmodel:第50頁,共166頁,2024年2月25日,星期天Nullhypothesis:第51頁,共166頁,2024年2月25日,星期天HypothesisforMANOVA:因變量之間是否有足夠相關—做Bartlett球形檢驗,看因變量之間是否獨立,若獨立,則沒有必要做多元分析,只做一元方差分析;若a=0.000,則有足夠相關。多因變量之間為多元正態分布,這一假設很難滿足。看殘差正態標繪圖(NormalQ-QplotofResiduals)或去趨勢正態標繪圖(DetrendednormalQ-QPlot)因變量方差相等—考察是否有公共協方差矩陣(Homogeneity)。上述假設在實際應用中也并非一定嚴格執行,除非有異常值。第52頁,共166頁,2024年2月25日,星期天從t檢驗到一元方差分析再到多元方差分析:T檢驗是對來自兩個子總體的樣本平均值只否存在顯著差異的檢驗。當需要對來自多個子總體的樣本平均數進行檢驗,T檢驗就顯得無能為力,于是,引進單因素方差分析的方法進行,并發展到多因素方差分析。而當所研究的對象找不到最佳的測量方式時,綜合分析各方面的指標就成為必要,因此,在一般對自變量進行方差分析的基礎上,又引進多個因變量進行多元方差分析。多元方差分析實際上是多個因變量的單因素方差分析,但又不同于單因素方差分析的簡單加權,因為,它是在同時考慮多個因變量差異是否顯著的情況下完成的。單因素方差分析顯著,并不意味著多元方差分析顯著,反之也是如此。第53頁,共166頁,2024年2月25日,星期天單因素多元方差分析兩因素多元方差分析第54頁,共166頁,2024年2月25日,星期天單因素多元方差的分解:假設A因素有兩個水平,如閾上知覺與閾下知覺檢驗的假設為:數學模型為:設ai=

i-代表A的效應,其中第55頁,共166頁,2024年2月25日,星期天則數學模型可改為根據上述模型,實際檢驗的假設是a1=a2…=ai=0第56頁,共166頁,2024年2月25日,星期天總平方和分解為如下平方和與叉積矩陣(SSCP—SumsofSquaresandCross-ProductMatrix)第57頁,共166頁,2024年2月25日,星期天多元方差分析的檢驗統計量FPillai’sTrace(軌跡):在接受虛無假設時相對較為保險,且在樣本規模很小、各分組規模不等、或分布方差不等時使用的效果也不錯,近似值。Hotelling’sTrace(軌跡):近似值。Wilks’Lambda(

)--不太受違反假設條件影響,統計檢驗功效強,是精確值。RoyLargestRoot(最大根):在足以確信所有假設條件能夠得到遵守且因變量能夠由一維效應所代表時,具有較強的檢驗功效,但它的值不能直接轉換成某種已知分布的統計量,報告時一般只提供計算值,且為近似值,若小于0.1,便認為不顯著。第58頁,共166頁,2024年2月25日,星期天兩因素多元方差分析數學模型為虛無假設第59頁,共166頁,2024年2月25日,星期天總平方和分解為如下平方和與叉積矩陣第60頁,共166頁,2024年2月25日,星期天BasicstepsforMANOVA:Analyze—generallinearmodel—multivariate—dependentvariablesandfixedfactors—model:custom;buildterms:maineffects-factors—contrasts:factors-factor1,2…;changecontrast:arrow-simple,andfirst,change—ok.第61頁,共166頁,2024年2月25日,星期天Analyze—generallinearmodel—multivariate—第62頁,共166頁,2024年2月25日,星期天Select:Dependentvariables;Fixedfactors第63頁,共166頁,2024年2月25日,星期天model:custom;buildterms:maineffects-factors—第64頁,共166頁,2024年2月25日,星期天model:custom;buildterms:interaction第65頁,共166頁,2024年2月25日,星期天contrasts:factors-factor1,2…;change第66頁,共166頁,2024年2月25日,星期天option.第67頁,共166頁,2024年2月25日,星期天ok.第68頁,共166頁,2024年2月25日,星期天多元方差分析輸出的主要結果包括:多元方差的總體差異分析結果各變量單獨的方差分析結果多重差異比較的結果各種平方和矩陣(SSCP);多元方差分析;包括每個自變量的均數比較結果、均數比較的多變量檢驗結果、均數比較的單變量檢驗結果。標準化殘差的P-P圖第69頁,共166頁,2024年2月25日,星期天多元方差變量設計描述第70頁,共166頁,2024年2月25日,星期天因變量之間相關性的球形檢驗第71頁,共166頁,2024年2月25日,星期天因變量之間方差是否齊性檢驗第72頁,共166頁,2024年2月25日,星期天多元方差總體分析結果第73頁,共166頁,2024年2月25日,星期天組間平方和叉積矩陣(SSCP)第74頁,共166頁,2024年2月25日,星期天殘差平方和叉積矩陣(SSCP)第75頁,共166頁,2024年2月25日,星期天自變量一的多重比較第76頁,共166頁,2024年2月25日,星期天自變量一的一元方差分析第77頁,共166頁,2024年2月25日,星期天自變量二的多重比較第78頁,共166頁,2024年2月25日,星期天自變量二的一元方差分析第79頁,共166頁,2024年2月25日,星期天自變量一與二的交互作用多重比較分析第80頁,共166頁,2024年2月25日,星期天教學的特點理論上側重與統計思想和原理,不拘泥于數學證明不為計算上的考慮而討論特殊情形處理注重統計量之間、統計概念之間及統計方法之間的聯系介紹在應用是有重要意義的統計量和統計方法體現統計的現代做法——統計軟件的使用第81頁,共166頁,2024年2月25日,星期天第一章緒論—心理統計的價值科學研究實驗設計量化研究第82頁,共166頁,2024年2月25日,星期天科學研究與統計科學研究:科學研究的目的在于認識我們所要研究對象的本質及其規律,從而找到解決問題的答案科學研究的特點1、科學研究都有比較系統的理論框架,即在一定理論的指導下,通過實際調查研究,檢驗理論假設的正確性——提出有價值的問題。

第83頁,共166頁,2024年2月25日,星期天2、科學研究都有一定程度的控制機制,在研究中總是設法恒定或排除某些無關變量,以便著重觀察與分析一些關鍵特征及其影響因素,找出事物發展的因果關系。3、科學研究總是有意識地、系統地尋求研究對象之間的因果關系,通過觀察某一現象的事實,根據事實的分析與解釋,作出一般結論來。第84頁,共166頁,2024年2月25日,星期天科學研究的目的描述行為:觀察解釋行為:科學的理論預測行為:對尚未發生的事件所作的預見。邏輯推理確定行為的起因和控制行為第85頁,共166頁,2024年2月25日,星期天實驗設計與統計實驗設計:廣義的實驗設計指科學研究的一般程序包括從問題的提出、假說的形成、變量的選擇等一直到結果的分析、論文或研究報告的寫作一系列內容。狹義的實驗設計指實施實驗處理的一個計劃方案,以及與方案與計劃有關的統計分析,包括以下程序:

第86頁,共166頁,2024年2月25日,星期天

1、建立與研究假說有關的統計假說2、確定實驗中使用的實驗處理(自變量)和必須控制的多余變量(無關變量)3、確定實驗中需要的實驗單元(被試)的數量以及被試的抽樣的總體4、確定將實驗條件分配給被試的方法(設計)5、確定實驗中每個被試要記載的測量(因變量)和使用的統計分析

第87頁,共166頁,2024年2月25日,星期天量化研究與統計量化研究:世界的一切事物都是有質和量兩種規定性。質是事物的內在規定性,它是一切事物區別于其他事物的依據;量是事物所固有的,反映事物存在與發展的量方面特性的規定性——規模、程度、水平、速度、關系、結構比例、效率。第88頁,共166頁,2024年2月25日,星期天量化研究的范圍描述現狀。為了發現問題,必須對研究對象開展有效的測量、觀察、調查等。這可以是靜態的,也可以是動態的。收集到的資料有定量的,也有定性的。定量資料當然可以用定量的方法來處理與分析,定性的資料也可以經過“量化”轉變為數字資料進行分析。第89頁,共166頁,2024年2月25日,星期天探索規律。任何科學研究都離不開科學探索,在科學探索中需要運用概括、歸納、比較、分類、分析、綜合等思維方法。這其中存在著定量分析的可能性和必要性。例如分類問題,為探討九年義務教育在實施中遇到的“標準的統一性”和“地區的差異性”的矛盾和解決矛盾的對策時,運用統計學中聚類分析的分析的方法(全國——地區1、地區2……)第90頁,共166頁,2024年2月25日,星期天因果分析。教育與心理現象中普遍存在著這樣那樣的關系,因果關系則是人們十分關注的方面。凡關系必存在與變化中,而變化又不可能不重視量方面的變化。于是,定量的關系研究、探求數量上的因果量是定量研究的重要內容。第91頁,共166頁,2024年2月25日,星期天驗證假設。由定性分析獲得的初步認識,往往可以形成研究假設。“假設”是對問題猜想性的解釋,它是需要經過科學驗證的。這就需要我們開展各種實驗研究。于是在實驗的設計與實驗數據的分析中不可缺少地要運用定量分析。第92頁,共166頁,2024年2月25日,星期天測量與評價。對于教育過程與成果需要開展測量與評價活動。如教學過程的診斷教學效果的評定。教育測量與評價已成為教育研究中的一個方向。第93頁,共166頁,2024年2月25日,星期天決策與預測。教育決策涉及到過程控制、功能優化或要素組合極大化。若只停留在定性分析水平上,就只有抽象的原則,而難以開展實效的操作。預測的方法很多,其中不可缺少的是對歷史資料進行趨勢模型的擬合和預測。第94頁,共166頁,2024年2月25日,星期天量化研究的作用簡化作用突現心理與教育問題提供系統的收集資料的方法建立了統計分析的方法研究結果可以用來建立明確的努力方向,預測未來需要、控制和引導發展方向。可以重復驗證,協助研究者確認研究發現的正確性。可教可學——質的研究方法具有獨特性。第95頁,共166頁,2024年2月25日,星期天心理統計學的內容基礎統計原理方差分析的原理及應用

回歸分析的原理及應用

因素分析的原理及應用

路徑分析原理簡介結構方程原理簡介SPSS統計軟件應用簡介心理與教育科學研究課題舉例

第96頁,共166頁,2024年2月25日,星期天心理統計學的內容張厚粲主編:《心理與教育統計學》,北京師范大學出版社,1988年版王孝玲編著:《教育統計學》,華東師范大學出版社,2001年版張敏強主編:《教育與心理統計學》,人民教育出版社,1993年版溫忠麟、邢最智編著:《現代教育與心理統計技術》,江蘇教育出版社2001年臺灣吳明隆著:《SPSS統計應用實務》,中國鐵道出版社2001年第97頁,共166頁,2024年2月25日,星期天第二章基礎統計原理教育科學研究中的數據類型(從數據的來源:計數數據、測量數據和類別數據;從數據反映變量性質:稱名變量、順序變量、等距變量、比率變量)常用的描述統計量的計算集中量數(平均數、中數與眾數、幾何、調和)差異量數(極差、平均差、標準差、四分位距、白分位距)相關系數(極差相關、斯皮爾曼等級相關、肯德爾和諧系數、二列相關、列聯相關、品質相關)類別差異的顯著性檢驗假設檢驗的涵義(概率、抽樣分布、顯著性水平)差異顯著性檢驗的方法(平均數顯著性檢驗、平均數差異顯著性檢驗—T檢驗、Z檢驗)第98頁,共166頁,2024年2月25日,星期天教育科學研究中的數據類型數據:統計學中的數字資料,用來反映和標志客觀事物量的特征.計數數據與測量數據比率數據等距數據順序數據名義變量

第99頁,共166頁,2024年2月25日,星期天集中量數算術平均數(arithmeticmean,簡寫M)中位數(median,簡寫Md)眾數(mode,簡寫Mo)幾何平均數(geometricmean,簡寫GM)調和平均數(harmonicmean,簡寫HM)第100頁,共166頁,2024年2月25日,星期天算術平均數(平均數、均數Mean)概念:所有觀測值的總和與觀測次數的比值,一般用表示。用于表示總體時用,用于表示樣本時用定義公式:如果一個總體包含N個元素,Xi是這個總體中的第i個元素,則稱為第i次觀測值,那么,對來說,該總體的算術平均數被定義為μ=(x1+x2+¨xn)/N=∑Xi/N

X=(x1+x2+¨xn)/n=∑Xi/n

第101頁,共166頁,2024年2月25日,星期天

平均數的計算:1、原始分數計算

X=∑X/N2、分組數據計算

X=∑fX/N3、估計平均數計算第102頁,共166頁,2024年2月25日,星期天【例3-1】某項研究在一年級總體中抽取30名樣本,測得某項能力測驗分數如下,求平均能力分數60,71,63,58,50,75,64,73,72,64,52,65,65,76,72,70,58,50,80,51,79,81,77,69,67,61,48,50,54,55解1:所求的是n=30的樣本平均數

X=(60+71+…+55)/30=64.33解2:多功能計算器程序1、進入統計檔:2ndf —AC2、消除內存:2ndf—AC3、輸入數據:60—Data4、輸出數據:2ndf—σ第103頁,共166頁,2024年2月25日,星期天

X=64.33∑X=1930∑X2=127130σ=9.9443S=10.1143n=30第104頁,共166頁,2024年2月25日,星期天

分組數據計算:

分組區間組中值次數fXc計算程序65-7067167ΣfXc=567460-624248X=ΣfXc/N55-576342=5674/15750-528416=36.1445-471675240-4224100835-3734125830-322167225-271643220-221124215-17915310-12784第105頁,共166頁,2024年2月25日,星期天中數和眾數中數概念:位于一組數據中較大一半與較小一半中間位置的數。用Md表示計算方法1、單列數據:數據中沒有相同數據。奇數:取第(N+1)/2那個數;偶數:取第N/2與第N/2+1位置的平均數第106頁,共166頁,2024年2月25日,星期天2、有重復數目的情況假定位于中間的幾個重復數目為連續數據;取數列中上下各N/2那一點上的數據為中數;【例3-2】求2,3,5,5,7,7,7,11,13的中數。777——————————————6.56.837.167.53、分組數據計算第107頁,共166頁,2024年2月25日,星期天中數的意義和應用1、優點:計算簡單,容易理解;不受極端數值影響。缺點:反應不夠靈敏;不是每個數據都參與計算,受抽樣影響較大;不能做進一步代數運算。2、適用情況

第108頁,共166頁,2024年2月25日,星期天(二)眾數概念:在次數分布中出現次數最多的那個數的數值,用Mo表示計算1、觀察法未分組數據:次數最多的那個數;分組數據:觀察次數最多的一組區間的組中值;2、公式法:用公式求的眾數稱數理眾數皮爾遜經驗法:Mo=3Md-2X金氏插補法第109頁,共166頁,2024年2月25日,星期天平均數、中數和眾數的關系正態分布:M=Md=Mo正偏態分布:M>Md>Mo負偏態分布:M<Md<Mo第110頁,共166頁,2024年2月25日,星期天平均數、中數和眾數的關系正態分布:X=Md=Mo正偏態分布:X>Md>Mo負偏態分布:X<Md<Mo第111頁,共166頁,2024年2月25日,星期天其它集中量數加權平均數涵義:不同比重數據的平均數公式:1、w為權數,描述各變量在總體中的相對重要性

Mw=∑wiXi/∑wi2、ni為人數,ni為小組平均數,表示總平均數

XT=∑niXi/∑ni第112頁,共166頁,2024年2月25日,星期天幾何平均數涵義:當需要處理以下兩種情況時,用幾何平均數表示集中趨勢1、一組數據中任何兩個相鄰數據之比接近常數,即數據按一定的比例關系變化。如平均增長率、心理物理學中的等距與等比實驗。2、當一組數據中存在極端數據,分布呈偏態時,算術平均數不能很好反映數據的典型情況時。基本公式第113頁,共166頁,2024年2月25日,星期天幾何平均數的應用1、心理物理學中等距或等比量表實驗的數據處理【例3-3】欲研究介于與兩個感覺之間的物理刺激是多少,隨機抽取10個樣本,讓其調節一個可變的物理量的刺激,使所產生的感覺恰好介于與之間,然后測試這個物理量,結果如下:5.7,6.2,6.7,6.9,7.5,8.0,7.6,10.0,15.6,18.0。求介于二感覺之間的感覺的平均物理刺激量是多少。第114頁,共166頁,2024年2月25日,星期天2、應用幾何平均數的變式(1)平均增長率【例3-4】某市近幾年高中畢業生人數如下表,試求其平均增長率,椐此,到2005年統計有多少高中畢業生.年度學生人數變化率19971998199920002001200022002430260028801.1001.10451.07001.1077第115頁,共166頁,2024年2月25日,星期天

(2)閱讀能力的平均增長率【例3-5】閱讀遍數---理解成分閱讀遍數理解成分每次增加比率140(x1)252(x2)121.300365(x3)131.250475(x4)101.154586(x5)111.147697(x6)111.128第116頁,共166頁,2024年2月25日,星期天Mg=1.1933(X=1.1958)X6=40×1.193775=97(96.97)X7=40×1.193776=116(115.77)設X1為基數:Mg=(Xn/x1)1/n-1

上例:Mg=(97/40)1/5=1.1938(3)教育經費的增長率

第117頁,共166頁,2024年2月25日,星期天調和平均數涵義:一組數據倒數的算術平均數的倒數。應用:描述學習速度方面的問題實驗設計有兩種形式1、工作量固定,記錄各被試完成相同工作量所用的時間;2、學習任務的時間相同而工作量不同公式:MH=N/∑1/Xi第118頁,共166頁,2024年2月25日,星期天例1、前15分鐘學會30個單詞,后15分鐘學會30個單詞,求平均學習速度。解:先計算單位時間的該工作量

X1=30/15=2X2=30/10=3XH=2.4第119頁,共166頁,2024年2月25日,星期天例2、一個學習實驗的結果,計算平均學習速度被試作業時間單位時間工作量124212220210316284122658246422MH=4.9第120頁,共166頁,2024年2月25日,星期天差異量數表示一組數據變異程度和離散程度的量。亦稱離中趨勢。常用的差異量數有全距、四分位距、百分位距、平均差、方差和標準差方差Variance標準差Standarddeviation四分差Quartile差異系數Relativedeviation第121頁,共166頁,2024年2月25日,星期天方差與標準差概念:方差(變異數、均方)是每個數據與該數據平均數之差乘方后的均值。用σ2、S2表示。標準差是方差的算術平方根用σ、S表示公式:σ2=σ=

S2=S=第122頁,共166頁,2024年2月25日,星期天方差和標準差計算方法原始數據計算法頻數分布表計算法注意比較第123頁,共166頁,2024年2月25日,星期天分數組中值xffXfX2σx,σ2x45--47.5147.5147.521σ2x=148506.3/37-(2290/37)2=183.078σx==13.5350--52.5252.5252.52255--57.5057.5057.52060--62.5262.5262.52270--67.5367.5367.52375--77.5877.5877.52380--82.5782.5782.52785--87.5787.5787.527總和372290.0148506.348個學生數學分數方差、標準差計算表第124頁,共166頁,2024年2月25日,星期天四分差(Quartile)為了避免全距受兩極端數值影響的缺點,則用依一定順序排列的一組數據中間部位50%個頻數距離的一半作為差異量指標,即四分位距。用QD表示。Q3:第三個四分位數Q1:第一個四分位數第125頁,共166頁,2024年2月25日,星期天四分位距計算方法原始數據計算法例:將16個原始數據從小到大排列好:12、14、15、17、19、20、22、25、29、30、31、33、35、37、39、40Q1=18Q3=34第126頁,共166頁,2024年2月25日,星期天四分差計算方法LQ:表示Q所在組的下限N:表示總頻數n1:表示小于Q所在組下限的頻數總和i:表示組距第127頁,共166頁,2024年2月25日,星期天差異系數差異系數是指標準差與算術平均數的百分比。它是沒有單位的相對數。用公式可表示為:差異系數越大,表明離散程度越大。第128頁,共166頁,2024年2月25日,星期天差異系數的用途比較不同單位資料的差異程度比較單位相同而平均數相差較大的兩組資料的差異程度可判斷特殊差異情況第129頁,共166頁,2024年2月25日,星期天第130頁,共166頁,2024年2月25日,星期天相關係數(Correlation)兩數量變數的相關係數,是衡量兩變數線性關係強度及方向的數值,定義如下:兩變數分別為X及Y,資料配對為(xi,yi), i=1,2,…,n其平均數與標準差分別為

與sX,與sY。則相關係數r

定為

第131頁,共166頁,2024年2月25日,星期天散布圖1第132頁,共166頁,2024年2月25日,星期天散布圖2第133頁,共166頁,2024年2月25日,星期天相關係數的特性相關係數中,兩變數並不區分解釋變數或反應變數。相關係數的計算以數量變數為主,此公式不適用於類別變數。相關係數的計算使用標準化值,與各數量變數的度量單位無關。第134頁,共166頁,2024年2月25日,星期天相關係數為正表示兩變數具正相聯性,相關係數為負表示兩變數具負相聯性。相關係數r

,其數值必為-1與1之間。r接近0表示兩變數的線性關係薄弱。兩變數的線性關係強度,隨著r由0移向-1或1而增強。r接近-1或1表示散佈圖的點呈近乎直線。r等於-1或1表示散佈圖的點全在直線上。第135頁,共166頁,2024年2月25日,星期天相關係數僅能衡量的兩變數的線性關係,對其他曲線關係的強度無法提供信息。相關係數值受離群點(outliers)影響很大。第136頁,共166頁,2024年2月25日,星期天線性關係的不同強度之r第137頁,共166頁,2024年2月25日,星期天

皮爾森(Pearson)相關係數相關係數(r)相關程度0.8以上極高0.6-0.8高0.4-0.6普通0.2-0.4低0.2以下極低皮爾森樣本相關係數

1皮爾森相關係數(ρ)的檢定虛無假設H0:兩變數X和Y不相關(即相關係數為零,ρ=0)對立假設H1:兩變數相關(即相關係數不為零,ρ≠0)公式:ρ值為:

2皮爾森相關係數的意義

3第138頁,共166頁,2024年2月25日,星期天

斯皮爾曼(Spearman’sRho)等級相關係數斯皮爾曼等級相關係數的檢定A.雙尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數相關(即相關係數不為零)B.正相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數正相關(即相關係數大於零)C.負相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數負相關(即相關係數小於零)2斯皮爾曼等級相關係數(ρ(s))

1簡化式中T為第139頁,共166頁,2024年2月25日,星期天肯特爾相關係數的檢定A.雙尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數相關(即相關係數不為零)B.正相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數正相關(即相關係數大於零)C.負相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數負相關(即相關係數小於零)2

肯特爾(Kendall’sTau)相關係數肯特爾相關係數(τ

1式中T為第140頁,共166頁,2024年2月25日,星期天假設檢驗1、統計檢驗的基本概念2、幾種檢驗方法(1)Z檢驗(2)t檢驗(3)F檢驗(4)第141頁,共166頁,2024年2月25日,星期天總體樣本抽樣

推論總體參數樣本估計量

第142頁,共166頁,2024年2月25日,星期天總體參數與樣本統計量之間的關系總體參數:是描述總體資料特性的統計測量數,一般簡稱為參數。參數是我們想要獲取的,是統計的核心。樣本統計量:是描述樣本資料特性的統計測量數,一般簡稱為統計量,通常用來推論總體參數。

第143頁,共166頁,2024年2月25日,星期天抽樣誤差:是指樣本統計量的數值與總體參數值間的差異。非抽樣誤差:抽樣誤差以外的因素所造成的誤差稱為非抽樣誤差。估計誤差第144頁,共166頁,2024年2月25日,星期天概率抽樣概率抽樣又稱為隨機抽樣,是依概率來抽取樣本,不加入任何人為的意志或判斷的抽樣方法。非概率抽樣非概率抽樣是按照人為的意志從總體中去抽取具有代表性的樣本,又稱為非隨機抽樣。概率抽樣與非概率抽樣第145頁,共166頁,2024年2月25日,星期天統計方法的實施步驟確定問題:首先必須確定問題所在,及研究分析的目的、對象與范圍。搜集資料:針對研究對象、目的進行數據收集。在收集時應考慮是否有現成可用的資料,收集的成本費用如何,收集的方式,資料涵蓋的范圍等。

審查整理呈現資料:收集到的資料應先審核是否完整、正確、合理與一致,然后利用描述統計學所介紹的方法進行分類整理,并以文字圖形表格的方式將所獲得的結果呈現出來。

分析解釋資料:根據整理的結果加以分析研究,探討各數值間的相互關系并加以比較。

統計推論:根據步驟所得的結果,來推論總體參數并下結論或做建議。第146頁,共166頁,2024年2月25日,星期天1、統計檢驗的基本概念

(1)概率——表示某一事件發生的可能性的大小。

第147頁,共166頁,2024年2月25日,星期天(2)隨機變量與概率分布

隨機變量:X取哪一個數值有隨機性。離散隨機變量的分布是二次分布。連續隨機變量的分布是正態分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論