




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
《學前教育科研方法》第五章統計分析研究第五章統計分析方法第一節統計分析概述第二節數據整理與圖表呈現第三節描述統計第四節推斷統計第一節統計分析法概述一、概念
統是指總體或領域的全部范圍,計是指計量、計數或計算。任何事物或現象的存在、發展、變化等,都以一定的數量為依據,并且在量變過程中不斷實現質的飛躍,質與量是辨證統一的。我們研究任何事物也必須從質與量兩個角度去把握、認識。統計分析就是指對收集到的有關數據資料進行整理歸類并進行解釋的過程。二、統計分析法的特征1.科學性以數學為基礎,具有嚴密的結構。需要遵循特定的程序和規范。2.直觀性量化數據及簡明的圖表,直觀形象。3.可重復性統計研究的過程都是可重復進行的,并且可對研究的結果進行驗證。局限概率誤差對現象解釋的刻板性不能只根據統計結果對研究現象作出科學合理的解釋三、統計分析的主要內容統計分析主要包括描述統計和推斷統計兩部分內容。(一)描述統計主要研究如何整理心理與教育科學實驗、測量或調查得來的大量數據,描述一組數據的全貌,表達一件事物的性質。描述統計包括:1、數據如何分組、繪制圖標。2、如何計算一組數據的特征值。如表示數據集中情況的算術平均數、中數、眾數、幾何平均數、調和平均數等的計算和應用;表示數據分散情況的平均差、標準差、變異系數、標準分數等的計算和應用。3、表示一種或兩種以上屬性之間的相互關系及相關系數的計算及應用條件。(相關系數“r”)常用的描述統計量:1.表示數據集中情況的描述統計量算術平均數(另有幾何平均數、調和平均數)中數眾數2.表示數據分散情況的描述統計量平均差標準差變異系數標準分數等3.表示一種或兩種以上屬性之間的相互關系及相關系數的計算及應用條件。(相關系數“r”)描述統計是推斷統計的基礎。
(二)推斷統計推斷統計主要是研究如何利用實際獲得的局部樣本數據所提供的信息,推論總體的情況。
推斷統計要以描述統計為基礎包括:1.如何對假設進行檢驗——假設檢驗2.總體參數的估計方法3.各種非參數的統計方法四、統計分析的過程1.收集數據(問卷、測試分數等)2.整理數據(數據歸類、分組、輸入軟件)3.分析數據(數據在論文、報告中的呈現)第二節數據整理與呈現一、數據的整理心理和教育研究中收集的各種原始資料雜亂無章,只有經過整理分析才能從中提取出有用的信息。在對資料進一步分析之前,需要進行認真的整理。審核資料審核資料的目的,是為了剔除不合格的資料,以確保資料的可靠性和可信性。審核是對原始資料進行初步的審查和核實。不符合要求的數據主要有三種:缺失、可疑、失誤。缺失:指數據不全或缺項未填;例如一份資料中未回答的問題占10%以上,或者缺少關鍵性資料。
可疑:指難以辨認或懷疑其真實性的數據;例如,有的被試填答的問卷全部選同一個選項(如全選A或全選B);有的被試填答的結果可以看到是一種規則的排列方式(如ABCDEDBCABCDE……)。失誤:指存在明確差錯的數據或答案在剔除不合格問卷的過程中,注意不能把一些不符合自己主觀假設的數據隨意去掉。因此這項工作一定要非常慎重。二、數據呈現(一)統計表統計表是用來表達研究變量與被說明的事物之間數量關系的表格。它可以將大量數據的分類結果清晰、概括、一目了然地表達出來,便于分析、比較和計算。1、統計表的構成
橫標目的總標目縱標目橫標目數字表2-1統計表的格式頂線底線表線表號標題標目標目表注注:例:表2-2北京市四街道智力落后患者分布街道檢查人數病人數患病率(‰)甲518411593.1乙760302633.5丙495081903.8丁517881703.3總計2291687823.4資料來源:見《心理學報》1979年第1期103頁,選部分引用2.統計表的種類簡單表:只按研究現象(或變量)的名稱、地點、時序等列出數據的統計表。分組表:只按一個標志分組的統計表稱為分組表。復合表:按兩個或兩個以上標志分組的統計表稱為復合表。
簡單表表2-3各校學生數一覽表學校A校B校C校D校人數9857628931051分組表表2-4上海市區男幼兒20米跑步用時年齡組3歲~4歲~5歲~6歲~平均用時(秒)7.717.166.045.53資料來源:引自《華東師范大學學報》,1985年第2期第30頁復合表表2-5某年級操行評定結果班別甲乙丙丁合計男女男女男女男女一班6588642140二班55910331137三班7698430138合計18162626131033115論文中表格的呈現(二)統計圖統計圖是整理和呈現數據的另一種方法,它把研究變量與被說明事物之間的數量關系用圖形表現,直觀、形象地表達出事物的全貌及其數據的分布特征,使人一目了然,便于理解和記憶,印象深刻。1.統計圖的構成統計圖一般由圖號、標題、標目、圖尺、圖形、圖例、圖注等幾部分構成。統計圖中的標目由基線和尺度線構成。對于有縱、橫軸的統計圖,一般以基線表示被觀察的現象,而尺度線則表示其數量。
直條圖和直方圖單式條形圖圖2-1某年級操行評定結果條形圖
(圖題)基線尺度線圖形復式條形圖圖2-2某年級操行評定結果條形圖例:圖2-3
三項影響較大的SARS信息對不同文化程度民眾的影響
原始數據次數分布表表現總體單位在各組次數分配情況的統計表,叫做次數分布表。簡單次數分布表累積次數分布表通過簡單次數分布表中各組對應的次數,可以進一步求出累積次數,制成累積次數分布表,如表2—6。表中第五列為累積次數。累積次數可以是從下向上累積,也可以從上向下累積,根據需要而定。本表為從下向上累積,即由最低一組開始逐一向上一組累加。最低一組次數為1,鄰近的上一組次數是2,則1+2=3;再向上累加,鄰近組的次數為1,則1+3=4,依此累加下去直到最高一組。最高一組的累積次數必須等于總次數。第三節描述統計一、集中量數二、差異量數三、相對地位量數四、關系量數統計量和參數統計指標統計量參數平均數μ標準差Sσ相關系數rρ回歸系數bβ一、集中量數集中量用來表現數據資料的典型水平或集中趨勢(centraltendency)。常用的集中量包括算術平均數、加權平均數、中位數和眾數等等。(一)算術平均數算術平均數(arithmeticaverage
)一般簡稱為平均數(average)或均數、均值(mean)。一般用M,或者用表示。算術平均數是最常用的集中量。算術平均數的計算公式原始數據計算公式(4.1)次數分布表計算公式(4.2)平均數在SPSS中的運算二、差異量數描述數據離散程度的統計量稱為差異量。差異量越大,表明數據越分散、不集中;差異量越小,表明數據越集中,變動范圍越小。一組數據的離散程度,常常通過數據的離中趨勢特點進行分析。(一)全距R(range)全距是一組數據中的最大值(maximum)與該組數據中最小值(minimum)之差,又稱極差。R=Xmax-Xmin(二)平均差平均差(averagedeviation
或者meandeviation)是指一組數據中,每一個數據與該組數據的平均數離差的絕對值的算術平均數,通常用AD或MD表示。本書中均以AD表示。原始數據計算公式次數分布表計算公式(5.3)(5.4)平均差意義明確,計算容易,反應靈敏。但計算時要用絕對值,不適合代數運算,因此在進一步統計分析中應用較少。(三)方差和標準差概念方差(又稱為變異數、均方)。是表示一組數據離散程度的統計指標。一般樣本的方差用
表示,總體的方差用表示。
標準差是指一組數據中每一數值與其算術平均數的差,數學上稱為“離差”。
離差平方之算術平均數的算術平方根稱為標準差。總體標準差用符號表示,樣本標準差用符號表示。計算公式為:
標準差是描述一組數據離中趨勢的量數,反映該組數據離散程度的大小。它是以研究差異為目的,以離差平方和最小為依托,由離差遞進演變到標準差。標準差是一個較為精確的差異量數,常與算術平均數配合使用,來描述一組數據的兩個分布特點(即集中趨勢與離中趨勢)。
圖4—1標準差的非邏輯遞推示意圖
原始數據計算公式次數分布表計算公式SPSS的操作方差和標準差的意義和使用條件
1.方差與標準差是表示一組數據離散程度的最好指標,是統計分析中最常用的差異量。
2.標準差具備一個良好的差異量應具備的條件,如:反應靈敏,有公式嚴密確定,簡明易懂,適合代數運算等等。
3.應用方差和標準差表示一組數據的離散程度,須注意必須是同一類數據(即同一種測量工具的測量結果),而且被比較樣本的水平比較接近。用標準差和平均數粗略估計一組數據的分布:
三個標準差包含全部數據的99.7%對于任何一個數據集合,至少有
的數據落在平均數左右的h(大于1的實數)個標準差之內。平均數左右2個標準差內,有四分之三的數據平均數左右3個標準差內,有九分之八的數據例如一組數據的平均數為50,標準差5,則至少有75%的數據落在50±2X5=40~60之間。至少有1-1/32=88.9%的數據落在50±3X5=35~65之間。如果數據成正態分布,則數據會以更大的百分數落在平均數兩側,即落在上下兩個標準差之內(95.45%),三個標準差之內(99.7%)。標準分數:ZZ=1.96,P=0.05Z=2.58,P=0.01(四)標準分數
1.標準分數的概念標準分數是原始數據與其所在團體的算術平均數之差除以標準差所得的商。標準分數用符號表示,其定義式為
式中,表示原始數據;表示原始數據的算術平均數;表示原始數據的標準差。從公式中可以看出,標準分數是以算術平均數為參照點,以標準差為單位,表示每一個原始數據在其團體中的相對位置。所以標準分數是一個相對位置量數。標準分數有正有負,如果原始數據大于算術平均數,則標準分數為正值;如果原始數據值小于算術平均數,則為負值。2.標準分數的計算標準分數的計算比較簡單,只要已知一組數據并求得其算術平均數和標準差,就可以求出某一個原始數據對應的標準分數,其步驟為:(1)計算原始數據的與;(2)計算離差;(3)代入公式。
在SPSS中依次點擊AnalyzeDescriptiveDescriptive
點擊Savestandardizedvaluesasvarianles即可。例題.有10名學生的考試成績如下表,求各個成績的標準分數
解:求得,,根據公式計算得到各個原始分數對應的標準分數,如表的第3列。
3.標準分數的應用
(1)確定原始數據在其團體中的相對位置
(2)比較不同單位的觀測值相對位置的高低
兩種不同學科考試成績,由于考試內容、難度不同,原始分數之間不能直接相比較,利用標準分數就可以通過原始分數在其團體中的相對位置來比較成績的優劣
(3)用于考試分數的合成
標準分數具有可加性,因此可將不同科目的考試分數轉化成標準分數進行分數合成。
四、關系量數(一)概述1、概念相關指變量之間的相互關系和聯系程度,其大小常用相關系數來表示。相關是指事物或現象間存在著一定的相互關系,即一種事物發生變化,常引起另一事物也發生較大的變化。依據各種現象的測量值研究各種現象間關系的密切程度,統計上叫做相關分析。相關關系至少存在于有聯系的成對的兩列變量間,即當一變量取某一數值時,另一變量也必有一數值與其對應。2、相關的種類
依據不同的分類標準,相關關系可分為不同的類別:(1)依據相關因素的多少,可分為簡相關和復相關。
研究兩個變量間的相關稱為簡相關,如研究學生的學習成績與智力水平間的相關;但學生的學習成績除受智力影響外,還受到教師的教學態度、學生的學習態度和學習動機等因素的影響,像這樣研究兩個以上變量間的相關就是復相關。
直線相關的各變量,其變化的趨勢是穩定的,始終保持一致。如果兩個變量有直線關系,則由兩變量成對觀測值描的點呈直線趨勢,其關系可用直線方程表示。
本章所研究的相關,是簡相關中的直線相關。曲線相關的各變量,其變化程度和趨勢都是不穩定的,即當一種變量有較大增加時,另一種變量不總是有較大增加;或者一變量增加,另一變量先增加,后減少,或者反之,前后變化不一致。若兩變量呈曲線關系,則由兩變量成對觀測值描的點呈曲線趨勢。(2)依據變量分布的形態,可分為直線相關和曲線相關。
正相關是指在兩列變量中,當一列變量增加或減少時,另一列變量也隨之增加或減少,即兩列變量發生變化的方向一致,如學生智力與學習成績、學生的數學成績與物理成績等;負相關是指在兩列變量中,當一列變量增加或減少時,另一列變量反而隨之減少或增加,即兩列變量發生變化的方向相反,如運動會跑賽的成績和所用的時間。(3)按變量變化的方向,可分為正相關、負相關。
完全相關是指相關聯的兩個變量,如果一個變量發生變化時,另一變量的對應值隨著呈比例地變化。由這兩列變量成對觀測值在坐標系內描的點都在一條直線上。如果一組考生在兩種測驗上的得分等級相同,則這兩種測驗分數間存在完全正相關;如果在第一種測驗中得分高的學生,在第二種測驗中恰得對應的低分,則兩種測驗分數間存在完全負相關。(4)變按量的相關程度,可分為完全相關、不完全相關和零相關。
從散布圖的形狀,我們可以大約地看出變量間相關程度的強弱、方向或性質,但并不能得知其相關的確切程度。為精確了解變量間的相關程度,還需進行進一步的統計分析,求出描述變量間相關程度的量數,即相關系數。圖18-1正相關圖18-2負相關散點的分布形狀為橢圓形,可認為兩變量之間具有線性關系。不完全正相關不完全負相關圖圖18-4完全負相關圖18-3完全正相關當所有的點都分布在一條直線上時,兩變量之間的關系為完全相關。兩個變量之間是否相關,要有充分的理論依據,并排除共變因素的影響。圖18-5零相關散點的分布沒有明顯集中在某一方向的趨勢,形成圓形區域時,兩變量之間的關系為零相關。零相關曲線相關3、相關系數用來描述兩個變量相互之間變化方向及密切程度的統計指標稱為相關系數,一般樣本的相關系數用r表示,總體的相關系數用ρ表示。相關系數的取值:-1≤r≤+10≤∣r∣≤1相關系數的符號:“+”表示正相關,“-”表示負相關。
教育研究中常用的描述變量間直線相關程度的量數主要有積差相關系數、等級相關系數、點二列相關系數等。(二)積差相關
1、概念當兩個變量都是正態連續變量,且兩者之間呈線性關系時,描述其相關程度用積差相關,它是研究兩變量間直線相關最基本的方法。積差相關是20世紀初由英國統計學家皮爾遜提出的,亦稱皮爾遜相關法,用積差相關系數來表示,其基本公式為:
2、積差相關系數的計算
計算積差相關系數,常用方法有兩種:一種是用基本公式求r,另一種是用原始數據求r。
(1)用基本公式求r:
積差相關系數為公式中:為變量X的平均數,為變量Y的平均數,為變量X的標準差,為變量Y的標準差,
n為數據的對數或計算得到了相關系數,還不能確定這兩個變量一定具有相關關系,需要對相關系數進行顯著性檢驗之后,才能做出判斷。(2)用原始數據求積差相關系數
計算公式:
積差相關的使用條件:
(1)兩變量都應是來自正態或接近正態總體分布的等距變量;(2)數據必須是成對的,且不同數據對之間是相互獨立的;(3)
兩變量之間呈線形關系;(4)樣本容量應較大,一般N≥30(如果數據太少,有時由于偶然因素影響,雖依據觀測值可計算出一個相關系數,但與實際不符,使相關系數失去意義);另外,在相關研究中,要注意排除共變因素的影響。第四節推斷統計推斷統計是在描述統計的基礎之上,在一定可靠性水平上,根據樣本的統計量對總體參數進行推斷的統計方法。假設檢驗:指研究者利用樣本信息,根據一定的概率,對總體參數或分布的某一假設進行拒絕或保留的決斷。假設檢驗分參數檢驗與非參數檢驗。參數檢驗最常見的是平均數差異顯著性檢驗。非參數檢驗最常見的是卡方檢驗。
參數檢驗:總體分布已知,需要對總體的未知參數進行假設檢驗,稱為參數的假設檢驗。平均數、方差、相關系數、比率等檢驗。P255,平均數差異顯著性檢驗的樣本特征。一、統計假設檢驗的一般原理
(一)統計假設檢驗的邏輯思想
在科學研究中,總是要從提出研究假設開始,研究假設是對研究問題的結果即變量之間的關系或研究現象的性質等所作的推測或估計,然后通過調查或查閱文獻搜集事實資料,并對這些事實資料進行歸類、分析、比較等,以驗證這一假設是否成立。如果提供的資料所反映的情況與根據假設推導的結果一致,則證明假設成立;反之,如果情況相差較大,則沒有充分理由證明該假設成立。而統計假設檢驗是依據概率,采用反證法對研究假設進行驗證,例如一項教學方法實驗研究中提出的研究假設是:“興趣作文”能夠提高小學生寫作的興趣和能力。這個假設實際是對研究結果作出的一種預想,是研究者希望證實的假設。在統計假設檢驗中此假設稱為備擇假設,記為H1。檢驗時并不直接檢驗這一假設能否成立,而是首先檢驗另一個與H1相反的假設,如“興趣作文不能提高小學生的寫作興趣和能力”是否成立,我們稱此假設為虛無假設或原假設,記為H0。統計研究都要提出兩個假設,一個是無差異假設即原假設H0,另一個是研究假設即備擇假設H1,這是兩個對立的假設。
判斷原假設推論的結果與實際出現的結果是否矛盾,或H0假設是否成立的依據是小概率的實際推斷原理,即“小概率事件在一次試驗中不可能發生”。在統計上,把概率小于或等于0.05的事件稱做小概率事件,小概率事件的概率用p來表示。小概率事件發生的概率越小,說明實際獲得信息反映出的結果與H0成立下推論的結果之間矛盾越明顯,實際結果與原假設結果的差異越顯著,越有理由拒絕原假設,接受備擇假設。因此統計假設檢驗也稱為顯著性檢驗。判斷差異顯著不顯著的標準是小概率事件發生的水平,即顯著性水平α。假設檢驗中通常取α=0.05或α=0.01。(二)統計假設檢驗的一般步驟根據假設檢驗的邏輯思想,概括統計假設檢驗的一般步驟如下:
1.建立假設根據研究問題的性質和已知的條件確定檢驗方式,單尾還是雙尾檢驗,并建立假設,即建立虛無假設H0和備擇假設H1。
2.選擇和計算統計量根據研究問題的目的、性質和所搜集資料的特點,在H0假設成立的前提下選擇合適的抽樣分布和統計量,并計算統計量的值。常用抽樣分布有標準正態分布、t分布、分布、分布等。與各種分布相對應的檢驗方法分別為檢驗、檢驗、檢驗、檢驗等,計算統計量就是求值、值、值或值。3.確定顯著性水平,并根據顯著性水平查表確定臨界值。根據研究問題的性質和需要確定顯著性水平α,再按確定的顯著性水平,查相應的統計用表,找出該α水下的臨界值,確定出H0的接受區間和拒絕區間。例如當α=0.05時,檢驗的雙尾臨界為±1.96,單尾臨界值為±1.64
;當α=0.01時,檢驗的雙尾臨界值為±2.58,單尾臨界值為±2.33。
4.進行統計決斷,即判斷結果并解釋
即對假設作出檢驗的結論。檢驗結論由計算出的統計量值與查表得到的某顯著水平下的臨界值相比較而得出。如果計算的統計量值達到或超過臨界值,則拒絕H0假設,接受H1假設。例如檢驗中,若計算的統計量|
|≥(雙尾)或
|
|≥(單尾)時,便有理由拒絕H0假設,說明比較的兩個量數之間差異顯著;否則接受H0假設。拒絕虛無假設H0,是因為樣本統計量在總體中出現的概率P≤α,是一個小概率事件。如果在P≤0.05情況下拒絕H0假設,則說明比較的兩個量數間差異顯著,在做100次這樣的結論中,可能有5次是不可靠的;如果在P≤0.01情況下拒絕虛無假設H0,則說明比較的兩個量數間差異非常顯著,在100次這樣的結論中僅有1次是不可靠的。統計推論中冒5%或1%的風險是允許的。
相關樣本是指兩個樣本內個體之間存在一定的關系。它有兩種情況:一是同一組被試在不同條件下形成的兩組樣本間存在相關,如用同一個測驗對同一組被試在實驗前和實驗后進行兩次測驗,所獲得的兩組測驗結果是相關樣本;二是在成對匹配的兩組被試條件下形成的樣本存在相關,如將每對被試隨機地分入實驗組和對照組,對兩組被試施以不同的實驗處理之后,用同一個測驗所獲得的測驗結果是相關樣本。
由于相關樣本的相關系數對實驗結果有一定的影響,因此對相關樣本之間差異進行檢驗的公式與獨立樣本時不同,另外,對相關樣本平均數間差異的檢驗只要總體屬于正態分布,無論方差是否相等都可進行檢驗。根據方差是否已知及樣本大小,采用不同的檢驗方法。
二、兩個相關樣本平均數間差異的顯著性檢驗1、總體正態分布,總體方差已知
這時,采用檢驗,即分數去檢驗兩個來自有相關關系的樣本平均數所代表的總體平均數是否存在顯著性差異。檢驗公式為:
式中,、分別是兩樣本來自的總體的標準差;為成對觀測值的個數;為兩樣本間的相關系數
2、總體正態分布,總體方差未知,n>30
此時,仍采用檢驗,用樣本方差直接代替總體方差。公式為:
式中,、分別是兩樣本來自的總體的標準差,其它符號意義同上。
例:從某實驗小學二年級中隨機抽取45名學生,進行寫作能力的測試。測驗結果的平均成績為75分,標準差為7.2分,兩次測驗的相關系數為0.5。問這兩次測驗的平均成績是否有顯著性差異?解:提出假設:H0:μ1=μ2,H1:μ1≠μ2計算Z值。
采取雙尾檢驗,取α=0.01。由于計算的=2.62>Z0.01/2=2.58,所以在0.01水平上拒絕原假設,接受備擇假設。認為前后兩次測驗的平均數差異非常顯著,訓練后的學生進步很大。
在教育實驗中,要對非實驗因素進行控制,使其在實驗中不影響實驗結果,以便檢驗實驗因素的影響作用。如進行教法改革的實驗,使實驗組的學生與控制組的學生,在人數、年齡、性別、智力水平、文化基礎等非實驗因素方面,都一一匹配,這樣便于確定教學方法改革的效果。例11.某小學將80名學生按年齡、性別、智力水平、原有知識基礎等一一匹配后,分成兩個班級進行教材改革實驗。甲班學生使用舊教材,乙班學生使用新教材,學習后對兩班學生測驗的結果如表8—5,問兩班成績的差異是否顯著?表甲、乙兩班學生的測驗成績
班級甲408810.10.7乙40839.2解:提出假設:H0:μ1=μ2,H1:μ1≠μ2
計算值。
采取雙尾檢驗,取α=0.01。由于計算的=4.21>Z0.01/2=2.58,所以拒絕原假設,接受備擇假設,認為甲、乙兩班的成績差異非常顯著。
3、總體正態分布,總體方差未知但相等,n<30
式中,是兩樣本的相關系數;其它符號意義同上如果兩樣本間的相關系數未知,可用下面公式求t值:
式中,D為每對觀測值的差數;n為觀測值對數此時適用于檢驗。計算統計量t值的公式為:
例12.某區大興路小學一年級3班有25名學生用聽讀識字法識字,課時平均識字量為15個漢字,標準差為6;與其條件基本相同的解放路小學一年級2班有25名學生用傳統的識字方法識字,課時平均識字量為11個漢字,標準差為5.3。兩個班通過事先配對,學習成績的相關系數為0.61。試問哪種方法識字更好?
解如下解:提出假設。H0:μ1≥μ2,H1:μ1<μ2選擇檢驗統計量并計算其值。由于n=25<30,樣本是小樣本,并且兩樣本雖來自于兩個總體,但被試之間的成績有很大程度的相關,所以采用t檢驗。將=11,=15,=5.3,=6,=0.61,代入公式得:確定檢驗形式和顯著性水平。
根據假設的形式和題意,采用左尾檢驗,取顯著性水平α=0.01。因為df=24,查t分布表得t0.05(24)=2.492。統計決斷。由于計算的=3.90>2.492,P<0.01,所以拒絕原假設,接受備擇假設,結論為:聽讀識字法比傳統識字法在識字效果方面有非常顯著的優越性。
例.為了檢驗和比較兩種教學方法的教學效果是否有顯著性差異,某任課教師從自己所任課的兩個班中暗自選定了在智力、基礎知識、家庭學習條件等方面基本相同的各10名學生配成10對,然后把每對學生隨機地分入實驗組和對照組,實驗組施以問題教學法,而對照組則施以講授教學法,經一單元教學后,用相同的試卷進行測驗,成績如表8—7,試比較兩種教學方法的教學效果是否有顯著性差異?
表
10對學生在兩種教學法中的成績和差數
對別實驗組X1對照組X2差數值D=X1-X2差數值平方D212345678910947392678178898574717775815264636283866517-211151715272-12628941212252892257294436Σ804708961926解:提出假設。
H0:μ1=μ2,H1:μ1≠μ2選擇檢驗統計量并計算其值。由于n=10,是相關小樣本,并且樣本統計量未知,所以使用公式(7.15)計算值。先計算每對觀測值的差數D,并求得
=96,,=1906,所以=
確定顯著性水平及臨界值。根據計算的t值的情況,取α=0.05。由于df=n-1=10-1=9,查t分布表得:=2.262。
統計決斷。由于計算的t=2.90>2.262=t0.05(9),P<0.05,所以在0.05水平上拒絕原假設,接受備擇假設,結論為:小學問題教學法與講授教學法在教學效果上有顯著性差異。由于問題教學法的平均成績高于講授教學法的平均成績,故問題教學法優于講授教法。
三、
兩個獨立樣本平均數間差異的檢驗獨立樣本是指隨機抽取的兩個樣本之間沒有關系。要檢驗這樣的兩個樣本是否來自相同的總體,可根據不同的情況采取不同的檢驗方法。
1.總體正態分布,總體方差已知時,兩個獨立樣本平均數間差異的顯著性檢驗當總體方差已知時,兩樣本平均數之差的分布為正態,無論樣本大小,均適用于檢驗。公式為:
式中,、分別是兩樣本的平均數;、分別是兩樣本來自的總體的標準差2.總體正態分布,總體方差未知,但兩個樣本的容量均大于30時,兩獨立樣本平均數間差異的顯著性檢驗
當總體方差未知,但n1、n2均大于30時,兩個平均數之差的分布為正態或近似正態,檢驗這樣兩個平均數間的差異時,可用樣本方差直接代替總體方差而采用Z檢驗。公式為
式中符號意義同上公式使用的條件為:(1)總體分布正態,總體方差未知但相等;(2)兩樣本皆為大樣本;
(3)樣本相互獨立,隨機抽取。
例7.某地區對6歲兒童的體重進行調查,得到如下結果,能否說明6歲兒童的體重有性別差異?表
6歲兒童體重調查結果
性別人數體重(kg)標準差男36031.54.55女35430.84.87解:(1)
提出假設。H0:μ1=μ2,H1:μ1≠μ2(2)
計算Z值。
(3)
確定α水平及臨界值。選取顯著性水平為α=0.05,查正態分布表知臨界值Z0.05/2=1.96。(4)統計決斷。由于計算的Z=2.0>Z0.05/2=1.96,P<0.05,所以在α=0.05上拒絕原假設,接受備擇假設,認為6歲兒童的體重在性別上有顯著性差異。
例.甲、乙兩所小學聯合舉行四年級數學考試,參加人數各96人,數學平均成績分別為78分和81分,標準差分別為9.4分和7.2分,試問兩所學校的數學成績是否有顯著性差異?解如下
解:提出假設
H0:μ1=μ2,H1:μ1≠μ2由于不知道總體方差,但兩個都是大樣本,所以可以用樣本方差代替總體方差,又兩樣本容量相等,所以取α=0.05。由于計算的=2.48>1.96,P<0.05,所以在α=0.05水平上拒絕原假設,接受備擇假設,認為兩所學校的數學成績有顯著性差異。
3.
總體正態分布,方差未知但相等,樣本容量小于30時,兩個獨立樣本平均數間差異的顯著性檢驗獨立小樣本平均數間的差異服從自由度為df=n1+n2-2的分布,因此,當總體方差未知且樣本容量n1和n2均小于30,或其中一個小于30時,平均數間差異的顯著性檢驗要用檢驗,公式為:
式中,、分別是兩樣本觀測值的離差平方和;、分別是兩個樣本的平均數;其它符號意義同上。
公式使用的條件:(1)總體正態分布,方差未知但相等;(2)樣本為小樣本,隨機抽取;(3)樣本相互獨立。如果兩個小樣本的方差已知,則公式可寫成
式中符號意義同上。例9.某小學教學班有男生16名,女生14名,他們的語文成績如表8—5,問男女生之間在語文成績上是否有顯著性差異?
表
男、女生語文成績表
性別成績(X)容量男9588817668477772836762597485877616女968367727892895487747468716314解:提出假設。H0:μ1=μ2,H1:μ1≠μ2選擇檢驗統計量并計算其值。男、女生雖組成一個教學班,但成績是按男、女生分別統計的,這實際上就形成了從兩個正態總體中隨機抽取的獨立樣本,而相應的兩個總體的標準差未知,且都是小樣本,故采用檢驗。根據已知數據求得
=74.8,=76.3,=(74.8-95)2+(74.8-88)2+……+(74.8-76)2=2250.5
=(76.3-96)2+(76.3-83)2+……+(76.3-63)2=1845.07
由于n1=16,n2=14,所以
=-0.34對于值,還可以用公式求得。依據表中數據,可求
=11.86,
=11.48,所以
=
=-0.34取α=0.05。由于df=16+14-2=28,查分布表,得=2.048。
由于計算的=0.34<2.048,所以,在0.05水平上保留原假設,結論為:男、女生語文成績沒有顯著性差異。
四、檢驗概述
(希臘字母,讀作卡方)檢驗是用來檢驗按屬性分類的計數資料的實際觀察次數分布與理論分布是否相符合的統計方法。檢驗公式為:
式中,為實際觀察次數;為理論次數。
χ2檢驗用于對點計而來的離散型數據資料進行假設檢驗,對總體的分布不做要求,也不對總體參數進行推論。χ2檢驗主要是對總體的數據分布進行假設檢驗,因此屬于自由分布的非參數檢驗。檢驗的步驟可概括為:(1)提出假設;(2)確定理論次數;(3)求值;(4)確定α水平,并查表確定理論值。(5)統計決斷。如果≥,則拒絕原假設,接受備擇假設,否則保留原假設。
(一)單向表χ2檢驗單向表中只有一個變量,被按一定標準分為k組。單向表χ2檢驗中,χ2值的計算公式可采用公式,自由度為df=k-1。
χ2檢驗的計算表
單向表χ2檢驗計算表分組Ⅰ分組Ⅱ分組Ⅲ總
和χ2
例1:隨機抽取60名學生,詢問他們在高中是否需要文理分科,贊成分科的39人,反對分科的21人,問他們對分科的意見是否有顯著差異?解:1.提出假設H0:學生對分科的意見沒有顯著差異H1:學生對分科的意見有顯著差異2.選擇檢驗統計量并計算對點計數據進行差異檢驗,可選擇χ2檢驗計算表
學生對分科意見的χ2檢驗計算表贊成39309812.7反對2130-9812.7總
和60605.4自由度為:df
=k-1=13.統計決斷查χ2值表,當df
=1時計算結果為:χ2=5.4*3.84<χ2=5.4<6.63,則0.05>P>0.01結論:學生對高中文理分科的態度有顯著差異。表
χ2檢驗統計決斷規則χ2與臨界值比較P值顯著性檢驗結果χ2
<
P>0.05不顯著保留H0,拒絕H1
≤χ2<
0.05≥P>0.01顯著*在0.05顯著性水平拒絕H0,接受H1χ2
≥
P≤0.01極其顯著**在0.01顯著性水平拒絕H0,接受H1例2:大學某系54位老年教師中,健康狀況屬于好的有15人,中等的有23人,差的有16人。問該校老年教師健康狀況好、中、差的人數比例是否為1:2:1?1.提出假設H0:健康狀況好、中、差的人數比例是1:2:1H1:健康狀況好、中、差的人數比例不是1:2:12.計算表15-4老年教師健康狀況的χ2檢驗計算表好1513.51.52.250.167中2327.0-4.016.00.593差1613.52.56.250.463總
和54541.223.結論查χ2值表,當df
=k-1=2時計算結果為:χ2=1.22χ2=1.22<5.99,則P>0.05結論:理論頻數與實際頻數差異不顯著,表明該校老年教師健康狀況的人數比例是1:2:1。(二)
雙向表的χ2檢驗把實得的點計數據按兩種分類標準編制成的表就是雙向表。對雙向表的數據所進行的χ2檢驗,叫作雙向表的χ2檢驗,即雙因素的χ2檢驗。假如把雙向表中橫行所分的組數用r表示,把縱列所分的組數用c表示,那么,雙向表的χ2檢驗也稱為r×c表的χ2檢驗。雙向表χ2檢驗的計算1.理論頻數的計算雙向表χ2檢驗中,理論頻數的計算公式為(16.1)
公式中,fxi表示橫行各組實際頻數的總和
fyi表示縱列各組實際頻數的總和
N表示樣本容量的總和例1:家庭經濟狀況屬于上、中、下的高三畢業生,對于是否愿意報考師范大學有三種不同的態度(愿意、不愿意、未定),其人數分布如表16-1。問學生是否愿意報考師范大學與家庭經濟狀況是否有關系?表16-1不同家庭經濟狀況學生報考師范大學的不同態度家庭經濟狀況對于報考師范大學的態度總和愿意不愿意未定上中下18201827197102011555936總和565341150解題過程解:1.提出假設H0:學生是否愿意報考師范大學與家庭經濟狀況無關H1:學生是否愿意報考師范大學與家庭經濟狀況有關
2.選擇檢驗統計量并計算對點計數據進行差異檢驗,可選擇χ2檢驗理論頻數計算計算理論頻數允許有小數,因為χ2分布已被作為連續型的分布看待。表
不同家庭經濟狀況學生報考師范大學的不同態度家庭經濟狀況對于報考師范大學的態度總和愿意不愿意未定上中下1820182719710201155=fx159=fx236=fx3總和56=fy153=fy241=fy3150=N20.5312.7222.0313.4419.4320.8515.0316.139.84計算表
學生報考師范大學的態度與家庭經濟狀況的χ2檢驗計算表愿意-上1820.53-2.536.40090.3118愿意-中2022.03-2.034.12090.1871愿意-下1813.444.5620.79361.5471不愿意-上2719.437.5757.30492.9493不愿意-中1920.85-1.853.42250.1641不愿意-下712.72-5.7232.71842.5722未定-上1015.03-5.0325.30091.6834未定-中2016.133.8714.97690.9285未定-下119.841.161.34560.1367總
和15015010.48023.統計決斷雙向表的自由度:df=(r-1)(c-1)查χ2值表,當df
=(3-1)(3-1)=4時計算結果為:χ2=10.48*9.49<χ2=10.48<13.3,則0.05>P>0.01結論:學生是否愿意報考師范大學與家庭經濟狀況有顯著關系。雙向表的χ2值除用理論頻數方法計算外,還可以用下式由實際頻數直接求得:公式中,foi
表示雙向表中每格的實際頻數
將例1數據用公式計算=10.48家庭經濟狀況對于報考師范大學的態度總和愿意不愿意未定上中下18201827197102011555936總和565341150表16-1不同家庭經濟狀況學生報考師范大學的不同態度練習一項研究中,調查了不同職業人群的價值取向,結果如下表。問人們所從事的職業是否與他們的價值觀有關?價值取向職業制造業服務業物質報酬4556人情關系3544五、其他統計量的顯著性檢驗
(一)積差相關系數的假設檢驗
由于樣本積差相關系數的抽樣分布隨著總體相關系數和樣本容量的大小而變化。當=0時,樣本的分布是對稱的,大樣本時服從正態分布,小樣本時服從分布;當≠0時,樣本的分布一般為偏態。因此在實際推斷時,常根據原假設=0和≠0兩種情況分別采取不同的檢驗方法。
原假設為H0:=0
1、
直接查表。要檢驗由實際觀測值求得的與原假設總體相關系數
=0差異是否顯著,可直接查相關系數臨界表。在一定α水平下,
=-2時對應的表中就是判斷能否拒絕H0的臨界值。如果計算的值大于值,則拒絕原假設,說明樣本相關系數與零相關有顯著差異,樣本并非來自零相關總體,否則保留原假設。例如從某總體中隨機抽取60名被試,他們在兩種測驗上得分間的相關系數為=0.6,問他們是否來自零相關的總體?直接查臨界表,當α=0.01時,df=n-2=58時,=0.325,由于計算的>,所以認為60名被試的兩種測驗成績并非來自零相關的總體。2、求t值。當原假設為H0:=0時,檢驗樣本相關系數與總體相關系數之間的差異,可以用檢驗,公式為:
,(=-2)(8.11)如果計算的的>
0.05/2(n-2),則說明樣本相關系數與零相關差異顯著,樣本并非來自零相關總體;如果計算的<
0.05/2(n-2),則說明樣本相關與零相關間差異不顯著,來自零相關總體,其值是由隨機誤差造成的,沒有意義。
以上介紹的這兩種方法主要適用于積差相關系數檢驗和斯皮爾曼等級相關系數檢驗。
例14.某數學教師隨機從自己的任課班級中隨機抽取38名學生的期中、期末數學成績,求得期中與期末數學成績之間的相關系數為0.7。問從總體上說,學生的期中與期末數學成績是否存在相關?解如下
解:提出假設。
H0:
=0,H1:≠0選擇并計算統計量。原假設為=0,依據公式(8.5)進行檢驗。已知=0.7,=38,所以取α=0.01,當=-2=36時,查分布表,得0.01/2(36)=2.719統計決斷。由于計算的=5.88>
0.01/2(36)=2.719,<0.01,與零相關有顯著差異,所以拒絕原假設,接受備擇假設,結論為學生的期中與期末數學成績之間存在相關。
原假設為≠0(8.12)式中,、分別是和的正態轉換值
為樣本觀測值的對子數。
如果≠0,而是某一數值時,即=c(c為常數)時,的抽樣分布呈偏態。在這種情況下,可將值經過一定的公式轉換為值(有現成的表可查),由于服從正態分布,所以可以采用Z檢驗,計算公式為:
例15.某小學三年級語文測試,39個學生的期中與期末考試成績的相關系數為=0.25。問全年級學生期中與期末語文考試成績的相關系數是否為0.34?
解:(1)提出假設。H0:ρ=0.34,H1:ρ≠0.34(2)將轉換成,ρ轉換成。當=0.25時,=0.25541,=0.34時,=0.35409
(3)計算Z值。
=-0.59(4)確定顯著性水平及臨界值。取α=0.05,0.05/2=1.96(5)統計決斷。由于計算的<
0.05/2=1.96,P>0.05。所以保留原假設,認為全年級學生的語文期中和期末考試成績的相關系數為0.34。
(二)兩個相關系數間差異的顯著性檢驗兩個相關系數間差異的顯著性檢驗是檢驗兩個樣本的相關系數所代表的兩個總體的相關系數是否有顯著性差異。將和轉換出和后,無論n為何值,-的抽樣分布都服從正態分布。所以可以采用Z檢驗法,公式為:
(8.13)式中,、分別是樣本相關系數和的轉換值;、分別是兩樣本的容量
例16.某小學三年級甲班有42名學生,其語文與英語成績的相關系數為=0.62,乙班有學生50名,其語文與英語成績之間的相關系數為=0.58。試問這兩班學生的語文與英語成績的相關系數之間是否存在顯著性差異?
解:提出假設。H0:ρ1=ρ2,H1:ρ1≠ρ2將和轉換成。當=0.62時,=0.725,當=0.58時,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 共享汽車項目投資計劃書
- 空調出租合同協議書圖片
- 股份轉讓合同協議書模板
- 廣告標書維修服務方案
- 企業數字化轉型的戰略規劃與實施案例
- 中國聚烯烴熱塑性彈性體項目投資計劃書
- 物流分站加盟合同協議書
- 就業協議書是勞動合同
- 健身工作室好評文案
- 制作合同協議書原聲視頻
- 2025年水發集團有限公司招聘筆試參考題庫含答案解析
- 信息安全及保密意識培訓
- 集成電路布圖設計專有權轉讓合同
- 2024年無人機配件定制采購合同范本3篇
- 電子商務法培訓課件
- 6.2《為了忘卻的記念》課件統編版高中語文選擇性必修中冊
- 麻醉過程中的意外與并發癥處理規范與流程
- 上海工程技術大學第2學期《機械原理》課程期末試卷及答案
- 南京工程學院《國際服務貿易B》2023-2024學年第一學期期末試卷
- 墊資借款合同范本示例
- 黑龍江大學《算法與數據結構》2022-2023學年期末試卷
評論
0/150
提交評論