第十一章教育測量的質量指標xinppt課件_第1頁
第十一章教育測量的質量指標xinppt課件_第2頁
第十一章教育測量的質量指標xinppt課件_第3頁
第十一章教育測量的質量指標xinppt課件_第4頁
第十一章教育測量的質量指標xinppt課件_第5頁
已閱讀5頁,還剩46頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第十一章 丈量的種類及其質量分析.第一節 教育丈量的種類根據丈量的目的分類:智力丈量、成果丈量、品德情況丈量、人格特征丈量、才干傾向丈量。根據丈量的方式分類:個別丈量、團體丈量根據丈量的資料分:文字丈量和非文字丈量根據丈量的來源分:規范化丈量、教師自編丈量根據參照規范分:常模參照丈量、規范參照丈量.第二節 丈量的信度一、信度的概念信度是指檢驗結果的不斷性或可靠性的程度信度可以了解為:一實測值和真值相差的程度 X=T+E (二兩次反復丈量或等值丈量之間的關聯程度.二、信度的估計方法一穩定性系數重測信度指用同一試卷對一樣被試者在不同時間檢驗兩次的實得分數的相關系數例:用某量表檢驗個學生,得分記為。

2、為了調查丈量結果的可靠性,于天后用原量表對這個學生重測一次,得分記為。問檢驗結果能否可靠?.二等值性系數復本信度 等值性系數是估計檢驗間跨方式的一致性目的,是以兩個等值題型、題數、難度、區分度一樣但詳細內容不同的量表,在最短時間內,對一樣應試者先后施測兩次檢驗所獲得的兩組對應分數的相關系數。.三內部一致性系數同質性信度是估計檢驗內部跨測題的一致性目的,是同一檢驗試卷的兩個部分得分的相關系數計算方法有兩種:.分半信度是把一次檢驗按標題番號分為兩半,一半是奇數題,一半是偶數題,計算兩部分的相關系數,最后用斯皮爾曼布朗公式校正.庫德爾理查森公式法rKR20的用法:這個公式以每題能正確回答的人數占總人

3、數的百分數為根底計算rKR20為整個檢驗結果的信度系數,為檢驗標題數,為各題正確反響人數占總人數的百分數;為個題錯誤反響人數占占總人數的百分數,為應試者總分的方差例:有一種包含個問題的檢驗,個應試者得分如下,試估計應試者反響的一致性程度.計算內部一致性系數要留意的問題:1假設用分半法時,以按奇數題和偶數題分為兩半為宜。2假設速率是檢驗的重要要素,那么不宜用分半法。3假設答案多種,得分多樣,不宜用上邊的公式計算。.3、論文式檢驗的信度系數.4、評分者信度計算方法肯德爾調和系數公式為:.三、影響信度的要素一檢驗的長度 普通來說,檢驗越長,信度值越高。這是由于: 檢驗加長,能夠改良工程取樣的代表性,

4、從而能更好地反映受測者的真實程度; 檢驗的工程越多,在每個工程上的隨機誤差就可以相互抵消。 三檢驗的難度 檢驗的難度與信度沒有直接對應關系,但是當檢驗太難或太易時,那么分數的范圍就會減少,從而降低信度。.三檢驗內容的同質性四被試者差別五評分的客觀性.四、提高檢驗信度的方法1.適當添加檢驗標題的數量2.檢驗的難度要適中3.檢驗的內容要盡量同質4.檢驗的程序應一致5.檢驗的時間要充分6.評分要客觀.第三節 效度一、效度的概念效度是量表能實踐丈量出其所要丈量的特性或功能的程度。效度可從以下幾方面了解:第一,丈量的效度一直是對一定的丈量目的而言的。第二,丈量的效度是對丈量結果而言的第三,丈量的效度只是

5、高低問題第四,在教育丈量中,丈量效度顯得更為重要.信度和效度的關系:信度是效度的必要非充分條件一個檢驗的效度不會超越它的信度的平方根.二、效度的類別和估計方法效度的種類內容效度構造效度效標關聯效度檢驗標題樣本對于應測內容與行為領域的代表性程度偏重于檢驗標題取樣的代表性,調查這些標題對所欲丈量的內容和行為反響丈量的有效程度構造:心思學或社會學上的一種實際想象或特質偏重于一個檢驗可以丈量到心思學和教學實際上的籠統概念或特質的程度效標:檢驗檢驗效度的參照規范,實踐上是本檢驗所想丈量或要預測的特性或功能檢驗分數與作為效標的另一獨立檢驗結果之間的一致性程度.一內容效度的概念和估計方法1.內容效度的概念檢

6、驗試題對欲檢驗內容或行為目的的代表性程度2.內容效度的驗證方法邏輯分析法統計分析法定量的方法.邏輯分析法定性的方法依托有關專家對檢驗標題與應測內容范圍的吻合程度作出判別對每一道標題逐一進展審查,以此構成“標題雙向細目表與“命題雙向細目表加以對照,以確定試卷的效度.統計分析法定量的方法克龍巴赫法兩套檢驗試題,對一樣被試實施測試后,計算得分的相關系數評分一致性調查法不同評分者之間評分的一致性程度,即調查評分者信度前后測對比法根據前后兩次檢驗的差別顯著性,確定檢驗的內容效度.二、想象效度及其驗證方法1.構造效度的概念檢驗對于人的假設屬性或實際概念丈量到的程度這些假設屬性或實際概念是決議人們外部行為的

7、內隱或潛在的特性.2.構造效度的建立過程 對所欲丈量的屬性根據某種實際提出假定的構造 根據假定的構造擬定測試題,編制檢驗 尋求檢驗分數與其它評定之間的關系 以檢驗結果為根據來驗證假設構造中的各種要素能否成立,驗證的方法可以從差別性上尋求證據 將與假設構造相違背的測試題刪去,對檢驗進展修正之后,再重新實施第和第個步驟.構造效度建立的例如建立實際框架從實際框架出發,提出各種假設根據假設編制檢驗以邏輯及實證的方法,檢驗結果能否符合心思學的實際框架及其假設比如:中學生數學才干的研討數學才干由分析才干、綜合才干、歸納和演繹才干、運算才干、空間想象才干構成;數學才干與早期教育有關;數學才干與智力正相關。編

8、制檢驗,施測并搜集檢驗結果分析檢驗結果,調查測試的構造效度,調查檢驗結果能否支持實際想象.三、效標關聯效度及其驗證方法1.效標關聯效度的驗證方法效標關聯效度是指檢驗分數與作為效標的另一獨立檢驗結果之間的一致性程度,即推斷某檢驗所得分數與同類規范檢驗所得分數的相關程度。效標關聯效度criterion-related validity的驗證方法是指一個檢驗對于處于特定情境中的個體行為進展預測時的有效性。.效標:檢驗檢驗效度的外在的、客觀的規范,即效度的規范.效標是足以顯示檢驗所欲丈量的或 要丈量的特性的變量。.分類:同時效度:檢驗分數與效標資料的獲得約在同一時間內延續完成,這兩種資料的相關系數即為

9、同時效度預測效度:在檢驗分數獲得一段時間后,才獲得效標資料,計算這兩種資料間的相關系數即代表檢驗的預測效度。.效標關聯效度的估計方法相關法直接計算檢驗分數與效標分數的相關系數積差相關、等級相關、二列相關等顯著差別法根據效標丈量將被試分為兩個極端組,檢驗這兩個組檢驗分數能否具有統計學上的差別顯著性命中率當檢驗用作取舍決策時,常運用命中率相關概念:總命中率、正命中率、負命中率總命中率高,那么測試的效度高例:70人參與的考試,經過檢驗選取了50人,淘汰了20人;選出的人中有40人合格,淘汰的人中有8人不合格。該檢驗的總命中率、正命中率和負命中率分別是多少?.第四節 工程的難度一、難度的含義難度是指檢

10、驗工程的難易程度描寫被試作答一個標題所遇到的困難程度的量數,叫做標題的難度系數,用符號 P表示在教育丈量中,P正確回答試題的人數R/參與檢驗的總人數N二、難度的計算客觀試題二分法記分:PR/N R:答對該題的人數;N:參與檢驗的總人數客觀題難度計算P=XK.教育丈量與評價中標題工程的難度二、難度的計算客觀題的極端分組法根據檢驗分數按高低排序,用兩個極端組高分、低分在某工程上的平均經過率表示工程的難度步驟:按檢驗總分由高到低排序從高分段向下選出全部試卷的27作為高分組從低分段向上選出全部試卷的27作為低分組按照上述公式計算工程難度值例:100人參與某檢驗,高分組與低分組各取27人,其中第一題高分

11、組20人答對,低分組10人答對。這道題的難度系數是多少?.教育丈量與評價中標題工程的難度二、難度的計算客觀題的極端分組法公式:步驟按檢驗總分依次排序,確定比例各為25的高分組和低分組為高分組、低分組分別編制每題得分的分析表試題分析表用上述難度公式計算難度值.教育丈量與評價中標題工程的難度公式的含義:XH:高分組所得總分;XL:低分組所得總分;H:該題最高分;L:該題最低分;N:考生總人數的254 10 404 0 0 5 2 105 1 57 8 567 6 42 8 5 408 8 6410 0 0低分組10 10 100高分組X f fx X f fx試題分析表例:100名學生參與論文式檢

12、驗,按高、低分各占總人數的25分組,其中第6題的得分統計表如下所示。求該標題的難度。.教育丈量與評價中標題工程的難度難度指出的僅僅是標題的相對難度,不能客觀地指出標題難度之間差別大小普通情況下,檢驗分數呈正態分布.教育丈量與評價中標題工程的難度三、難度對檢驗的影響難度對檢驗分數分布的影響過易、過難會呵斥檢驗分數偏離正態分布,使檢驗分數離散程度變小難度對檢驗鑒別力的影響檢驗的主要效果是鑒別考生實踐程度的高低適宜難度可以加大考生得分的差別,從而提高檢驗的鑒別力工程難度的適宜值為0.5左右時,檢驗得分的方差才可達最大值難度與檢驗目的的關系工程難度應根據檢驗目的來確定常模參照評價:區分學生才干或成就的

13、高低規范參照評價:了解學生到達教學目的規定的掌握程度.教育丈量與評價中標題工程的區分度一、區分度的概念區分度是檢驗對被試實踐程度的區分程度通常用D表示,取值范圍為1.00至1.00D越高時,試題的質量越好D為正時,試題積極區分D為負時,試題消極區分.教育丈量與評價中標題工程的區分度二、區分度計算方法極端分組法客觀性試題區分度的計算公式: DPHPL按檢驗總分從高到低排序確定檢驗總分最高的27的被試作為高分組,最低的27的被試為低分組分別求出這兩組被試經過試題的百分比將算得的有關數據帶入上公式.客觀性試題區分度的計算公式:闡明:XH:高分組所得總分;XL:低分組所得總分;H:該題最高分;L:該題

14、最低分;N:考生人數總人數的25步驟:按檢驗總分由高到低排序;分別確定檢驗總分的25、25作為高低分組;列出試題分析表;將數據帶入以上公式加以計算.教育丈量與評價中標題工程的區分度例:100名考生參與客觀性試題檢驗,按高、低分各占人數的25分組,其中第四題試題分析表如下所示,求該標題的區分度。4 10 404 2 8 6 5 306 3 188 6 488 4 32 10 4 4010 6 6012 0 0低分組12 10 120高分組X f fx X f fx試題分析表.教育丈量與評價中標題工程的區分度三、區分度計算方法相關法思索中間數據以工程分數與效標分數的相關作為工程區分度的目的效標分數

15、不易得到時,以檢驗總分替代相關越高,區分才干越好詳細方法:積差相關法點二列相關二列相關相關.積差相關法計算區分度非二分法記分的工程,可將標題得分與檢驗總分求積差相關系數以得到標題的區分度積差相關的另一計算公式:Sx為全體被試在某道標題上得分的規范差;Sy為全體被試總分的規范差;SD是由被試總分減去某標題得分而得到的新變量的方差.點二列相關計算區分度檢驗的一個變量是延續變量,另一個變量是二分變量時,要用點二列相關系數表示某工程的區分度公式的闡明:p為答對某題人數占全體人數的比例q為答錯此題人數所占全體人數的比例q1-pSt為全體考生的規范差生123456789101112131415161718

16、1920總8652947265227683807576736291477481886258題1001100111101101100020個學生參與語文檢驗,總分與某一個選擇題的得分情況如下表。計算該選擇題的區分度。.二列相關計算區分度檢驗總分與工程分數均為延續變量,其中一個被人為地分成兩個類別,公式的闡明:p為二分變量中某一類別在全部變量中所占的比例,q為另一類別所占的比例q1-pSt為全部延續變量的規范差Y表示正態曲線下與P相對應的縱線高度。生1234567891011121314151617181920總8652947265227683807576736291477481886258作47

17、37552722103542463940413852213942482927類合合合不不不不合合合合合合合不不合合不不.相關法計算區分度檢驗的兩個變量都是二分變量,可用計算相關系數來表示某工程的區分度以檢驗總分劃分為合格、不合格兩類的被試在某一標題上經過、未經過的人數列成四格表來計算另一類數據合計一類數據ABA+BCDC+D合計A+CB+DN.相關法計算區分度例:45名學生考取大學的人數和在某題上經過的人數由下表所示。假設以升學為效標,此題對學生能否有區分才干?205713經過考取未考取未經過檢驗計算出的r值能否到達顯著性程度,還需將r值轉換成2值,再進展2檢驗。.練習:生1234567891011121314151617181920總8690548950444328758260707581708076777950一1101000011011101111020名學生的期末成果如下表,為調查第一題能否有區分才干,將該題用二分法記分,答對記1分,答錯記0分。試計算該題的區分度。假設60分以上含60分為晉級,60分以下為留級。試用相關法分析該題的區分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論