




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、中國水利水電出版社第第11章章 標準參照測驗及其鑒定標準參照測驗及其鑒定目錄1 概述2 分界分數的確立3 測題分析4 信度的估計5 效度的檢定1 概述 1.1 定義1.2 分類1.3 產生與發展1.4 與常模參照測驗的區別與聯系1.1 標準參照測驗的定義 定義: 一般認為,標準參照測驗是以預定的標準為參照,來衡量個體被試是否達 到這一標準的測驗。注: 標準:被試應當達到的行為表現水平 結果解釋:標準,測驗通過 標準,測驗未通過1.2 標準參照測驗的分類 分為:1.領域參照測驗:領域參照測驗必須對行為領域進行嚴格而精確地界定,以便對個體領域分數具有可解釋性。2.掌握測驗:掌握測驗源于掌握學習理論
2、,是建立在一組教學和行為目標之上,按教學目標分為掌握者和未掌握者。1.3標準參照測驗的產生與發展常模參照測驗盛行(基礎:經典測驗理論)20世紀五六十年代,產生用絕對標準評定成績的期望1962年,格&克首提標準參照測驗,標志著其產生,但因費解并未引起廣泛關注1969年,波&赫發表論文,推動了其發展70年代,提出了一系列數學模型80年代,發表些研究報告,出版了專著,其趨于成熟1.3標準參照測驗的產生與發展n1969年以后,理論發展的同時,測驗實踐也在迅速發展n80年代新興項目反應理論為其發展提供指導1.4 與常模參照測驗的區別 區別參照系結果解釋分數形式用途組成標準參照測驗1.預定
3、的外部標準2.建立在團體之外3.絕對的是否達到標準絕對評分畢業考、職業考等難度與測量目標一致,無區分度常模參照測驗1.取常模2.建立在團體之內3.相對的相對地位相對評分選拔與競賽難度適中,區分度較大1.4 與常模參照測驗的聯系 1.人們在為某種被試團體確定標準時,總要考 慮這種被試在所測特質上的一般發展水平,也就是說,標準中含有常模的因素。2.標準參照測驗雖然強調標準的達成,但它并不抹煞被試間的個別差異。它承認無論在達標者內部,還是在未達標者內部,都存在著掌握百分比的不同。3.可結合使用,如高中考試。 2 分界分數2.1 概念2.2 意義2.3 確定方法分類2.4 具體方法2.1 概念概念:
4、劃分通過與未通過、掌握與未掌握,或不同掌握程度能力組的臨界點注: 若分成通過與未通過兩類,則只有一個分界分數 如分成不同掌握程度能力組,則有多個分界分數 2.2 意義1.為測驗結果的解釋提供直接依據2.為決策提供有力的依據2.3 確定方法分類n共38種之多n依潛在特質/能力的假設分: 1.狀態模型:掌握行為表現是一種全有 全無的狀態,故將真正掌握的分界分數設定為100%。 2.連續模型:掌握行為是一種連續分布的能力,是連續體的上端區間(23種,占60.53%)n依專家判斷/被試的測驗分數分: 1.判斷法:一位或幾位評判者,不參考被試測驗分數,完全靠判斷來確定分界分數(占1/3) 2.判斷經驗法
5、:專家判斷為主,被試測驗分數為輔 3.經驗判斷法:被試測驗分數為主,專家判斷為輔 n依判斷經驗法分: 1.用經驗資料確定分界分數 2.用經驗資料估計誤差等,調節分界分數2.4 具體方法1 判斷法2 判斷與經驗法 3 兩種方法的比較2.4.1 判斷法 安戈夫方法 安戈夫修正法 納西夫方法 埃貝爾方法 麥克尼恩及哈爾平方法安戈夫方法1.多位評判者給出剛達標的被試能正確回答每題的概率估計值2.取每題估計值平均數3.估計值平均數相應題的滿分值4.求和,即為分界分數安戈夫修正法n與安戈夫法唯一不同之處: 評判者估計概率是從以下特定的7種5%,20%,40%,60%,75%,90%,95%中選擇的納西夫方
6、法1.評判者對假設剛達標者能否正確回答各題作出估計:能記為+1,否記為-1,不確定記為02.將各位評判者估計結果進行綜合:符號出現次數60%,則記為該種符號符號出現次數都60%,則轉換成概率,然后求其平均(轉換方法:-130%,060%,+180%)3.將綜合結果按上述轉換方法轉換成概率4.各題概率相應滿分值5.求和,即為分界分數埃貝爾方法1.評判者按測題難度、測題與內容的相關性兩個維度將每個測題歸入34列聯表中2.給出剛達標者能正確回答各題的概率估計值3概率相應的滿分值4.每小格相加求和5.所有格相加求和6.計算出每位評判者的最后評分,取平均數,即為分界分數麥克尼恩及哈爾平方法n與埃貝爾方法
7、基本相同,不同之處為: 維度完成測題所需的反應能力、測量目標2.4.2 判斷與經驗法方法: 先由評判者對達標者、未達標者、難以確定者進行區分,再由被試成績確定分界分數分類: 邊緣組法 對照組法 依常模及定額法邊緣組法1.評判者界定剛達到合格水平的最低行為標準2.從應試者中選出與最低行為標準相接近的被試,組成邊緣組3.對邊緣組進行測試,取其中位數作為分界分數對照組法1.去除邊緣組,達標者與未達標者形成對比組2.將達標者與未達標者此次測驗分數的頻數分布曲線繪制在同一坐標軸上3.若誤判為未達標者與誤判為達標者嚴重性相同,取兩條曲線重疊面積的均分點作為分界分數 若嚴重性不同,則根據實際需要分割兩條曲線
8、重疊的面積,選擇合適的分界分數依常模及定額法1.A測驗與另一已知測驗B相關性較強2.B的分界分數有效3.A的通過率與B的通過率相近則 可用B的通過率直接確定A的分界分數2.4.3 兩種方法的比較n評價標準: 1.技術上的充分性: (1)能否確定一個或幾個分界分數 (2)對被試實際測驗成績的反應程度 (3)對教學或訓練實際效果反應程度 (4)統計上的理論依據 (5)提供決策的效度證據n評價標準: 2.實用性: (1)易于實施 (2)易于計算 (3)易于向非專業人員解釋 (4)非專業人員對它的可信性n按四個等級排列: 1很不好 2不好 3好 4極好 (見表11.11)判斷法的優缺點n優點: 較強的
9、實用性n缺點: 1.技術上的充分性較差 2.主觀性較強:個人主觀性 群體主觀性 判斷與經驗法的優缺點n優點: 1.技術上的充分性較強 2.某種程度上減少了主觀性 3.具有一定的實用性n缺點: 1.對達標者、邊緣者、未達標者 行為反應的界定比較難 2.仍存在一定的主觀性3 測題分析3.1 測題分析的維度3.2 測題識別度分析3.3 敏感度分析3.1 測題分析的維度n測題是否有助于對達標者和未達標者作出正確的判斷n測題是否測量了相應的內容和目標n測題編寫的技術性問題3.2 測題識別度分析n測題識別度指數:達標者及未達標者對某題答對人數比率之差。n其計算公式為:在這里, 為測題的識別度指數 為達標者
10、中對某題正確回答人數比率 為未達標者中對某題正確回答人數比率pnDPPDpPnP數值解釋n識別度指數的數值范圍在1至+1之間 負值測題質量很差,起到了反效果 0無識別能力 正值數值越大,識別力越強,測題質量越好 優缺點n優點: 只需對一組被試實施一次測驗n缺點: 識別度指數的計算及解釋受分界分數大小的限制(因其受比率影響)3.3 敏感度分析n 測題敏感度分析 指測題對教學效果的反映能力n同一測題對被試施測 +做對 -做錯n敏感性指數: 同一組被試對某個測題在教學前后答對人數比率之差 或 對等的教學組與未教學組對某題答對人數比率之差其計算公式為:ABRRST數值解釋n數值范圍在-1到+1之間 負值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 艾滋實驗室管理制度
- 苗圃地用工管理制度
- 茶空間店長管理制度
- 小學語文《靜夜思》課件
- 《一年級下冊語文園地一》課件
- 大學生談戀愛利與弊
- 自動駕駛汽車的安全認證
- 記賬實操-新入職一家公司會計遇到財務做賬問題的解決方案
- 設備維修工作個人總結(二篇)
- 遼寧省丹東市九校聯考2024-2025學年七年級下學期5月期中考試英語試題(含筆試答案無聽力答案、原文及音頻)
- 2025年全國統一高考語文試卷(全國一卷)含答案
- 四川體彩銷售員考試試題及答案
- 2025年河北省萬唯中考定心卷生物(二)
- 廠區物業維修管理制度
- 瀘州理綜中考試題及答案
- 內鏡室患者服務專員職責與流程
- 2025龍巖市上杭縣藍溪鎮社區工作者考試真題
- 2025建設銀行ai面試題目及最佳答案
- 養老院養老服務糾紛調解管理制度
- 潛水作業合同協議書
- 2025-2031年中國天然氣勘探行業市場運行態勢及投資潛力研判報告
評論
0/150
提交評論