




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、目錄考試成績評價的區分度、信度、效度等概念1高一化學備課組2009.3.264考試成績評價的區分度、信度、效度等概念1、試卷的區分度試卷的區分度指測試題目對被測試者實際水平的區分能力。區分度高的試 題,能將不同水平的被試者區分開來;區分度低的試題則對被試者水平不能很好地 鑒別。區分度是指試題對被試者情況的分辨能力的大小。一般在-1+1之間,值 越大區分度越好。試題的區分度在0.4以上表明此題的區分度很好,0.30.39 表明此題的區分度較好,0.20.29表明此題的區分度不太好需修改,0.19以下 表明此題的區分度不好應淘汰。計算區分度的方法很多,特別需要注意的是對同一個試題的考試成績采用不
2、同的方法所得到的區分度的值是不同的。我們可以使用下面的兩種方法計算區分度:(1)先將分數排序,P1=27%高分組的難度,P2= 27%低分組的難度區分度D =P1- P2或區分度D = (27%高分組的平均分一27%低分組的平均分)?/font滿分 值(2)利用積差系數r計算區分度D當兩個變量都是正態連續變量,而且兩者之間呈線性關系,表示這兩個變量 之間的相關成為積差相關。積差相關的使用條件a、兩個變量都是由測量獲得的連續性數據。如百分制分數。b、兩個變量的總體都呈正態分布,或接近正態分布,至少是單峰對稱的分 布。c、必須是成對的數據,而且每對數據之間是相互獨立的。d、兩個變量之間呈線性關系。
3、積差相關系數r的計算在計算機上是很容易進行的。積差相關系數r的公式 如下:r=(無法顯示)原諒!2、試卷的信度試卷的信度主要從兩個方面進行分析,一方面是考試成績期望值與實際成績平 均值的差異,考試成績期望值一般應以平時成績的平均值為依據確定.另一方面是考 試成績的預期及格率與實際及格率的差異,考試成績及格率的預期值同樣以平時成 績的及格率為確定依據.兩個方面的差異性較小,說明試卷信度較高.考試信度,簡單地說是考試結果的可信程度,是推測考試可信與否的最重要 的量化指標。任何考試結果都會因考試誤差的客觀存在而受到或多或少的影響,這 種誤差到底有多大,可用考試信度來刻畫。考試信度越高,說明考試分數的
4、誤差越小,考試成績越能代表學生個體的真 實水平。譬如:信度為0.8的考試就意味著,學生群體的成績波動有80%由真實水 平的差異性引起,另外20%則由各種誤差引起。一般認為,標準化考試的信度系數 應該在0.9以上。據研究,托福考試的信度在0.95以上,HSK考試(中國漢語水 平考試)的信度一般都在0.98左右,大學英語四、六級考試客觀題的信度達到 0.9 以上。考試信度越高,說明考試分數的誤差越小,考試成績越能代表學生個體的真 實水平。譬如:信度為0.8的考試就意味著,學生群體的成績波動有80%由真實水 平的差異性引起,另外20%則由各種誤差引起。一般認為,標準化考試的信度系數 應該在0.9以上
5、。據研究,托福考試的信度在0.95以上,HSK考試(中國漢語水 平考試)的信度一般都在0.98左右,大學英語四、六級考試客觀題的信度達到 0.9 以上。3、試卷的效度試卷的效度主要從內容效度和結構效度兩方面進行分析.內容效度Z1表示,是 試題所含知識點數與教學大綱中應試內容知識點數之比;結構效度用Z2表示,是指 試題考核學生的記憶,分析和運用的各種方法以及各方面解決問題的能力點數與應 試包含的各方面廣泛與能力點數之比.比例較高則說明效度較高.根據當前情況,對 于試卷效度的分析主要從內容效度進行分析,鼓勵同時進行結構效度的分析.高考試題的效度 信度(區分度 難度)什么意思? 高考的性質最主要的在
6、兩個方面:一、高考是一種選拔性考試,高考成績是高等學 校錄取新生的依據,這是高考的選拔性質。二、高考是一種導向性考試,高考是中 學教學的指揮棒,起著對中學教學的引導作用,這是高考的引導性質。高考性質的 這兩方面決定了高考試題應有的信度、效度、難度和區分度,而這些是我們進行高 考生物復習首先要清楚的,能夠避免我們在復習時的盲目。下面我先簡單地介紹一下信度、效度、難度和區分度四個概念:信度是指使用同一試卷對考生重復測驗時,或兩個平行試卷對考生測驗時,所得測 驗分數的一致性和穩定性程度。效度是指考試有效性或正確性的質量指標,考試效度的高低反映著考試是否達到它 的預定目的,是否考了要考的內容。難度指試
7、卷(題)的難易程度。一般用試卷(題)的得分率或答對率表示,所以難度事 實上是容易度或通過率。其值在01之間,數值越大,說明試卷(題)越容易。區分度是指試題對不同考生的知識、能力水平的鑒別程度。如果一個題目的測試結 果使水平高的考生答對(得高分),而水平較低的考生答錯(得低分),它的區分能力 就很強。題目的區分度反映了試題這種區分能力的高低。一般認為,區分度的數值 達到了 0.3,便可以接受;低于0.3的題目,區分能力差。高考的性質決定了高考試題首先要保證信度,缺少信度或信度較低都無法向幾百萬 考生交代,無法向考生家長交代,無法向社會交代。從這一角度看高考試題所考查 的一定是確定性和穩定性的內容
8、,對于現在還沒有被確定的內容或者說有爭議內容 是不能作為高考命題依據的。你知道了嗎?復習時,可不要讓這樣的問題浪費你的 精力呀!同時要注意,有些題目看起來讓你回答的是假設和猜想,你可不要忘記高 考試題的確定性,不要得意忘形呀,還是老老實實從生物學的基本原理來回答,只 有這樣你才能得分。OK!高考的效度要求高考試題是有效和正確的,考查的是考綱規定的內容。你想想牽動 著百萬考生、千萬家庭、億萬人員,如果哪位命題大人在命題中出了錯誤或者超出 了考試要求,會怎么樣呢?哪他可就大了,他將成為千夫所指,這樣的事情是每一 位命題人都不會干的。鑒于此,我們的復習一定要緊緊盯住考試綱要,對考試綱要 要求的內容理
9、解、記牢,讓它扎根心田;對于違背考試綱要或超出綱要要求的內 容,則不要理睬;一些腦筋急轉彎、文字游戲類的問題就讓它見鬼去吧。高考試題要有難度,這個難度有多大,平時復習需要用什么樣的態度去對待不同難 度的試題呢?高考試題的難度與參加考試人數和當年高等學校的錄取人數是密切關 聯的。去年山東省高考報名人數是70多萬,實際錄取人數接近40萬,高考試題的 難度定位應該是有利于把這40萬考生選拔出來,因此,試題的難度系數應在0.6左 右。這意味著什么?意味著將有60%左右的考生通過高考被定位在基礎較好、能力 較強、具有學習潛能;而90年代只有10%左右的考生能夠進入高校相比,那時10% 左右的考生通過高考
10、被定位在基礎較好、能力較強、具有學習潛能。這不是說現在 學生中優秀的比例提高了,而是高考試題的難度變了,高考試題的側重點變了。變 成什么樣了呢?變成60%的試題是基礎題目了。你只有能把基礎概念、基本原理、 基本事實掌握了你就至少能拿到60%的分,你就進入了優秀基礎較好、能力較強、 具有學習潛能的考生的行列。高三復習,特別是一輪復習的重點和目標就確定了一 一基本概念、基本生物事實、基本生物學原理、基本生物學方法、基本生物學思 想。記住了,抓基礎,把60%先抓在手中。高考是選拔性考試,高考試題一定要有區分度,以利于不同層次學校對人才的選 拔。因此高考還要有中檔題和難度較大的題目,根據考生人數和錄取
11、人數的比例, 這兩類題目所占的比例將在40%左右。對于生物學科講,這部分試題的難度主要體 現在生物科學思想和生物知識的運用,以及生物試題的解題技巧上。要想在這部分 試題中得高分也不難,需要在平時復習時注意在做題目的同時總結方法,逐步建立 起生物科學的思維方法和熟練生物學試題的解題技巧。前60%是進入高校的保證, 后40%則是進入較好大學所必需的,誰不想上大學,誰不想上好大學,因此這部分 試題往往成了香餑餑,為此,今后每期我們都專門開設專門欄目進行輔導,設計專 門的創新題供大家熱身。這部分確實很重要,但要有前面的60%作基礎,切不可逐 末舍根呀。高一化學備課組2009.3.26什么是試題難度系數
12、?考試難度系數如何計算?難度系數反映試題的難易程度,即考生在一個試題或一份試卷中的失分程度。如滿 分150分的試題,考生平均得分108分,平均失分42分,則難度系數為 42/150=0.28。難度系數的計算公式為:L=1X/W其中,L為難度系數,X為樣本平均得分,W為試卷總分(一般為100分或 150 分)。什么是試題區分度?試卷區分度計算公式是什么?試卷區分度反映試題區分不同水平受試者的程度,即考出學生的不同水平,把優 秀、一般、差三個層次的學生真正分別開。區分度高的考試,優秀、一般、差三 個層次的學生都有一定比例,如果某一分數區間學生相對集中,高分太多或不及格太多的考 試,區分度則低如果把
13、成績從高往低排序,前50%的考生為高分組,后50%為低分組,其計算 公式為:D=2(XHXL)/W其中,D為區分度,XH為高分組平均分,XL為低分組平均分,W為試卷總分(一般為100分或150分)。從以上公式可以看出試題難度系數和區分度并沒有直接聯系,因為前者是反映樣本 總體的一個參數,后者是反映樣本2個部分的參數。測試的命題質量如何,否對考生的知識程度和能力進行有效的測量,除了上面 介紹的試題難度和區分度知識外,還需要對試卷做整體分析,試卷整體分析的指標 主要是信度和效度。測試信度也叫測試的可靠性,指的是測試結果是否穩定可靠。也就是說,測 試的成績是不是反映了受試者的實際語言水平。例如,如果
14、同一套測試在對同一測 試對象進行的數次測試中,受試者的分數忽高忽低的話,則說明該測試缺乏信度。 測試的信度與測試的效度有著密切的關系。一般說來,只有信度較高的測試才能有 較高的效度,但效度較高不能保證信度也一定較高。測試的信度主要涉及到試題本 身的可靠性和評分的可靠性這兩個方面。試題本身是否可靠主要取決于試題的范 圍、數量、試題的區分度等因素;評分是否可靠則要看評分標準是否客觀和準確。 測試的信度通常用一種相關系數(即兩個數之間的比例關系)來表示,相關系數越 大,信度則越高。當系數為1.00時,說明測試的可靠性達到最高程度;而系數是 0.00時,則測試的可靠性降到最低程度。在一般情況下,系數不
15、會高到1.00,也 不會降到0.00,而是在兩者之間。對信度指數的要求因測試類別的不同而不同, 人們通常對標準化測試的信度系數要求在0.90以上,例如“托福”的信度大致為 0.95,而課堂測試的信度系數則以0.70-0.80之間為可接受性系數。測試信度的計 算方法有很多種,以下僅介紹三種易于操作的方法:1)重測法。用同一套試卷在兩個不同時間內來測試同一批受試者,這樣便 獲得兩組分數,然后計算出兩組分數的相關系數。當然,在兩次測試中,學生第二 次的測試成績理應比第一次的要高,因為在第二次測試時學生已經有了進步而且臨 場經驗也更豐富了。但是若該試題是比較可靠的,每個學生在兩次測試中的排名次 序應該
16、是基本不變的。2)交替形式法。對同一批受試者使用試題類型完全相同,難易程度相當,但 具體題目不同的兩套對等試卷先后進行兩次測試,然后計算出兩次得分的相關系 數。3)對半法。測試只進行一次,但將整份試卷的題目按單、雙數分成兩組來分 別計分,算出兩組分數的相關系數,然后再用Spearman-Brown的公式計算整份試 卷的信度系數。具體計算步驟是:將兩組分數的相關系數乘以2,再除以1加兩組 分數的相關系數。測試效度亦稱測試的有效性,指一套測試對應該測試的內容所測的程度。也 就是說,一套測試是否達到了它預定的目的以及是否測量了它要測量的內容。例如用 聽寫來測量學生的聽覺能力,其效度是不理想的,因為書
17、面記錄有聲語言不僅涉及 學生的聽覺能力,而且還與他們的書寫速度、拼寫能力、語法知識、記憶能力和對 全文的理解能力等有關。測試的效度一般可分為以下幾類:1)表面效度。指測試應達到的卷面標準,即一套測試題從表面看來是否是合適 的。例如,若一次閱讀理解力的測試包括許多受試者沒有學過的方言詞匯,則可認為這 次測試缺乏表面效度。表面效度是測試出受試者正常水平的一種保證因素。2)內容效度。指一套測試題是否測試了應該測試的內容或者說所測試的內容是否 反映了測試的要求,即測試的代表性和覆蓋面的程度。例如,如果某一套發音技能測 試題僅僅考查發音所必須具備的某些技能,如只考單一音素的發音,而不考查重讀、語 調或音
18、素在詞語中的發音,那么,該測試的內容效度就很低。3)編制效度。指一套測試題的諸項目對編制該測試所依據的理論的各個基本方面 的反映程度。例如,以結構主義語言理論為基礎,認為系統的語言習慣是通過句型而 獲得的,那么,強調詞匯和語法環境的測試題目就失去了編制效度。4)經驗效度。經驗效度是一種衡量測試有效性的量度,通過把一次測試與一個或 多個標準尺度相對照而得出。經驗效度可分為兩種:一是共時效度,即將一次測試的 結果同另一次時間相近的有效測試的結果相比較,或同教師的鑒定相比較而得出的系數;二是預測效度,即將一次測試的結果同后來的語言能力相比較,或是同教師后來對學 生的鑒定相比較而得出的系數。一般來說,對某次測試的效度進行檢驗時,除了要根據教學大綱的要求和觀念有效 性的理論對試卷的內容進行考查以外,還須采用計算相關系數的定量方法,即 計算出本次試卷與另一份已被確定能正確反映受試者水平的試卷之間的相關系數。系數 高則有效性大。課堂測試的效度應在0.4-0.7之間,規模較大的測試其效度應在0.7以 上。信度與效度的關系:信度低,效度不可能高。因為如果測量的數據不準確,也并不能有效地說 明所研究的對象信度高,效度未必高。例如,如果我們準確地測量出某人的經濟收入,也未必能 夠說明他的消費水平。效
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教學評估團日活動
- 家訪記錄表培訓
- 情境測查考試題及答案
- java面試題及答案session
- oracle理論面試題及答案
- 健康素養考試題及答案
- 兒童哲學與教育
- 扶貧站面試題及答案
- 歷史巢湖中考試題及答案
- 工業互聯網平臺量子密鑰分發技術產業生態構建報告
- 西部科學城重慶高新區引進急需緊缺人才38人模擬檢測試卷【共1000題含答案解析】
- 淺談高血壓的聯合用藥
- 天津工業大學2023級本科學生轉專業名額及條件等相關情況一
- 新護士五年規范化培訓手冊
- 醫學免疫學和病原生物學理論知識考核試題及答案
- 勝保養操作手冊江鈴馭
- 疫苗及其制備技術課件
- 阿里巴巴公司價值觀實施細則
- 安全防范系統設計方案
- 《人衛版第九版內科學心力衰竭》課件PPT
- 中國監察制度史
評論
0/150
提交評論