教育測量與評價_第1頁
教育測量與評價_第2頁
教育測量與評價_第3頁
教育測量與評價_第4頁
教育測量與評價_第5頁
已閱讀5頁,還剩9頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、弟一早、育測與評價的學科發展教育測量與評價一.教育測量1、測量:根據法則給事物賦予數量。(史蒂文斯)測量:客觀事物及其屬性;所依據的規則或方法;數量化的結果。2、教育測量:廣義:對于教育領域內的事物或現象,根據一定的客觀標準,作縝密地考核,并依據一定的規則將考核的結果予以數量的描述。狹義:是指對學生某些學科經過學習和訓練之后,所獲得的知識、技能的測量。又稱成就測量、學業成績測量或學科測量。3、教育測量的特點:1 .間接性和推斷性2 .測量對象的模糊性和測量誤差的不可避免性3 .量表具有多樣性,結果具有相對抽象性4 .測量目的的針對性二.教育評價評價:評:評定;價:價值一一教育價值教育評價:注重

2、效果:美國的泰勒;注重資料的獲得:美國的克龍巴赫、斯塔弗爾比姆;注重評價方法、手段:中國的張秀理、日本的長谷川容1、教育評價的概念:教育評價是評價者對教育活動或行為主客體價值關系、價值實現過程、結果及其意義的一種認識活動過程,其核心內容是揭示教育活動或行為中的客體對主體的需要、目標的價值意義。三.教育測量與評價的關系聯系:教育測量就是指根據一定的理論、規則,運用一定的測量工具對教育現象進行數量化描述的過程教育評價是對教育現象狀態和價值的判斷,這一判斷是以對評價對象的客觀描述為前提的,沒有對評價對象的客觀描述,就不會有對評價對象價值的客觀判斷教育測量是教育評價的基礎,教育評價要在教育測量所獲得的

3、客觀信息的基礎上進行同時,教育測量的結果要通過評價才能獲得實際意義.教育測量與評價的區別:第一,測量是對事物數量特征的獲得。而教育評價則是對教育現象客體的價值進行判斷。第二,教育測量是一種純客觀的過程,具突出特點是客觀性。而教育評價則具有兩種屬性,即客觀性和主觀性第三,測量的任務是對事物的量的認識,而評價作為一種認識活動,是人的意識對實踐活動及其結果的綜合反映,它反映的是活動的過程和終點,又是新的實踐活動的起點。教育測量與評價的產生與發展過程:一.教育測量的產生來源:網絡轉載1904年以前(教育測量的萌芽期)中國的科舉制(隋煬帝大業二年,公元606年)科舉制的特征:逐級考核、制度完備、考場嚴格

4、、命題規范科舉制的考核方法:口試、貼經、墨義、策問、詩賦產生在中國、發展在西方美國賀拉斯曼1845年將筆試”引入美國英國費舍在1864年作業量表集美國賴斯在1897年的拼字實驗1904-1915年教育測量的開拓期:美國桑代克的巨著精神與社會測量導論問世。標志著以科學理論為指導的教育測量理論的誕生。桑代克在這本巨著中提出:無論什么東西,只要存在,總存在于數量之中麥克爾提出:任何東西,存在于數量中的,都可以被測量這就是后來人們說的凡存在的東西必有數量;凡有數量的東西都可以測量”這兩句話,看成是構成一切測驗和量化評價的公理。1909年,桑代克根據等距原理”發明了編制量表的單位,編制了標準化的測驗量表

5、。1915-1930年教育測量的興盛期:在桑代克的影響下,教育測量的運動轟轟烈烈的開展測驗品種有算術測驗、書法測驗、學科測驗、智力測驗、個性測驗、興趣測驗等,在數量上已有3000多種標準化測驗的問世1930-1940年教育測量的批判期:對教育測量批判的原因:教育測量雖然能使教育成就定量化、客觀化、標準化;但畢竟不能測量出人的學力和人格的全部內容。第一次大戰以后,人們的教育觀點發生了很大的變化,不在將教育看成是單純的傳授知識,而是將人的全面發展作為教育目標。而人的全面的重要因素如:社會道德、人的情緒態度、動機興趣、鑒賞力等是不能光靠測量的。教育測量存在的弊端:為測量而測量,盲目追求量化,忽視教育

6、服務對象的整體目標與價值。教育測量的理論基礎只有心理學、統計學和測量學,而沒有教育學原理。二.教育評價的產生1、教育評價產生的社會背景:1929-1933年席卷美國、波及全球的經濟大蕭條社會與教育危機四起生產過剩、工廠倒閉、工人下崗學校因經濟不景氣,部分學校關閉,有些學校的班級減少。整個社會和教育皆處于反省之中1930年美國有25%的失業,青年近乎100%找不到工作,1910年1417歲的青年17%上大學,而到1930年上升到51%。來源:網絡轉載有相當一部分人上高中并不想上大學,而當時的美國高中設課就是為了上大學服務的,為此中學設課與失業青年的需求就產生了尖銳的矛盾2、教育評價的起源:美國進

7、步主義聯盟負責人艾欽于19331940年領導了中學課程改革實驗研究,其中課程評價委員會由俄亥俄州的州立大學教授泰勒主持,這就是美國教育歷史上著名的八年研究”,也是教育評價問世的開始。八年研究的內容:泰勒教授選了30所參加實驗的高中學生,對這些學生進行了4年中學、4年大學學習的追蹤研究,歷時八年”,這也是八年”研究的由來。當時選進步學校和和傳統學校學生各1475人,按性別、年齡、種族、學業能力傾向、家庭、社會環境、職業興趣和嗜好等基本原則進行一一配對,進行比較。評價是八年研究的有機組成部分,泰勒認為課程計劃和編制必須回答以下四個基本問題1、應幫助學生達到什么目標?2、為達到目標應幫助學生學習那些

8、預期的知識?3、怎樣組織學習過程才能使學生的學習成效最大?4、怎樣評價教學方案結果發現:來自實驗的學生在大學四年中,每年獲學術性榮譽略多;具有更強的理智、好奇心和學習動機;思維更精密、更系統、更客觀;對教育的意義有更清晰的看法;對新情況有更強的應變能力;具有更有效的解決問題的辦法;更多的參加有組織的學習團體;獲得非學術的榮譽更多些;對職業的選擇有更好的定向;更積極的關注全國和全世界的事物。新舊課程比較結論:前三項經統計檢驗均存在顯著性差異記憶活動傳統的高于進步學校,但經統計檢驗兩者沒有顯著性差異教育評價的問世:八年研究后泰勒等人的研究結論是:舊課程及其教育測驗是教科書主義,測驗內容只是要求學生

9、記誦教材中的知識,是片面的,不能反映學生的全面發展。泰勒提出:以全面發展的教育目標為核心和依據的兩條相互依存的原理,即課程編制原理和評價活動原理,也就是泰勒原理教育評價的創始人一泰勒:在八年工作報告中第一次提出教育評價這個報告被稱為劃時代的教育評價宣言”宣布了教育評價的誕生給出了教育評價的原理、方法和手段奠定了泰勒-教育評價之父的地位來源:網絡轉載同時也迎來了美國教育史上泰勒時期的到來”3、評價的發展:1940-1957年教育評價的平穩期:特點:教育評價的理論在不斷的進行深入研究布魯姆完成教育目標分類學教育評價活動沒有普及這與當時美國的歷史背景有關,二戰后,美國處于籌劃與享受生活的時代”。社會

10、對教育的發展很少提出新的要求。19571972批判泰勒模式時期:特點:1957年前蘇聯的人造衛星上大引發美國對教育的不滿開始批判泰勒教育模式1972-現在專業化時期特點:高等學校出現了許多教育評價的碩士、博士、博士后專業點各類教育評價研究中心紛紛建立如:美國有西密執安大學評價中心、洛杉磯加里福尼亞大學研究中心等教育評價專著、雜志大量出版如:評價研究評價評論評價信息等4、教育測量與評價的發展趨勢及特點教育測量的政治性得到強化教育測量的重心發生了變化教育測量的理論得到飛躍發展計算機技術的發展提高了測驗的效率測驗的統計模型為教育測量學科發展提供強有力的理論支持更加重視測量結果的解釋教育測量內容的發展

11、:評價方法由注重相對評價轉向重視絕對評價重視教育目標研究教育評價研究中不斷引入新的研究方法越來越重視發展性教育評價理念和被評價者的參與越來越重視元評價越來越重視對評價結果的全面解釋和慎重處理第二章、教育測量與評價的基本原理教育評價與測量的類型一、教育評價的分類1、根據評價對象的層次和內容來劃分:宏觀評價:指對影響到全社會的那些指導、規范教育活動的各種因素進行的評價。微觀評價:指對某項具體的教育活動過程,對實施、管理教育活動的組織與個人.對教育活動指向的具體對象等內容進行的評價來源:網絡轉載2、按評價內容的復合程度來劃分:單項評價:指針對教育評價對象某一方面狀況進行的評價。綜合評價:指對評價對象

12、狀況的方方面面作整體評價。3、按評價的功能及用途來劃分:診斷性評價:為使教育活動的形式、內容、過程等更適合活動對象的自身條件及需要而進行的評價。如:摸底考試。形成性評價:在教育活動過程中為不斷了解活動進行的狀況以便能及時對活動進行調整,進而提高活動質量進行的評價。如:單元測驗。終結性評價:指對教育活動的效果進行的評價。如:期末考試4、按評價參照的標準來劃分:相對評價:根據評價對象的實際狀況設定評價標準。評價標準在被評對象群體內部產生。絕對評價:依據某種需要或要求設定評價標準。評價標準在被評對象群體外部產生,且標準固定。個體內差異評價:以評價對象某一狀況作為設定評價標準依據的評價。5、按評價主體

13、來劃分:他人評價:由活動實施者以外的人作為評價主體進行的評價。自我評價:由活動實施者作為評價主體進行的評價。6、按評價方法來劃分:二一一一.一定性評價:采用開放的形式來獲取評價信息、對評價結果的性質進行說明的評價活動。定量評價:采用結構式的方法,預先設定操作化的評價內容,收集評價對象可以量化的信息,得出數量化結果的評價活動。二、教育測量的分類1、根據測驗目標來劃分二j成就測驗:目標在于測量學生在各學習階段學到了什么,旨在檢測教育目標希望學生能達到的具體行為。如:學科測驗如:教學階段測驗(診斷和總結性測驗)能力測驗:旨在測量個體的不因外界環境影響而輕易改變的、較穩定的、表現在認知能力方面的心理特

14、質.比如觀察力、記憶力、理解力、概括力、空間能力、判斷推理能力等等。也被稱為智力測驗能力傾向測驗:目的在于測量學生的潛在學習能力及學術發展趨向。潛在能力是指個體從未來教育或訓練中可能受益的能力。這類測驗主要用于預測學生的未來成就和能力,從而可以幫助決策者和學生自己選擇合適的學校、專業及最佳職業。能力傾向測驗分為:一般學習能力測驗、特殊能力傾向測驗。2、根據測驗分數的解釋標準來劃分常模參照測驗:目的在于考查被試的個體差異,一般用于衡量被試相對水平的,以選拔為目的的大規模測驗。標準參照測驗:目的在于考查被試是否已達到某種標準。一般用于以教學目標為標準考查學生實際水平的測驗。常模團體總體要明確常模團

15、體必須是被試總體的一個代表性樣本來源:網絡轉載樣本的大小要適當注意常模團體的更新測驗手冊中必須詳盡描述取樣過程常模參照測驗與標準參照測驗的比較:1、從考試的目的和用途來看,它們都通過測量學生的學習成績,考查其優劣,但常模參照性測驗將考生成績做橫向比較,著眼于個別差異,主要用于選拔性測驗和總結性測驗等。2、從考核目標的陳述來看,都明確具體,為編制測驗提供依據,但常模參照性測驗可采用一般目標或具體目標,而標準參照性測驗必須采取非常具體且詳細的目標。3、從題型的選擇和題目的分配來看,都需采用各種不同題型,試題必須是教學目標的有代表性的樣本;常模參照性測驗多采用選擇題,題目分散在全學科的全部知識領域內

16、,題目按從易到難的順序排列;標準參照性測驗較少依賴選擇題,題目分別分布在一定目標中,題目按教學目標順序排列即可。4、從考試及考題的質量要求來看,它們都按照標準化考試的編制原則,保證考試有較高的信度和效度;常模參照測驗題目要求難易適中,強調題目的鑒別力,測驗信度的估計適合用統計方法;標準參照測驗的題目和學習結果直接聯系,不強調題目的鑒別力,測驗信度的估計不適合用統計方法。5、從解釋考試結果的依據及分數的意義來看,兩種考試各有其依據;常模參照性測驗的常模是解釋分數的標準,用地位量數表示考生在團體中的相對位置;標準參照性測驗中教學目標是解釋分數的標準,以考生完成題目數量的百分比來表示考生的學習效果。

17、3、根據教育測量的標準化程度來劃分:標準化測驗:指測驗的編制、實施、記分、分數的解釋有統一標準和嚴格規定的大規模的測驗標準化測驗的程序:確定考試目的;編制考試藍圖(命題雙向細目表);命題、組卷、試測、入庫;實測;評分,統計分析;寫出指導書。教師自編測驗:教師根據教學情況自己編制測題對學生進行的測驗。4、以測量人數多少來劃分:團體測驗個人測驗5、根據所使用的材料和形式來劃分:語言文字測驗非語言文字測驗教育測量與評價量表心理學家史蒂文斯根據測量的精確程度把量表從低級到高級分成名稱量表、順序量表、等距量表和比率量表。名稱量表:意義:依照某種法則給事物及屬性指派名稱或類別的量表。功能:區分性。數量化結

18、果的含義:不能比較大小。來源:網絡轉載適用的統計方法:次數的統計,如次數、眾數、百分比、離散相關、卡方檢驗等。順序量表:含義:依照某種法則給事物或人的心理現象指派名稱或類別,還可以將分類結果按數量大小進行排序。功能:區分性、順序性數量化結果的含義:比較大小,不能進行運算。適用的統計方法:中位數、百分位數、等級相關系數、肯德爾和諧系數以及秩次的方差分析。等距量表(區間量表):含義:在給事物及屬性指派數字和符號時,要求各數字或等級之間的差距是相同的,即具有相等的單位。功能:區分性、順序性、等距性數量化結果的含義:不僅能分類、排序,還可以進行加減運算。適用的統計方法:均數、標準差、相關系數,t、F檢

19、驗等比率量表:含義:有相等單位和絕對零點的量表。功能:區分性、順序性、等距性、絕對零點。數量化結果的含義:可以進行加減乘除四則運算。適用的統計方法:均數、幾何平均數、標準差、相關系數,變異系數、3F檢驗等。教育測量與評價的基本原則1、教育測量與評價原則的性質(1)教育測量與評價原則是在教育測量與評價實踐活動中總結出來的具有普遍性問題基礎上提出的。(2)教育測量與評價原則反映了人們對開展教育測量與評價活動的總體要求。(3)教育測量與評價原則具有相對穩定性。2、基本原則(1)方向性原則:指通過評價內容和標準等的制定、評價過程的側重、評價結果的肯定與否定等推動教育活動貫徹國家的教育方針,進而滿足社會

20、需求,保持良性發展的方向。(2)客觀性原則:指評價主體要以真實的資料為基礎,對教育活動過程和成果作出客觀的價值判斷。(3)激勵性原則:指教育評價應促使評價對象形成繼續努力或在進一步的活動中改善不足之處,提高活動效果的動機或期望。(4)計劃性原則:指教育評價活動的開展及教育評價活動過程應根據教育活動的開展而有計劃有序地進行。(5)實效性原則:指教育評價過程應根據評價的目的與內容、評價對象的具體情況、具體的社會環境背景等作出切合實際的評價計劃,采用適宜的評價方法使評價能有效地對教育活動提供指導與幫助。(6)平等性原則:指教育評價實施者應以與評價對象共同探討教育活動得失的平等身份進入評價活動,使評價

21、對象將評價者作為朋友接受其評價,采納其意見或建議。來源:網絡轉載第三章、編制教育測驗的一般原理和方法布魯姆的教育目標分類系統把教育目標分成三個領域:1、認知領域;2、情感領域;3、動作技能領域。1、認知領域目標分類:布盧姆把認知領域的教育目標分為六級:知道、領會、運用、分析、綜合、評價。1、知道:指對先前學習過的知識材料的簡單回憶.知道”又叫知識”,是認知領域中最低水平的認知結果,它所要求的心理過程主要是記憶。2、領會領會亦稱理解或領悟,是指將一種語言準確地轉化成另一種語言。它又可分為轉化、解釋和推斷三種。3、運用指在具體的情境中使用抽象概念,是對所學知識的初步運用.運用代表了較高水平的理解,

22、比如用二元一次方程解答工程性質的應用題,又如把其它文獻中已經提出來的新論點用來引證自己類似的實驗結果。4、分析指將一種傳播內容分解成為它的組成因素和組成部分,以便弄清各種觀念之間的關系。5、綜合-z指將各種要素及組成部分組成一個整體,以構成更為清楚的模式或結構。綜合強調的是創造能力。6、評價指為了一定的目的,對某些觀念和方法等的價值作出判斷。包含根據內部準則判斷和依據外部準則判斷兩方面的內容。2、對布魯姆教育目標分類的評價:?從教育目標劃分標準來看,布魯姆所用的標準是測量學的,無論是知識、領會、應用、分析、綜合還是評價每一個教育目標都是圍繞著如何測量或操作的角度提出的。?布魯姆的教育目標分類便

23、于全面描述教學目標和評定教學,但未揭示各級層次的智力技能的心理機制,因而無法指導教師用什么方法或提供什么學習條件來實現教學目標。?總結:教育目標分類系統對認知領域中的教學目標由低到高進行劃分,符合能力由簡單到復雜發展原則。認知領域分類標準是測量學的,有利于指導學習結果的測量與評價。3、測驗題目類型與測量功能:?測驗題目分類:選擇型和供答型。?選擇型一般要求被試在幾個選項中選擇正確的答案,如是非題、匹配題、選擇題等,后者要求被試自己提供答案,如論文題、簡答題、填空題等。?若根據被試作答的范圍和評分方法不同,又可分為主觀性試題和客觀性試題。客觀性試題主要是因為評分客觀而得名,它的正確答案在測驗前就

24、已準備好,不同評分者各自獨立評分,所得結果基本上是相同的。客觀性試題一般適用于測量知識的掌握、理解、應用、分析幾個層次的教學目標。客觀性來源:網絡轉載試題的答案明確,作答簡便,因而在限定的時間內測驗可以包含足夠數量的試題,能保證對知識內容的覆蓋。主觀性試題主要包括論述題、操作題和作文題等。它們適合于測量較高層次的教學目標,尤其適合于測量綜合、評價等目標層次。主觀性試題鼓勵被試積極地組織所學的資料,表達自己的觀點。被試在作答時,耗費的時間較長,在限定的時間內,試題數量不可能太多,對知識的覆蓋面較小。由于沒有明確統一的標準答案,評分易受評閱者的主觀因素影響,因而誤差較大。一、客觀性試題的類型及其編

25、寫技巧()選擇題1.結構選擇題是由一個題干和幾個選項組成。題干一般是問題或待完成的句子,選項是幾個真假不明的答案,讓被試從中選出正確的答案。2,優缺點優點:(1)可以用來測量學生各種不同層次的學習結果。評分標準統一、客觀,可以利用電腦評卷,提高評卷的速度和自動化水平。可以加大試題容量,抽取廣泛有效的代表性樣本,使試題覆蓋的知識范圍廣。有利于考查被試思維的敏捷性和準確的判斷力。(5)采用大量的似真選擇項使結果易于診斷,通過對學生錯誤選項的分析便于發現學生在學習中存在的問題,以便及時糾正。缺點:編制選擇題較花費時間,且需要專門的命題技巧。(2)難以考核被試完全的推理能力、綜合運用所學知識的能力、有

26、效的總結能力、嚴密的表述能力和寫作能力和被試的發散思維(或求異思維)能力。無法測量被試的思維(解題)過程。(4)被試可以憑猜測而選中正確答案。3.編寫原則題干意義完整并能表達一個確定的問題。題干簡明,盡量不使用過于復雜的字詞與語句結構,也不要使用過長的語句。題干盡量不使用否定結構。(4)誘答項應具有似真性。使用學生共同的錯誤觀念或過失來作為誘答項。以學生慣用的模糊性用語敘述誘答項。在正確選項和誘答項中使用同樣精確的"、重要性”等詞語來敘述。誘答項的長度和措辭的復雜性與正確選項相似。在誘答項中使用額外的線索。如固定的用詞,具有科學味道的答案,以及和題干有語義上的聯系等。?保持選項之間的

27、同質性。(5)不能對正確答案有任何暗示(6)同一測驗中每一個測驗試題之間應相互獨立避免牽連(7)選項的文字表述,力求簡短精煉。(8)應盡量避免以上皆是”、以上皆非”的選項(二)是非題是非題又叫做二項選擇題,它通常是給被試一個句子要被試作出正誤的判斷。來源:網絡轉載1、優點:編制容易。(2)記分客觀,取樣廣泛。缺點:(1)僅能測量知識層次中最基本的結果,無法測量高層次的學習結果。受猜測因素的影響很大。2.編寫原則(1)考核的內容應是重要的知識,應有考核價值。(2)題目應多是測量理解能力,而不應測驗記憶性的知識,更不要直接抄錄教科書中的句子。(3)一個題目中只能有一個中心問題,或一個重要概念,避免

28、兩個以上的概念在同一題中出現。試題應做到是非界限分明,用詞準確,避免模棱兩可的語句。(5)題目陳述應簡單明了,避免使用復雜的句子結構,以減少因被試的閱讀能力而對測量產生的不良影響,應盡量采用正面敘述,避免用否定和雙重否定的語句。(三)填空題1、優缺點:填空題可用來考查被試對知識的記憶和理解能力,在診斷性測驗中特別適用。受被試猜測的影響小,評分比較客觀。但填空題偏重于測量被試的知識記憶程度,使用過多容易養成被試死記硬背的習慣。2、編制原則:(1)題意要明確、限定要嚴密,使空白處應填的答案是唯一的。空白中所填寫的應是關鍵詞語,并且要和上下文有密切的關系(3)題目中空白地方不能太多,以免句子變得支離

29、破碎,不利于被試理解題意。通常一個填空題不應超過兩個空白。(4)盡量將空白放在句子的后面或中間,而不要放在句子開頭。(5)所有空白處的線段長度應當一致,不能隨正確答案文字的多少而長短不一,以免產生暗示作用。(6)若答案是數字,應指明單位和數字的精確程度。(四)簡答題1.特點簡答題適合測量被試對基本知識、概念和原理的掌握、記憶情況。編制較為簡單、靈活,可以從不同角度、不同方向考慮,增大對知識考核的準確度和深度,并且不受猜測因素的影響。但其無法考核綜合、分析、評價等高層次的教學目標;且評分也不夠客觀,有不同程度的正確或部分正確的答案而影響評分的客觀性。2,編制原則:問題的敘述要明確,要確實能使被試

30、用簡單的語言來回答。(2)問題的答案應該只有一個,并且答案要簡短具體。(3)避免出只考機械記憶的題,應注重知識的應用。在考查某公式的應用時,不要給太復雜的數字,以免給計算帶來麻煩。(5)盡可能使用直接問句來提出問題。二、主觀性試題的類型及其編寫要領(一)論述題論述題就是向被試提出問題,需要被試用自己的語言組成一份較長答案的試題。來源:網絡轉載1、優點:(1)可以用來進行高層次的、復雜的學習結果的測量,可以用在各種學科領域,特別適用于社會科學、人文科學等。可以增進學生的思考、應用及解決問題的能力,對于被試的學習態度和學習方式可以產生積極的影響。可以促進學生寫作能力的提高。(4)試題的編制比較容易

31、,并且受猜測因素的影響很小。缺點:(1)由于論述題一般都比較大,在一次考試中試題的數量不可能有很多,因此,其取樣范圍比較小且不均勻,影響測驗的效度。評分的主觀性強。因被試回答過于自由,回答方向又不盡相同,難于測得預期結果,重點容易失控。(4)被試作答和評分閱卷都相當費時。2,編制原則:試題應該用來測量較高層次的教學目標。如要求學生提出理由、解釋變量問的關系、描述與評價資料、有系統地陳述結論等。(2)要明確而系統地陳述問題,使被試能清楚地了解題目的要求。(3)應采用答案具有統一定論的試題。,'z一般不允許被試選擇問題回答。,"7;、"(5)為避免被試將時間集中在某一個

32、他所不會做的題目上而影響對其他題目的回答,因此而影響考試成績的真實性,最好在題目中能給出回答本題所需的參考時問。(二)作文題作文是對人的邏輯思維、形象思維、書面表達等多種能力的一種綜合考查。編制原則:根據考試的目的和需要確定考試作文的文體要求。(2)根據社會的需要、現實生活和學生的實際設計命題。要根據被試的特點確定選材范圍與寫作意圖,在確定選材和寫作意圖時,要考慮對所有被試都是公平的,并且試題應符合被試的心理特征。要給被試以發揮的余地。第四章試卷質量分析與評價質量分析:項目分析:難度、區分度整體分析:信度、效度1、難度的含義:指測題的難易程度,是指題目對學生知識和能力水平的適合程度的指標。用P

33、表示。難度的計算:1、題目分數為二分變量:正確率P=R/N答對人數/全體人數適用題型:選擇題、填空題、判斷題等,下,平均得分/尸=X滿分2、題目分數為多分值:得分率*2*.適用題型:填空題、簡答題、論述題、計算題、作文題等難度取值范圍:0-1之間來源:網絡轉載卷面難度:試卷包含的所有試題難度的平均數。常模參照測驗難度取值范圍:試題:0.3-0.7之間;卷面:0.5-0.6(0.6-0.7)之間基于難度的題目分析:?難度過低與過高的題目原則上要淘汰,但屬于必考的知識點,需重新命題,提高命題的難度?由于出現科學性錯誤而導致難度不符,需重新命題?命題、內容均無大問題但難度不符的題目需進行詳細分析找出

34、原因所在2、區分度的含義:是指測驗題目對學業水平不同的考生的區分程度或鑒別能力。區分度的計算方法:1、點二列相關:_xp-xq,p為該題答知隊數必就q弊該題未答對人數比例為該題答對者總分的平均分為該題未答對者總分平均分為所有考生總分的標準差適用題型:選擇題、判斷題等例、已知一測驗中某選擇題的通過率為0.5,答對者的測驗總分平均為76分,答錯者的測驗總分平均為63分,全體被試總分的標準差為16分,求該選擇題的區分度。對計算得到的區分度值應該再進行統計檢驗(根據測驗人數,查相關系數顯著性臨界值表),才能說明試題區分度的高低。2、積差相關:XXY_F一XYX表示所有被試的測題得分r=sXsY-Y表示所有被試的測驗得分填空題、簡答題、論述題、計算題、作文題等3、兩端分組法:_D=Ph-PlD為鑒別指數H為高分組在該題的難度L為低分組在該題的難度高分組:總分排序前27%的人低分組:總分排序后27%的人適用范圍:被試人數太多時測驗的區分度的估計例、10000名,成績排序前2700名的學生在第三題回答正確的人數為2500人,成績排序后2700名的學生在第三題回答正確的人數為500人,按照兩端分組法計算第弁0勺區分度。500鑒別回的25陸姬3Pl=0.19鑒別指數(2D00區分度評價2700

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論