教育測量標準及其建立_第1頁
教育測量標準及其建立_第2頁
教育測量標準及其建立_第3頁
教育測量標準及其建立_第4頁
教育測量標準及其建立_第5頁
已閱讀5頁,還剩30頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

教育測量標準及其建立第一頁,共三十五頁,2022年,8月28日參照標準的分數參照常模的分數是將被試的分數和常模團體測驗分數進行比較來的,并且主要以個人在常模團體中所處的相對位置來確定。參照標準的分數不同,一個人的測驗成績不是和其他人比較,而是和某種特定的標準比較。它關心的是一個人是否達到某種標準,它反映的是一個人的行為水平或成就水平如何。標準參照分數可分為內容參照分數和結果參照分數。第二頁,共三十五頁,2022年,8月28日(一)內容參照分數內容參照分數主要依據被試對某個確定的材料內容或技能的掌握和熟悉程度來確定的。使用內容參照分數,關鍵是要預先制定一個能判定被試是否已掌握某種內容或熟練程度的標準,這種標準主要有:第三頁,共三十五頁,2022年,8月28日1.掌握分數最簡便的方法是訂出一個判別被試是否通過或掌握某種內容的最低分數線,即最低標準水平。在此分數以上,表明被試已達到掌握或熟練的水平;在此分數以下,表明被試沒有達到掌握或熟練的水平。如何確定這個水平?通常是選擇有80%到90%的人通過的那一水平。如:考查科分合格與不合格兩級。第四頁,共三十五頁,2022年,8月28日2.正確百分數正確百分數指被試在測驗中答對題目的百分比。這一指標更為常用,因為它能更好地反映被試對所測內容的掌握或熟練程度。采用這一指標解釋測驗分數時必須注意測題應該確是該目標范圍的代表性的取樣,否則答對多少題并不反映對該目標的掌握程度。第五頁,共三十五頁,2022年,8月28日3.內容標準分數內容標準分數是把內容分數與常模分數結合起來使用。編制內容標準量表時,不但要明確界定內容、范圍,還要詳細說明每一種水平的“典型”人物正確回答和不正確回答的問題的類型。這樣,將一個人的測驗分數與此種量表對照,便既能指出他正確反應的百分比,又能指出他的成績達到了哪種人的水平以及他能解決哪一類問題。如:智力年齡第六頁,共三十五頁,2022年,8月28日4.等級評定量表在某些情況下,我們感興趣的不是人們是否掌握了某種知識,而是一個人完成某種過程或生產出某種產品的技能。通常我們需要采用等級評定量表來報告一種活動的熟練水平或一種產品的質量。為了使評定盡可能客觀,需要對各種等級定出標準。對每種水平都定出標準樣本,并作出詳細說明。如:各種等級考試第七頁,共三十五頁,2022年,8月28日內容參照分數的主要優點是用個人所掌握的知識或技能的水平來描述行為,指出一個人知道什么和能做什么。在大多數情況下,這比知道一個人在團體中的相對位置更有價值。內容參照分數主要用于成就測驗以及能確定出可接受的最低標準的資格測驗(如醫生或司機的證書考試),對于大多數能力傾向和人格測驗來說,由于所測的范圍很難確定,因而一般不用內容參照分數。第八頁,共三十五頁,2022年,8月28日(三)結果參照分數結果參照又叫效標參照。它是將效標材料直接結合到測驗結果的解釋過程中。這種分數適合于用測驗來作預測的情況。例如,高考平均分數在80分(各科滿分為100分)以上的人,我們可以預測其入大學后的學習成績將為優等。這里,是用結果來解釋測驗分數,而不是用常模和內容來解釋。要得到結果參照分數必須有兩個前提條件:①需要有效度證據,即測驗分數必須與一個重要的效標具有高相關。第九頁,共三十五頁,2022年,8月28日②要有將測驗分數和效標之間的關系結合起來的方法,如轉換圖表。例如,如果一個學生在大學入學考試委員會的學術測驗(SAT)上得530分,他在一所具體大學的一年級平均成績處于A、B、C、D、F等類的可能性各是多少?考察預測分數(SAT)對效標成績(一年級平均成績)的雙變量分布,就能獲得這類信息。

第十頁,共三十五頁,2022年,8月28日如果把這種雙變量分布的每個單元的人數轉換成百分比,結果就是期望表。例:預測分數是第一學期末“區別能力傾向測驗”中的數推理測驗(DAT),效標則是第二學期最后一次考試的課程成績。數據從211名六年級學生中得出。測驗分數和效標的相關是0.60。:(見下表)。第十一頁,共三十五頁,2022年,8月28日表:211名六年級學生DAT數推理測驗

與數學課程成績之間的關系DAT分數人數數學課程成績的百分比≤DCBA≥302250365920~29104921432710~19713736243≤9144336147第十二頁,共三十五頁,2022年,8月28日三、測驗分數的解釋4.3.1如何看待測驗分數的意義4.3.2如何向受測者報告測驗分數第十三頁,共三十五頁,2022年,8月28日(一)如何看待測驗分數的意義施測者進行測驗結果的解釋必須:①對所做的測驗(包括它的常模的代表性、信度、效度、難度等)要熟悉了解。②對受測者的情況(文化程度、職業、是否可能接觸測驗中的有關問題等)也要有所了解。③對當時測驗的具體情況,例如是否有干擾,受測者當時有無情緒波動或身體不適等情況的了解。第十四頁,共三十五頁,2022年,8月28日同一個分數可能是由于不同原因造成的,應結合以上三方面的因素對測驗分數作出解釋。同一分數可作出不同解釋。例如,用具有初中文化程度的標準化樣本常模的智力測驗來測量一個小學文化程度的受測者,如果測得IQ為85,就可以認為他基本上是中等智力水平;如果受測者原來文化程度是大學畢業,也測得IQ為85,就可解釋為受測者可能由于某種原因而使智力有所減退,屬于中下水平。第十五頁,共三十五頁,2022年,8月28日解釋測驗分數有4種類型:(1)敘述的解釋:指描述個人的心理特征狀態。例如,這個學生是一位怎樣的學生,聰明的?中等的?或愚笨的?他的語文推理是否優于非語文推理?他喜歡做些什么?有什么樣的性格特點?(2)溯因的解釋:指追溯過去以解釋個人目前的發展情況。例如,他為什么會這樣?他的閱讀困難是否是情緒困擾的結果?或缺乏基本的閱讀技能?或缺乏學習的興趣?他拒絕機械的學習活動是否由于父母的壓力?或過去的失敗?或興趣太廣泛所致?第十六頁,共三十五頁,2022年,8月28日(3)預測的解釋:指推估個人未來的可能發展情形。例如,他上高中的成績會怎樣?他升入大學的可能性有多大?他在理科方面的發展是否比在文科方面的發展更能成功?他是否可能成為一個問題青年?(4)判斷(利評價)的解釋:指作價值的判斷或做決定。此種解釋是依據上述幾種解釋而作的判斷。例如,準許入高中或大學。他應該學習什么樣課程。進什么樣大學。他應該成為工程師或商務經理。第十七頁,共三十五頁,2022年,8月28日解釋分數的意義應遵循的基本原則(1)主試應充分了解測驗的性質與功能。測驗使用者必須具備心理測驗的基本知識。使用者在解釋之前必須從其編制手冊中,詳細了解編制過程的標準化及測驗的信度、效度、常模等是否適當。更重要的,應知道測驗能測量什么,不能測量什么,分數在使用上有何限制。有時兩個測驗的類型雖然相同,但測量的功能往往不同。例如,卡特爾測驗16PF與明尼蘇達多相人格調查表MMPI都是人格測驗,但后者更多地發揮臨床診斷的功能,前者則更多地針對正常人。第十八頁,共三十五頁,2022年,8月28日(2)對導致測驗結果的原因的解釋應慎重,謹防片面極端。遺傳特征、測驗前的學習與經驗以及測驗情境對一個人的測驗成績都會產生影響。所以我們應該把測驗分數看成對受測者目前狀況的測量,至于他是如何達到這一狀況的,則受許多因素的影響。為了能對分數作出有意義的解釋,必須將個人在測驗前的經歷或背景因素考慮在內,比如,在詞匯上得到相同的分數,對于大城市的孩子與邊遠山區的孩子具有不同的意義。第十九頁,共三十五頁,2022年,8月28日(3)必須充分估計測驗的常模和效度的局限性對測驗分數作出確切的解釋,只有常模資料是不夠的,還必須有效度資料。沒有效度證據的常模資料,只告訴我們一個人在一個常模團體中的相對等級,不能做預測或更多的解釋。在解釋分數時人們最常犯的錯誤就是僅根據測驗的標題和常模數據去推論測驗分數的意義,而忽略效度的不足或缺乏。假若一個測驗的名稱是內外向量表,并有可利用的常模資料,那么就很容易把得高分的人說成是內向性格。第二十頁,共三十五頁,2022年,8月28日(4)解釋分數應參考其他有關資料。測驗分數不是了解學生的唯一資料,為正確了解其心理特質尚需參考其他有關資料。例如,某生智力測驗上得到IQ為80,在不考慮其他資料的情況下,只能解釋:“某生的智力屬于中等偏下”。但是,如果考慮他的在校成績時,解釋可能大不相同,如果他的在校成績經常保持在年級前五名,則不可能作出如上的解釋,可能需要進一步探討他在做測驗時的動機,態度,情緒與健康狀況等,有了這些資料作為佐證,才能正確判斷其智力是否全部正常發揮,測驗結果是否可靠。第二十一頁,共三十五頁,2022年,8月28日解釋時亦可參考其它的測驗資料,只憑單一的測驗分數加以解釋,可能全然不同于綜合考慮幾個測驗分數。例如,根據自陳量表測驗的分數,某生的性壓抑分數高于平均數兩個標準差;但在投射測驗中有關性的反應,卻高于平均數一個標準差,如僅依自陳量表的分數解釋時,只能解釋說:“某生的性壓抑傾向甚強。”但如果結合投射測驗的分數作出綜合解釋,則可解釋說:“某生的性興趣強于一般人(投射測驗),但他卻將性興趣加以嚴重的壓抑(自陳量表)。總之,測驗分數的解釋應盡可能多種資料相互參照,綜合評定。第二十二頁,共三十五頁,2022年,8月28日(5)對測驗分數應以“一段分數”來解釋,而不應以“特定的數值”來解釋。由于每個測驗均會受到測量誤差的影響,因此在解釋測驗分數時也應考慮到測量誤差的存在。測量誤差的大小與信度的高低有關,信度越高,則誤差越小,但永遠不可能完全消除誤差,因此,應該把測驗分數視為一個范圍而不是一些確定的點,也就是要對測驗分數提供帶狀的解釋。倘若使用確切的分數,應說明這些分數不是精確的指標,而是我們對某人真實分數的大體估計。第二十三頁,共三十五頁,2022年,8月28日(6)對來自不同測驗的分數不能直接加以比較。即使兩個測驗名稱相同,由于所包含的具體內容不同(因而所測量的特質不完全相同),建立標準化樣本的組成不同,量表的單位(如標準差)不同,其分數也不具備可比性。如來自兩個智力測驗的分數,在沒有其他信息的情況下,我們無法判斷誰高誰底。必須把它們放在統一的量表上進行比較。第二十四頁,共三十五頁,2022年,8月28日

具體做法是:將兩個測驗都對同一個樣本進行施測,并把兩種測驗的原始分數都轉換成百分等級,然后用該百分等級作為中轉點,就可以做出一個等價的原始分數表。如果某人在測驗A中原始分數55是90百分等級,而測驗B中原始分數36也是90百分等級,那么他在測驗A獲得的55分就與在測驗B獲得的36分等值。第二十五頁,共三十五頁,2022年,8月28日(二)如何向受測者報告測驗分數p.93如何向當事人及與當事人有關的人員(如家長,教師,雇主等)報告測驗分數,使他們更好地理解分數的意義是一件非常重要的事,下面所列舉的一些原則,可供報告測驗分數時作參考。1.使用當事人所理解的語言測驗具有自己的詞匯,你所理解的詞并不意味著當事人也一定理解。你懂得標準差和標準分數,然而當事人可能不懂。因此你必須用非技術性的用語來解釋標準分數,可以把它解釋成相對位置(如百分等級)。第二十六頁,共三十五頁,2022年,8月28日2.要保證當事人知道測驗的目的這里并不需要作詳細的技術性解釋。例見P.93。3.如果分數是以常模為參考的,就要使當事人知道他是和什么團體在進行比較。例如,同一個百分等級對于普通學校和重點學校其意義是不同的。第二十七頁,共三十五頁,2022年,8月28日4.要使當事人認識到分數只是一個估計。由于測驗的信度、效度不足,分數可能有誤差,而且對于一個團體總體來說有效的測驗,不一定對每個人都同樣有效,但也不能讓受測者感到分數是毫不可信的。第二十八頁,共三十五頁,2022年,8月28日5.要使當事人知道如何運用他的分數當測驗用于人員選拔和安置問題時這點是特別重要的。要向當事人講清測驗分數在作決定過程中起什么作用,是完全由分數決定取舍,還是只把分數作為參考;有沒有規定最低分數線;測驗上的低分數能否由其他方面補償等等。第二十九頁,共三十五頁,2022年,8月28日6.要考慮測驗分數將給受測者帶來什么心理影響。由于對分數的解釋會影響受測者的自我認識、自我體驗和自我評價,所以在解釋分數時要把對分數意義的解釋和必要的咨詢工作結合起來。第三十頁,共三十五頁,2022年,8月28日7.

測驗結果應向無關的人員保密當事人的測驗分數不應讓其他無關的人員知道,以免對當事人造成不良的影響。因此,分數的報告采用個人的解釋為宜,不宜采用團體解釋或公告通知的方式行之。8.報告測驗分數時設法了解當事人的心理感受。報告測驗分數時,宜先讓當事人充分表達測驗時的心理感受,如他的動機、態度、情緒、注意、健康等,以便知道他的測驗分數是否代表在最佳的情況下所作的反應。第三十一頁,共三十五頁,2022年,8月28日例如,某學生表示他在做智力測驗驗時情緒很惡劣,心不在焉;而另一位則表示他在做測驗時,動機強烈,注意力集中,雖然兩位學生得到相同IQ為115,但代表的意義可能迥然不同。同樣的,解釋完分數后宜鼓勵當事人表達對測驗結果的感受,如發現當事人對分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論