心理測量學完整版本_第1頁
心理測量學完整版本_第2頁
心理測量學完整版本_第3頁
心理測量學完整版本_第4頁
心理測量學完整版本_第5頁
已閱讀5頁,還剩159頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

心理測量學鐘琴第一節概述第二節測驗的常模第三節測驗的信度第四節測驗的效度第五節項目分析第六節測驗編制的一般程序第七節心理測驗的使用第1單元測量與測量量表

第2單元心理測驗的基本概念

第3單元心理測驗的分類

第4單元糾正錯誤的測驗觀第5單元心理測驗在心理咨詢中的應用

第6單元心理測驗的發展史第一節概述一、什么是測量測量就是依據一定的法則用數字對事物加以確定3個元素事物:指的是我們要測量的對象,更準確地說,就是引起我們興趣的事物的屬性或特性。在心理測量中,實際上是測量的心理現象的外顯行為。數字:代表某一事物或事物某一屬性的量

(數字有區分性序列性等距性可加性)法則:代表的是測量所依據的規則和方法第一單元測量與測量量表二、測量要素任何測量都具有兩個要素:參照點和單位(一)參照點有兩種:1、絕對零點2、相對零點

(理想的參照點是絕對零點)(二)單位是測量的基本要求,沒單位就無法進行測量好的單位必須具備兩個條件:一為有確定的意義:對同一單位的理解相同。二為有相同的意義:相鄰單位間的差別是一樣的。三、測量量表(從低到高的四種量表)(1)命名量表——用數字來代表事物或事物歸類1、代號:用數字來代表個別事物,如學生和運動員的編號等2、類別:用數字來代表某一具有某種屬性的事物的全體,即把某種事物確定到不同性質的類別中,如用1代表男、用2代表女,或用不同數字代表不同職業等

(2)順序量表數字包含數量關系,主要用于分等或排除順序。如:學生考試名次,工資級別,能力等

A>B>C(3)等距量表1、具有較高水平的量表,有大小關系,有相等的單位2、沒有絕對零點只有相對零點。只可以加減,不能乘除例如:溫度計表示200度,比100度高100度,但不能說是100度的兩倍。(4)等比量表是最高水平的量表,既有相等單位又有絕對零點

例如:甲80公斤,乙40公斤。甲比乙重40公斤,也可以說甲是乙的兩倍。第二單元心理測量的基本概念一、心理測量的定義

所謂心理測量,就是依據心理學理論,使用一定的操作程序,通過觀察人的少數有代表性的行為,對于貫穿在人的全部行為活動中的心理特點做出推論和數量化分析的一種科學手段要點:四個基本的要素

項目反應行為樣本、標準化、常模二、心理測量的性質(一)間接性心理測驗是通過一個人的外顯行為來推斷他的心理特質(二)相對性每個人測量的結果都是與所在團體或大多數人群的行為或某種人為確定的標準而言的。(三)客觀性測驗的標準化問題(物理條件、評分手段、常模)第三單元心理測驗的分類

心理測驗與心理測量的區別:心理測驗是一種工具心理測量是一個過程心理測驗分類一、按測驗的功能分類(一)智力測驗(比內-西蒙智力測驗、韋克斯勒成人智力量表)(二)特殊能力測驗(例如霍蘭德職業傾向測試)(三)人格測驗(MMPI16PF)二、按測驗材料的性質分類(一)文字測驗(二)操作測驗三、按測驗材料的嚴謹程度分類(一)客觀測驗(二)投射測驗

羅夏墨跡測驗——聯想法

主題統覺測驗——構造法

句子填充測驗——完成法

我最喜歡____。我最討厭____。

表露法,主要有:a.畫人測驗四、按測驗的方式分類(一)個別測驗(二)團體測驗五、按測驗的要求(一)最高作為測驗:求受測者盡可能做出最好的回答。這主要與認知過程有關,有正確答案。成就測驗、學績測驗屬于最高行為測驗。(二)典型行為測驗:典型行為測驗要求受測者按通常習慣方式做出反應,沒有正確答案。人格測驗屬于典型行為測驗。第四單元糾正錯誤的測驗觀一、錯誤的測驗觀(一)測驗萬能論(二)測驗無用論(三)心理測驗即智力測驗(一)心理測驗是重要的心理學研究方法之一,是決策的輔助工具(二)心理測驗作為研究方法和測量工具尚不完善二、正確的測驗觀第五單元

心理測驗在心理咨詢中的應用

我國目前情況下,心理門診中運用較多的大致有這樣3類心理測驗:一、智力測驗韋氏智力量表、中國比內量表、聯合瑞文量表二、人格測驗艾森克人格問卷(EPQ)、卡特爾16人格因素問卷(16PF)、明尼蘇達多項人格調查表(MMPI)三、心理評定量表精神病評定量表、躁狂狀態評定量表、抑郁量表、焦慮量表。第六單元心理測驗的發展史一、科學心理測驗的產生與發展(一)首先倡導科學心理測驗的學者是英國生物學家和心理學家高爾頓(二)1890年,卡特爾在《心理》雜志上發表“心理測驗與測量”一文,這是心理測驗第一次出現于心理學文獻中。(三)比內與其助手西蒙研究制作了世界上第一個正式的心理測驗。二、20年代以后心理測驗的發展1、操作測驗的發展2、團體智力測驗的發展3、能力測驗的發展4、人格測驗的發展三、現代心理測驗在我國的發展1、我國近代心理測驗源于1914年,2、1979年后,先后對國外廣泛采用的智力和人格測驗工具進行修訂。3、近年來,我國心理學家在致力于心理測驗本土化。課堂練習1、測量所用數字具有自然數的特點,即具有(ABCD)。(A)區分性(B)等級性(C)等距性(D)可加性2、用1代表男,2代表女等等,這樣的量表叫做(A)A命名B順序C等距D等比3、測量所用數字具有自然數的特點,即具有()。(A)區分性(B)等級性(C)等距性(D)可加性ABCD4、其數值可以進行加減乘除運算的量表是A命名量表B順序量表C等距量表D等比量表D5、按測驗材料的性質,可將測驗分為()。(A)文字測驗(B)智力測驗(C)主題統覺測驗(D)操作測驗AD6、按測驗的功能,可將測驗分為(ABC)。

(A)智力測驗

(B)特殊能力測驗

(C)人格測驗

(D)投射測驗7、按測驗的功能,可將測驗分為()。(A)智力測驗(B)特殊能力測驗(C)人格測驗(D)投射測驗ABC8、正確的測驗觀包括(

)。

(A)心理測驗是重要的心理學研究方法之一,是決策的輔助工具

(B)做心理測驗時態度要正確(C)心理測驗作為研究方法和測量工具尚不完善

(D)心理測驗的結果可以非常準確地反映人的特點

ABC9、()編制了世界上第一個正式的心理測驗。A高爾頓B比內C卡特爾D奧蒂斯B10、近些年,我國心理學家正在致力于心理測驗研究的()。A本土化B數量化C引進并修訂國外量表D大量測驗A第二節測驗的常模第一單元常模團體第二單元常模的類型第三單元常模分數的表示方法

第一單元常模團體一、常模團體的性質

常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。

1、對測驗編制者而言,常模團體要能夠代表總體:選擇常模團體的步驟:確定一般總體——確定目標總體——確定樣本。

2、對測驗的使用者來說,要考慮的問題是,現有的常模團體哪一個最合適。(例如,人員安置時,同一個分數就可以與各種不同工種的常模比較)(一)群體的構成必須明確界定。(二)常模團體必須是所測群體的代表性樣本。(三)樣本的大小要適當總體數目小,只有幾十個人,則需要100%的樣本。如果總體數目大,相應的樣本也大,一般最低不小于30或100個。全國性常模,一般應有2000~3000人為宜。(四)標準化樣組是一定時空的產物——在選擇常模的時候注意選擇較為新近的常模。二、常模團體的條件取樣:從目標人群中選擇有代表性的樣本。(一)簡單隨機抽樣常用方法:抽簽法和隨機數字法(如從50隨機選取10人)。

(二)系統抽樣又稱等距抽樣,將已編好的個體排成順序,然后每隔若干個號碼抽取一個。關鍵是計算組距。K=N/n系統抽樣要求目標總體無等級結構存在。三、取樣的方法(三)分組抽樣將群體分組,再在組內進行進行隨機取樣。例如:全國取樣——按行政區分組適用于:總體數目大,而且群體有多樣性,將群體分組,在組內隨機取樣。(四)分層抽樣將目標總量按照某種變量分成若干層次(如,年齡)再從各層次中抽取若干受測者。分層抽樣分為,分層比例抽樣和分層非比例抽樣四、常模分數與常模(一)常模

常模是一種供比較的標準數量,由標準化樣本測試結果而來,他是心理測驗時用于比較和預測結果的參照分數標準。依據樣本大小——全國常模、區域常模、依據樣本來源——

一般常模(為測驗指導書上列出的常模)特殊常模(為非典型群體建立的,如某個單位)依據具體應用標準和分數特征——百分位常模和標準分常模

(二)常模分數

常模分數就是施測常模樣本被試后,將被試者的原始分數按一定規則轉換出來的導出分數。例如:抑郁量表,原始分*1.25=常模分數第二單元常模的類型

發展常模又稱年齡量表,就是根據不同年齡上各種發展水平的人的平均表現(如智力、技能、感覺運動等方面的發展水平)所制定的量表。一、發展常模發展順序量表智力年齡年級當量(一)發展順序量表:與發育正常的兒童相比,按年齡評定一個兒童的心理發展水平。

1)葛爾塞發展程序量表(最早):按月份顯示發育正常兒童在運動水平、適應性、語言、社會性四個方面的發展水平,以此作為標準,評定個體的發展水平。強調兒童早期行為的發展是有規律的。

例如:嬰兒的感覺運動發展:

4周——能控制眼睛運動,去追隨一個對象看。

16周——能保持頭平衡

28周——能用手抓握東西,并玩弄它40周——能控制軀干,坐立或爬行

52周——能控制腿腳,站立和行走2)皮亞杰的發展理論——對守恒概念的研究:兒童在不同時間出現不同守恒概念。通常情況下:5歲時才會理解質量守恒;6歲才會掌握重量守恒;7歲時才有容量守恒概念(二)智力年齡:

1)比內-西蒙智力量表——首先使用智力年齡的概念;編制出可區分各年齡兒童的智力水平的測題,這些測題的難度隨年齡而逐漸加大。一個兒童在量表上所得的分數,就是最能代表他的智力水平的年齡。智齡是年齡量表上度量智力的單位。

2)測量方法:(1)、測題分年齡組計算方法:智力年齡=基礎年齡+更高年齡組上通過的測題數量所代表的智齡增長的月數(每答對一題加2個月)

假如:某兒童6歲組的題目全部通過,7歲組通過4題,8歲組通過3題,9歲組通過2題,其智齡為:6(歲)+4*2(月)+3*2(月)+2*2(月)=6歲+18月=7歲6個

(2)、測題不分年齡組測題不分年齡組,以標準化樣本中每個年齡組的平均分數作為年齡常模,將個人的原始分數與年齡常摸作比較,計算其智力年齡。

例如:某個兒童的原始分數等于8歲組的平均分數,則其智力是年齡是8歲。

(三)年級當量:年級當量實際上就是年級量表,說明測驗結果屬哪一年級的水平,(例如:算數水平是5年級的,理解水平是6年級。)在教育成就測驗中最常用。年級量表的單位通常是10個月,以10個月為一個年級。4-0指4年級開始時的平均成績,4-5指4年級學年中間的平均成績

二、百分位常模1、百分等級2、百分點3、四分位數和十分位數1、百分等級(PR):一個測驗分數的百分等級指在常模樣本中低于這個分數的人數的百分比。(1)百分等級越低,個體所處的位置就越低。(2)計算方法:公式:PR=100-(100R-50)N(PR:百分等級,R:排列序號,N:總人數)

例如:某被試在一次由50人參加的成績中排名第9,該生成績的百分等級是多少?(答案:83%)課堂練習:

某班學生參加數學測驗,隨機抽取10名同學依照成績排列大小分別是:90898578777369666560請問:得分85分的百分等級(答案:75%)2、百分點:(1)百分點也稱百分位數(PP),計算處于某一百分比例的人對應的測驗分數是多少。

例如:挑選出得分高的20%的受測者,就是要選擇百分等級是80的測驗分數。

計算方法:直線內插法

例如:高考的最高分是650分,其百分等級是100,最低分是105分,百分等級是1,要錄取20%的學生進入大學,百分等級為80的百分位數(答案:540分)3、四分位數和十分位數:四分位數和十分位數只是百分位數的兩個變式,其含義相似。四分位相當于百分位的25%,50%,75%100%

十分位數相當于百分位的1%-10%,-----91%-100%三、標準分數常模標準分常模:是將原始分數與平均數的距離以標準差為單位表示出來的量表;1、其基本單位是標準差(standerdeviation):是各數據偏離平均數的距離的平均數,反映數據的離散程度。2、常用的標準分數有T分數——平均數為50、標準差為10標準九分——平均數為5,標準差為2標準十分——平均數為5,標準差為1.5;標準二十分——平均數為10,標準差為3離差智商——平均分為100,標準差為153、分類:標準分數可以通過線性轉換,也可以通過非線性轉換得到,由此可將標準分數分為線性轉換的標準分數與非線性轉換的標準分數。

線性轉換的標準分數和非線性轉化的標準分數(一)線性轉換的標準分數:

(1)適用于正態(常態)分布的數據資料;(2)z分數為最典型的線性轉換的標準分數;z分數:z=(X-M)/SDX為任一原始分數,M為樣本平均數,SD為樣本標準差。

z分數可以用來表示某一分數與平均數之差是標準差的幾倍。(3)轉換后的Z分數:Z=A+BZZ為轉換后的標準分數,A、B為根據需要指定的常數;加上一個常數A是為了去掉負值,乘以一個常數B是為了使單位變小而去掉小數點;加或乘一個常數并不改變原來分數間的關系。

(二)非線性轉換的標準分數:

(1)原始分數不是常態分布——使之常態化(常態化過程是非線性的);(2)常態化過程主要是將原始分數轉化為百分等級,再將百分等級轉化為常態分布上相應的標準分數(3)計算步驟:

A、對每個分數值計算累積百分數

B、在常態曲線面積中,求出對應的該百分比的z分數

在最早的比內—西蒙智力測驗中沒有智商的概念,只用“心理年齡”(MA)來表示被試智力的高低。目前一般都用比率智商和離差智商來表示智力的高低。

1、比率智商(IQ):

1、比率智商:心理年齡(MA)與實足年齡(CA)之比。為避免小數,將商數乘以100。

2、計算公式IQ=MA×100CA

例如:如果一個兒童的心理年齡等于實足年齡,他的智商就100。IQ等于100代表正常的或平常的智力。(缺陷:個體心理年齡和實足年齡不是同步增長比率智商并不適合于年齡較大的被試。)四、智商及其意義2、離差智商:(1)、離差智商,是一種以年齡組為樣本計算而得的標準分數;韋克斯勒將離差智商的平均數定為100,標準差為15;離差智商表示的是個體智力在年齡組中所處的位置;是表示智力高低的一種理想指標。

(2)、計算公式:IQ=100+15(X-X)

SDX表示被試的量表分數,X表示被試所在年齡水平的平均量表分數,SD表示這一年齡水平被試的量表分數的標準差。

3、在實際工作中,通常將原始分數與IQ值對應關系計算出來作為常模表,使用時,可以在常模表上按其年齡直接查出智商3、不同測驗獲得的離差智商只有當標準差相同或接近時,才可以比較,標準差不同,分數的意義就不同。參考表5-1第三單元常模分數的表示方法1、轉換表法(常模表)

——是最簡單而且最基本的表示常模的方法就是轉化表,也叫常模表參考表5-22、剖面圖

——是將測驗分數的轉換關系用圖形表示出來。可以很直觀地看出被試在各分測驗上的表現及其相對位置。參考圖5-1

課堂練習1、隨機號碼表法是(

)。(A)簡單隨機抽樣

(B)系統抽樣

(C)分組抽樣

(D)分層抽樣A2、解釋心理測驗分數的參照基礎是(

)

(A)常模分數

(B)常模

(C)導出分數

(D)分數B

3、量表中首先使用智力年齡概念的是(

)

(A)比內一西蒙

(B)韋克斯勒

(C)斯坦福一比內

(D)瑞文A4、解釋心理測驗分數的參照基礎是(

)。

(A)常模分數

(B)常模

(C)導出分數

(D)分數B5、常模樣本量的大小,一般不小于(

)。

(A)l00或500

(B)800或1000

(C)20或25

(D)30或100

D(多選)6、百分位常模包括(

)。(A)百分等級

(B)百分點

(C)四分位數

(D)十分位數

ABCD(多選)7、在分數量表上,相對于某一百分等級的分數點可稱為(

)。(A)百分等級

(B)四分位數

(C)百分點

(D)百分位數CD

8、“某分數的百分等級為55”表示在常模樣本中有55%的人的分數比該分數()。(A)低(B)相等(C)高(D)全不是

A(多選)9、獲得標準分數的途徑包括(

)。(A)線性轉換

(B)非線性轉換

(C)矢量計算

(D)坐標變化AB10、以50為平均數、以10為標準差來表示的分數通常叫(

)。(A)Z分數(B)T分數(C)標準九分數(D)離差分數B11、()表示的是個體智力分數在同年齡組分數分布中所處的位置。(A)離差智商(B)比率智商(C)百分等級(D)標準九分數A12、比率智商(IQ)是()與實足年齡之比。(A)生理年齡(B)真實年齡(C)心理年齡(D)智力商數C第三節測驗的信度

信度是評價一個測驗是否合格的重要指標之一,一個測驗是否可靠,具有穩定性,就是考察這個測驗的信度。第一單元信度的概念一、信度的定義:信度是指同一被試者在不同時間內用同一測驗(或用另一套相等的測驗)重復測量,所得結果的一致程度。

1、信度越高,說明測驗的穩定性越好。

2、每一個測試的實得分數(X)總是由真實分數(T)和誤差(E)兩部分構成的.X=T+E(隨機誤差系統誤差)信度只受隨機誤差的影響,隨機誤差越大,信度越低。二、信度的指標信度用:信度系數、信度指數、測量標準誤來表示

1、信度系數r(xx):它是一種相關系數,是受測者樣本所得兩種資料的相關。(表示實得分數和真實分數的符合情況)

r(xx)=ST2SX2

(真分數方差與實得方差比率)

2、信度指數:信度系數開根號3、測量標準誤:

信度系數只是表示一組測量的實得分數和真實分數的符合程度,但沒有指出個體分數的變異量。標準差和標準誤的區別可以這樣表述:標準差是衡量樣本數據的離散程度;標準誤是樣本均值的標準差,衡量的是樣本均值的離散程度。

標準誤表示的是個人測驗分數的變異量。(表示誤差大小)SE=S(x)√1-r(xx)SE所得分數是測量的標準誤S(x)所得分數的標準差r(xx)測驗的信度系數信度越高,標準誤就會越低。第二單元信度評估的方法對信度的評估沒有通用的法則,不同的信度反映測驗誤差的不同來源,所以每一種信度系數只能說明信度的不同方面。1、重測信度——穩定性系數2、復本信度——等值性系數3、內部一致性信度4、評分者信度一、重測信度(又稱穩定性系數)

1、它的計算方法是采用重測法。(使用同一測驗,在同樣條件下對同一組被試者前后施測兩次測驗,求兩次得分間的相關系數。)

2、優點:能考察測驗是否隨時間而變化缺點:時間短:易受到練習和記憶的影響時間長:身心的發展和學習經驗的積累

一般是兩周到四周較宜,間隔時間最好不超過六個月二、復本信度(等值性信度)

1、以兩個等值但題目不同的測驗來測量同一群體,然后求應試者在這兩個測驗上得分的相關系數。在應用上,有一半受測先做A本,再做B本,另一半受測,先做B本,再做A本。

A本:你是一個喜歡熱鬧的人嗎?

B本:你是一個喜歡安靜的人嗎

2、優點:能夠避免重測信度的一些問題,如記憶效果、練習效應等。缺點:⑴如果測量的行為易受練習的影響,則復本信度只能減少而不能消除這種影響。⑵由于第二個測驗只改變了題目的內容,已經掌握的解題原則,可以很容易的遷移到同類題目上⑶有些測驗很難找到合適的復本,建立副本比較困難。三、內部一致性信度內部一致性信度,主要反映的是題目之間的關系,表示測驗能夠測量相同內容和特質的程度。1、分半信度:是指采用分半法估計所得的信度系數。

具體做法:奇數項目和偶數項目的相關分半信度實際上是反映的只是兩半測驗之間的相關系數,測驗越長信度就越高,常會低估信度,需要用公式來加以修正。(斯皮爾曼—布朗矯正公式)2、同質性信度:同質性代表測驗內容所有題目間的一致性。

當各個測驗得分之間有較高的正相關時,測驗為同質,反之為異質。(測驗應有若干個相對異質的分測驗,分測驗內部具有同質性)四、評分者信度

是指不同評分者對同樣對象進行評定時的一致性。最簡單的估計方法就是隨機抽取若干份答卷,由兩個獨立的評分者打分,再求每份答卷兩個評判分數的相關,即評分者信度,一般要求在成對的受過訓練的評分者之間平均一致性達到0.90以上,才認為評分是客觀的。第三單元信度與測驗分數的解釋一、解釋真實分數與實得分數的相關信度系數r(xx)可以解釋為總的方差中有多少比例是由真實分數的方差決定的,也就是測驗的總變異中真分數造成的變異占百分之幾。

r(xx)的分布是從0.00到1.00,代表從缺乏信度到完全可信的狀態。

例如:r(xx)=0.90則得分中90%的變異是真分數,僅10%是來自測驗的誤差。

r(xx)=0反映變異和差別都反應的是測量誤差

r(xx)=1反映沒有誤差二、確定信度可以接受的水平(0.7-0.85)當rxx<0.70時,測驗不能用于對個人作出評價或預測,而且不能做團體比較;當0.70≤rxx<0.85時,可用于團體比較;當rxx≥0.85時,才能用來鑒別或預測個人成就或作為。三、解釋個人分數的意義

信度在解釋個人分數的意義上,是通過應用測量標準誤(抽樣的誤差)

作用:其一是估計真實分數的范圍;其二是了解實得分數再測時可能的變化情形。

SE=sx√1-rxx

SE=sx√1-rxx一般采用95%的概率水平,其置信區間為:X―1.96SE<XT≤X+1.96SE(95%的可能性真分數落在所得分數±1.96SE

上)

例:在一個智力測驗中,某個被試的IQ為100,已知該智力測驗的標準差為15,信度系數為0.84,如果再測一次,他的分數將改變多少?

SE=sx√1-rxx=15√1-0.84=6.0

IQ=100±1.96*6=100±11.76≈88~112四、比較不同測驗分數的差異測量標準誤和測驗信度在評價兩個不同測驗的分數時候有明顯差異時也非常重要,這種比較包括兩個人不同分數的差別和同一受測者在兩個差異上的差別。公式:SEd=S√2-rxx-ryy

SEd表示詫異標準誤,S代表兩個測驗使用的標準差,

例;某被試在韋氏成人智力測驗中言語智商為102,操作智商為110。已知兩個分數都是以100為平均數,15為標準差的標準分數。假設言語測驗和操作測驗的分半信度分別為0.87和0.88。問其操作智商是否顯著高于言語智商呢?1、SEd=√2-0.87-0.88=7.5。2、在統計上,經常要求兩個分數的差異程度達到0.05的顯著水平,才能承認不是誤差的影響。因此,將差異標準誤(7.5)乘以1.96,結果為14.7,這表明個體在韋氏測驗兩半得分的差異高于大約15分,才能達到0.05顯著水平。3、上述被試的差異分數110-102=8是不顯著的。第四單元影響信度的因素一、樣本特征(一)樣本團體異質性的影響異質性越高,分數分布范圍大,信度系數越高。

(二)樣本團體平均能力水平的影響二、測驗長度(一)測驗越長,測題取樣或內容取樣越有代表性(二)測驗越長,被試的猜測因素影響就越小三、測驗難度洛德(Lord)提出在學績測驗中,為了保證其可靠性,各類選擇題的理想平均難度為:五擇一測題,0.70;四擇一測題,0.74;三擇一測題,0.77;是非題,0.85四、時間間隔課堂練習1、信度只受(B)的影響。(A)系統誤差(B)隨機誤差(C)恒定效應(D)實驗誤差2、同質性信度主要反映測驗內部()間的一致性。

(A)兩半測驗(B)題目與分測驗

(C)所有題目(D)分測驗與分測驗C3、以再測法或復本法求信度,兩次測驗相隔時間越短,其信度系數越()。(A)大(B)低(C)小(D)不確定A4、重測信度即()。(A)等位性系數(B)穩定性系數(C)相關系數(D)X系數B5、一般要求在成對的受訓的評分者之間,平均一致性達到()以上,才能認為評分是客觀的。A0.7B0.8C0.9D1.0C第四節測驗的效度

第一單元效度的概念

一、效度的定義在心理測驗中,效度是指所測量的與所要測量的心理特點之間符合的程度,或者簡單地說是指一個心理測驗的準確性。

測量效度除受隨機誤差影響外,還受到系統誤差的影響。可信的測驗未必有效,有效的測驗一定可信。

二、效度的性質1、效度具有相對性:每種測驗都有功能和限度,不能籠統的說有沒有效,而是對測量什么有沒有效。例如:數學測驗——性格2、效度具有連續性:測驗效度通常用相關系數表示,他只有程度上的不同,應該用效度較高或較低來說明。例如:用尺子測量體重第二單元效度評估的方法

一、內容效度(一)什么是內容效度

1、內容效度指的是測驗題目對有關內容或行為取樣的適用性。

2、想要編制有較高內容效度的心理測驗:首先,要對所測量的心理特征有個明確的界定。

其次,測驗題目應是所界定的內容范圍的代表性取樣。二、內容效度的評估方法1.專家判斷法

專家對測驗題目與原定內容的符合性做判斷,由于這種估計效度的方法,是一個邏輯分析的過程,所以內容效度有時又稱“邏輯效度”原定內容測驗題目2.統計分析法(1)計算兩個評分者之間評定的一致性。

(2)再測法。(測驗——學習——再測)3.經驗推測法

通過實踐來檢驗效度例如:兒童發展量表的是否有效,對每個年齡階段的兒童進行調查,然后分析。三、內容效度的特性(1)內容效度不是普遍適用。如果測驗分析者與測驗使用者定義的內容范圍相同,內容效度才有意義。(2)內容效度有時間上的特定性。(適合過去,未必適合現在)

內容效度和表面效度的區別內容效度——專家題目與測量目的總體上和內容總體上的邏輯性表面效度——外行題目與測量目的明顯的直接的關系(最高行為測驗需要高表面效度,典型行為測驗需要低表面效度)二、構想效度

(一)什么是構想效度構想效度。(又稱構思效度、結構效度):指測驗能夠測量到理論上的構想或特質的程度,即測驗的結果是否能證實或解釋某一理論的假設、術語、或構想,解釋的程度如何

————這個測驗測量的什么心理構想?測量的有多好?建立構想效度的步驟1、從某一構想理論出發,提出關于某一心理特質的假設。2、設計和編制測驗。3、用相關和因素分析法等方法分析,驗證與理論符合的程度。

(二)構想效度的評估方法1.對測驗本身的分析——研究測驗內部結構(1)測驗的內容效度可以作為構想效度的證據。例如:韋氏智力測驗內容:常識,理解,算數,相似性,記憶廣度,詞匯,譯碼,填圖,圖片排列,圖形拼湊等分測驗。這些分測驗就等同于韋氏對智力的解釋。(2)測驗的內部一致性——推斷測驗是測量單一特質還是測量多種特質。(3)分析被試者對題目的反應特點。若有證明表示某一題目的作答除了反映要測量的特質外,還反映其他影響,則說明該題會降低構想效度。例如,“我總避免對別人的言行作出批評”人格測試中的社會贊許和道德評判的成分2.測驗間的相互比較:通過分析幾個測驗間的相互關系,找出其共同之處,從而推斷這些測驗測量的特質是什么。

相容效度:新編測驗與某個已知的能有效測量相同特質的舊測驗的相關,若相關較高,則說明新測驗有較高的效度。

區分效度:新編測驗與某個已知的能有效測量不同特質的舊測驗間的相關,若相關高,則說明新測驗結構效度不高,因為也測出了其他的心理特質。

因素分析法:(最常用的方法)通過對一組測驗進行因素分析,找到影響測驗分數的共同因素,這種因素可能就是要測量的特質,如果這些因素和原先的理論構想的一致,則構想效度就高。例如:一些研究韋氏智力測試做了因素分析,發現公共因子有三個,其中A因子主要負荷的測驗有,詞匯,分類,知識和領悟,B因子主要符合測驗為,圖片排列、木塊圖、填圖和圖形拼湊,C因子的主要符合測驗為算術,數字廣度,編碼。用因素分析法得出的結論,該測驗實際上是測量了A因素——言語理解能力

B因素——知覺組織因素

C因素——記憶和集中因素韋氏的假定是,“智力是一個人去理解和應付他周圍世界的總的才能。”3.效標效度的研究證明4.實驗法和觀察法證實:觀察實驗前和實驗后分數的差異。可以預測,在某種情況下或經過某種訓練,受測者的測驗得分會有所變化。三、效標效度(一)效標效度1、效標效度又稱實證效度,反映的是預測個體在某種情境下行為表現的有效性程度。考察測驗對行為的預測性如何。

例如:用機械能力傾向測驗,測查機械工人,如能證明測驗高分組的實際工作成績高于低分組的實際工作成績,則可以認為該測驗具有較高的校標效度。2、分類:根據效標資料是否與測驗分數同時獲得,分為同時效度和預測效度兩類同時效度——診斷現在——(例如:會考成績)預測效度——預測將來——(例如:高考成績)(二)效標效度的評估方法1、相關法:相關法是評估效標效度最常用的方法,它是計算測驗分數與效標資料間的相關系數。(積差相關法,等級相關法,二列相關法,四分相關法)例如:張厚粲教授在主持修訂瑞文標準推理測驗(SPM)時候,他報告的預測效度是對北京兩所普通中學69名高三的學生先施測SPM,再搜集這批學生三個月后的高考成績,最后計算與高考總分的積差相關。2、區分法:思路:被試接受測驗后,讓他們工作一段時間,再根據工作成績的好壞分成兩組。來分析這兩組原先接受測驗的分數差異,若差異顯著,則說明有較高的效度。3、命中率法命中率法是當測驗用來做取舍的依據時,用其正確決定的比例作為效度指標的一種方法。命中率包括:正命中率:被測驗選出來的人中真正選對的人的比例總命中率:被選對了的人數和被淘汰對了的人數的和與總人數的比例。測驗鑒定為弱智測驗確認為正常合計真正弱智24060300真正正常7096309700合計310969010000例:假如擁有1萬名兒童的總體中,真正的弱智有300人,并有心理學家用智力測試做了如下分類,結果是:正命中率是:PPP=240/(240+70)=0.7742總命中率是:(240+9630)/10000=0.9870第三單元效度的功能一、預測誤差:1、決定性系數:決定性系數是效度系數的平方,它表示測驗正確預測效標的比例。

例如:測驗的效度是0.8,決定系數是0.64.則測驗分數正確預測效標的比例是64%2、估計的標準誤:——對真正分數估計的誤差大小公式:Sest=Sy√1-rxy2

Sest:估計的標準誤

Sy:效標成績標準差rxy2:決定性系數當rxy2=1,估計誤差為0,測驗分數可以代替效標。當rxy2=0,測驗無異于猜測二、預測效標分數三、預測效率指數第四單元影響效度的因素

影響效度的因素很多,凡能產生隨機誤差和系統誤差的因素都會降低測驗的效度。一、測驗本身的因素測驗取材的代表性、測驗長度、試題類型、難度、區分度以及編排方式等都會影響效度二、測驗實施中的干擾因素主試:遵守測驗手冊規定,指導語是否統一,測驗時間,評分標準是否合理被試:興趣、動機、情緒、態度、身心健康三、樣本團體的性質(一)樣本團體的異質性樣本團體越同質,分布范圍就越小,測驗效度就越低。樣本團體越異質,分布范圍越大,測驗效度就越高)(二)干涉變量(例如,受測者的興趣)四、效標的性質如果效標測量的信度不可靠,它與測驗分數之間也就失去了可靠性)1、測量的效度除了受隨機誤差影響外,還受(

)的影響。

(A)隨機效應

(B)測量理論

(C)系統誤差

(D)相關系數A多選2、在評估測驗的效度時,必須考慮測驗的(

)。

(A)信度

(B)目的

(C)功能

(D)長度CD

多選3、效標效度可分為()。(A)相容效度(B)區分效度(C)同時效度(D)預測效度CD多選4、效度具有相對性,在評鑒測驗的效度時,必須考慮測驗的(

)。(A)信度(B)目的(C)功能(D)長度BC5、測驗題目對有關行為取樣的適用性是()。

(A)內容效度

(B)構想效度

(C)效標效度

(D)區分效度A6、在編制測驗時,效度是重要的要考慮的特性,如果是編制最高行為測驗,除了內容效度,也要求有()。A較高的表面效度B較好的專家判斷C較好的外行判斷D主觀性A測驗的項目分析包括定性分析和定量分析。定性分析包括:內容效度,題目編寫的恰當性和有效性等定量分析包括:題目難度和區分度

第五節項目分析第一單元項目的難度一、定義:指項目的難易程度。難度的指標通常以通過率(P)表示。通過的人數越多,難度越小,通過的人數越小,難度越大。二、計算方法1、二分法記分的項目(1)心理測驗的項目如果是選擇題,通過記1分,錯誤記0分。對這類題目可以用通過率公式計算難度。通過率公式:P=R/N*100%(N代表受測人數,R代表通過人數)P值越大,難度越小)例:在有200個學生參加的測驗中,答對某項目的人數為120人,則該項目難度為多少?

P=120/200=0.6(2)當受測人數較多時,則課使用極端分組法。具體做法:受測者分為三組,分數最高的27%受測者為高分組(NH),分數最低的27%受測者為低分組(NL)分別計算高分組和低分組的通過率,以兩組通過率的平均值為每題的難度。公式為:P=(PH+PL)/2

例如:在一次又370人的被試的測驗中,選為高分組和低分組的被試各100人,其中高分組有70人答對第一題,低分組有40人答對第一題,則第一題的難度為。

P=(PH+PL)/2=1/2(70/100+40/100)=0.052、非二分記分的項目

對于論述題,每個答案不止有答對和答錯兩種結果,而是從滿分至零分之間的多種可能,對于這類項目的難度用公式:P=X/Xmax×100%(X為全體受測者在該題上的平均分,Xmax為該題的滿分)例如:某次數學測驗的第七題,滿分分值是15分,考生在該題上的平均得分是9.6,則該題的難度是(0.64)三、難度水平的確定(一)項目的難度1、P值越接近于0或接近于1,越無法區分被試間能力的差異。相反,P值越接近于0.50,區別力越高。為了使測驗具有更大的區別力,應選擇難度在0.50左右的試題比較合適。

2、當測驗用于選拔或診斷時,應該比較多的選擇難度值接近錄取率的項目。3、對于選擇題而言,P值一般應該大于概率水平(二)測驗的難度測驗的難度(P396頁圖5-3)大多數測驗難度設計時希望呈現常態分布的模型。A為正偏態分布,即大多數得分集中在低分端,因此必須增加足夠數量的較容易的項目;B為負偏態分布,即大多數得分集中在高分端,因此必須增加足夠數量的較高難度的項目。一般來說,最好的測驗中所包含的試題的難度在0.5+-0.2之間,平均難度接近0.05

第二單元項目的區分度

一、定義

項目區分度也叫鑒別力,是指測驗項目對被試的心理特性的區分能力。是評價項目質量和篩選項目的主要指標,也是影響測驗效度的重要因素。如果一個項目,實際水平高的被試能順利通過,而實際水平低的被試不能通過,那么我們就可以認為該項目有較高的區分度。二、計算方法—1、鑒別指數法步驟:(1)按測驗總分高低排列答卷;(2)確定高分組與低分組,每一組取答卷總數的27%;(3)分別計算高分組與低分組在該項目上的通過率或得分率;(4)按下列公式估計出項目的鑒別指數:

D=PH-PL(公式5-35)式中,D為鑒別指數,PH為高分組在該項目上的通過率或得分率,PL為低分組在該項目上的通過率或得分率。

表5-5項目鑒別指數與評價標準鑒別指數(D)項目評價0.40以上很好0.30~0.39良好,修改后會更佳0.20~0.29尚可,但需修改0.19以下差,必須淘汰2、相關法用鑒別指數分析項目雖然容易理解,計算方便,但結果不精確,在大規模或標準化的測驗中,多采用相關法,即以項目分數與效標分數或測驗總分的相關作為項目區分度的指標。相關越高,項目區分度就越高。三、區分度與難度的關系。項目通過率D的最大值1.0000.900.200.800.400.700.600.600.800.501.000.400.800.300.600.200.400.100.20001、一般來說,較難的項目對高水平的受測者區分度(

)。

(A)中等

(B)一般

(C)較高

(D)較低C2、在200個學生中,答對某項目的人數為120,則該項目的難度是()A0.1B0.2C0.4D0.6D3、項目的()也叫鑒別力,是指測驗項目對被試者的心理特性的區分能力A難度B區分度C信度D效度B4、1965年,美國測驗專家伊貝爾依據長期的經驗提出用鑒別指數評價項目能力的標準,鑒別指數D為(),說明該項目差,必須淘汰。A0.19以下B0.2-0.29C0.3-0.39D0.4以上A5、難度和區分度的關系,一般說來,較難的項目對高水平者的被試者區分度(),中等難度的項目對中等水平的被試區分度高。A中等B一般C高D低C

第六節測驗編制的一般程序

第一單元測驗的目標分析一、測驗的對象:編制測驗前首先要明確測驗的對象,即該測驗編成后用于哪些團體。中國韋氏城市版,農村版。二、測驗的用途

1、顯示性測驗是指測驗題目和所要測量的心理特征相似的測驗。(如:成就測驗)

2、預測性測驗是指預測一些沒被測量的行為的測驗。它最關心的是測驗分數與預測行為之間的關系。(如:高考成績)三、測驗的目標

心理測驗的目標指用來測量什么樣的心理變量或行為特征。目標分析以測驗不同而異,分三種情況:(一)工作分析:預測性測驗的主要任務就是要對所預測的行為活動作具體分析包括兩個步驟:1、確定哪些心理特征和行為可以使要預測的活動達到成功。2、建立衡量被試是否成功的標準-效標。(二)給所要測量的心理或行為特質下定義,發現該特質所包含的維量將通過什么行為表現出來或怎樣進行測量。(三)確定測驗的具體內容:對于顯示性測驗要確定顯示的內容和技能,從中取樣。(成就測驗)。

第二單元測題的編寫一、搜集資料,來源三方面:

1、已出版的標準測驗。MMPI,WAIS2、理論和專家的經驗。

3、臨床觀察和記錄。二、命題的一般原則1、內容方面:符合測驗目的;取樣要有代表性;題目見內容相互獨立。2、文字方面:避免使用生僻的字句或詞匯;語句簡明扼要;一句話說明一個概念;盡量少使用雙重否定句。3、理解方面:題目有確切的答案;不要超出受試團體知識水平和理解能力。4、社會敏感性方面:應盡量避免社會敏感性問題(如涉及社會禁忌或個人隱私的題目)三、編制要領1、選擇題,編制要點:(1)、題干所提的問題必須明確。(2)、選題切忌太長,要簡明扼要。(3)、每題只給一個正確答案,其他屬誘答。(4)、各選項長度應相等,盡量不要有長有短。(5)、避免題干用詞與選項用詞一致,否則會成為選擇答案的線索。(6)、選項最好用同一形式。2、是非題,編制應注意:

1、內容應以有意義的概念、事實或基本概念為基礎。

2、每道題只能包含一個概念。

3、盡量避免否定的敘述,尤其是雙重否定。

4、若是表達意見的題目,最好說明意見的來源和根據。

5、是非題的數目應有比例,基本相等,且隨機排列。3、簡答題,編制簡答題的三個原則:

1、宜用問句形式。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論