




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
教育科學研究方法揚州大學教育科學學院郭兆明guozhaom@教育科學研究方法1教育科學研究方法教育研究的過程(第三編)教育研究方法的類型(第二編)教育科學研究方法教育研究的過程(第三編)2教育研究的過程(第三編)課題的選擇(第八章)研究方案的設計(第九章)資料的整理與成果的表述(第十章)教育研究的過程(第三編)課題的選擇(第八章)3第八章研究課題的選擇發現研究問題檢索相關文獻確立研究課題第八章研究課題的選擇發現研究問題4發現研究問題實際需要前人的研究發現研究問題實際需要5實際需要(討論)數學(閱讀)學習不良學生的認知特點及其干預研究盧仲衡的自學輔導實驗法顧冷沅青浦數學教學改革布盧姆的教學評價的新突破80年代以來師范生素質的發展趨勢研究高職院校學生職業性向測試分析研究實際需要(討論)數學(閱讀)學習不良學生的認知特點及其干預研6前人的研究“一步評價”技術研究樣例學習的研究(1)單個樣例的研究(子目標,無具體目標)(2)多個樣例的研究(樣例個數、樣例呈現方式)(3)樣例學習與問題解決的比較前人的研究“一步評價”技術研究7檢索相關文獻文獻檢索在教育科研中的作用教育文獻的種類及主要分布文獻檢索的過程和主要方法檢索相關文獻文獻檢索在教育科研中的作用8文獻檢索在教育科研中的作用避免重復勞動,提高科學研究的效益做好文獻綜述文獻檢索在教育科研中的作用避免重復勞動,提高科學研究的效益9教育文獻的種類及主要分布書籍報刊網絡媒體(中國知網,CNKI)教育文獻的種類及主要分布書籍10文獻檢索的過程和方法過程(主題、關鍵詞、作者、來源)方法(按時間查、按照引文查)文獻檢索的過程和方法過程(主題、關鍵詞、作者、來源)11確立研究課題確立研究課題的思維策略論證研究課題的主要問題確立研究課題確立研究課題的思維策略12確立研究課題的思維策略分析課題的研究價值(結合項目申報)(1)理論價值(2)實踐價值考察研究人員的主觀條件考慮研究的客觀條件
確立研究課題的思維策略分析課題的研究價值(結合項目申報)13在選擇課題時,要盡量避免:(1)范圍太大,無從下手;(2)在現有條件下,難度較大,資料缺乏;(3)屬于經驗感想之談,而不是科研題目。在選擇課題時,要盡量避免:(1)范圍太大,無從下手;14論證研究課題的主要問題研究問題的性質(理論研究、應用研究)研究的目的和意義(研究價值)國內外相關研究現狀、可能有所突破之處。研究的可能性、基本條件研究的步驟及成果形式論證研究課題的主要問題研究問題的性質(理論研究、應用研究)15第九章教育研究方案的設計制定研究方案的主要注意事項:(1)陳述研究課題(2)論述研究的目的和意義(3)闡述研究假設和依據(4)闡述研究內容(5)確定研究對象(6)選擇抽樣方法(7)選擇研究方法和工具(8)制定行動計劃第九章教育研究方案的設計制定研究方案的主要注意事項:16第十章教育研究的資料整理與成果表述研究成果的的基本格式(1)題目(20字以內)(2)摘要和關鍵詞(3)主體【引言、方法、結果、討論(定量研究)】(4)參考文獻第十章教育研究的資料整理與成果表述研究成果的的基本格式17第二編教育研究方法的類型教育研究的實證方法(第四章)1、問卷調查法2、教育測量法3、教育實驗法4、內容分析法教育研究的質性方法(第五章)1、訪談調查法2、敘事研究法第二編教育研究方法的類型教育研究的實證方法(第四章)18第四章教育研究的實證方法問卷調查法教育測量法教育實驗法內容分析法第四章教育研究的實證方法問卷調查法19問卷調查法界定特點步驟案例研究【問卷舉例(SCL90,職業興趣、16PF,開發者問卷)】問卷調查法界定20界定是研究者用嚴格設計的問卷,通過書面語言與被調查者進行交流,來收集研究對象關于教育問題或教育現象的信息和資料的方法。界定是研究者用嚴格設計的問卷,通過書面語言與被調查者進行交流21特點調查工具標準化調查過程標準化調查結果標準化研究效率高特點調查工具標準化22步驟設計前的探索設計問卷的結構設計問卷初稿試用和修改問卷發放和回收問卷(回收率應不低于70%)分析調查結果步驟設計前的探索23設計問卷初稿選擇調查類型選擇問題形式斟酌問題表述設計規范答案關注問題數量(時間控制)合理排列問題設計問卷初稿選擇調查類型24選擇調查類型就調查內容而言,選擇綜合調查或專題調查。就調查目的而言,選擇常模調查或比較調查就調查范圍而言,選擇普遍調查或抽樣調查選擇調查類型就調查內容而言,選擇綜合調查或專題調查。25選擇問題形式填空式是否式多項單選式多項限選式表格式(答題紙)或量表式(P83)排序式(P83)選擇問題形式填空式26案例研究中小學生家庭作業心理現狀的調查分析上海市中小學生家庭教育現狀的調查分析五年制師范生心理健康狀況SCL-90的調查分析小學數學作業批改的現狀的調查分析中小學生閑暇生活狀況的調查分析物理教師課堂教學行為的調查分析案例研究中小學生家庭作業心理現狀的調查分析27教育測量法界定特點步驟個案研究教育測量法界定28界定教育測量法:根據某種規則,以數量化的形式描述教育現象的某種屬性。界定教育測量法:根據某種規則,以數量化的形式描述教育現象的某29特點以測驗為工具對研究對象進行測試,從而獲得數量化的結果,并通過進一步分析獲得相關結論。例如,了解學生的知識和能力發展情況。特點以測驗為工具對研究對象進行測試,從而獲得數量化的結果,并30編制測驗的步驟確定測驗目的確定測驗內容確定測驗形式篩選題目(難度、區分度)標準化過程鑒定測驗(信度、效度)編寫測驗指導書編制測驗的步驟確定測驗目的31項目分析
第一單元項目難度第二單元項目區分度項目分析第一單元項目難度32第一單元項目難度
項目難度的定義
項目難度的計算方法難度水平的確定
第一單元項目難度項目難度的定義33項目難度的定義
項目難度(difficulty)是指題目的難度。【注】(1)在非能力測驗(如人格測驗)中,類似的指標是“通俗性”,即取自相同總體的樣本中,能在答案方向上回答該題的人數,其計算方法與難度相同。(2)難度的指標通常以通過率表示,以答對(通過)該題的人數百分比來表示:
P=(R/N)×100%,P表示項目難度,N表示全體被試數,R為答對(通過)該項目的人數。從公式可以發現:難度越大,P值越小。
項目難度的定義項目難度(difficulty)是指題目的難34計算方法
二分法計分項目非二分記分的項目計算方法二分法計分項目35二分法計分項目
心理測驗的項目大多為選擇題,通過計1分,錯誤計0分。1、當被試較少時,對這類題目可以直接使用公式P=(R/N)×100%計算難度。2、當被試較多時,則可根據測驗總成績將被試分成三組:分數最高的27%被試分為高分組,分數最低27%被試為低分組,中間46%的被試為中間組。分別計算高分組和低分組的通過率,以兩組通過率的平均值作為每一題的難度。其公式為:
P=(PH+PL)/2式中P表示難度,PH和PL分別代表高分組和低分組通過率。二分法計分項目心理測驗的項目大多為選擇題,通過計1分,錯誤36非二分記分的項目
當測驗項目為問答題或不能用二分法記分的形式時,一般用下面的公式計算難度。非二分記分的項目當測驗項目為問答題或不能用二分法記分的形式37難度水平的確定
項目難度測驗的難度
難度水平的確定項目難度38項目難度
進行難度分析的主要目的是為了篩選項目,項目的難度多高合適,取決于測驗的目的、性質以及項目的形式。項目難度進行難度分析的主要目的是為了篩選項目,項目的難度多39測驗目的
準確測量個體的差異。在選擇題目時,最好使試題的平均難度接近0.50,而各題難度在0.50±0.20之間。注:(1)若P=0或1時;(2)P=0.5時,舉一個極端的例子,假如某測驗各試題間的相關系數均為1,難度均為0.50,那么就有可能使50%的被試答對所有的題目得滿分;另外50%的被試無法通過任何試題得0分)測驗目的準確測量個體的差異。在選擇題目時,最好使試題的平40測驗的性質
當測驗用于選拔或診斷時,應該比較多地選擇難度值接近錄取率的項目。(1)若測驗是要選拔少數最優秀的被試,測驗就應該有相當高的難度,P值就應該小。例如,如果錄取率為20%,那么題目難度最好確定為20%,使得恰好20%的優秀被試通過;(2)假如測驗是要診斷出少數較差的被試,則測驗難度應該小,P值應該高,使得只有少數被試不能通過。測驗的性質當測驗用于選拔或診斷時,應該比較多地選擇難度值接41測驗的形式
對于選擇題來說,P值一般應該大于概率水平。例如,對于是非題,其難度值應該為0.75最為合適;而對于四選一的題目,其難度值約為0.63時最為適宜。
測驗的形式對于選擇題來說,P值一般應該大于概率水平。例如,42測驗的難度
通過考察測驗分數的頻數分布,可以對測驗的難度作出直觀檢驗(常態分布,偏態分布:正偏態分布、負偏態分布)。(1)如果被試的取樣具有代表性,對于中等難度的測驗,其測驗總分應該接近常態分布。如果得分多數偏高或偏低,則分別為“負偏態分布”和“正偏態分布”。(2)正偏態分布,即大多數得分集中在低端,說明編制的測驗對于所要研究的樣本團體來說偏難,因此,必須增加足夠數量的較容易的項目;(3)負偏態分布,即大多數得分集中在高分端,說明測驗過容易,必須增加足夠數量的有高難度的項目。測驗的難度通過考察測驗分數的頻數分布,可以對測驗的難度作出43第二單元項目區分度
項目區分度的定義項目區分度的計算方法區分度與難度的關系
第二單元項目區分度項目區分度的定義44項目區分度的定義
項目區分度(itemdiscrimination),也叫鑒別力,是指測驗項目對被試的心理特性的區分能力。
項目區分度的定義項目區分度(itemdiscrimina45項目區分度的計算方法
鑒別指數相關法
項目區分度的計算方法鑒別指數46鑒別指數1.按測驗總分高低排列答卷;2.確定高分組與低分組,每一組取答卷總數的27%;3.分別計算高分組與低分組在該項目上的通過率或得分率。4.按下列公式估計出項目的鑒別指數:D=PH-PL,式中D為鑒別指數,PH為高分組在該項目上的通過率或得分率,PL為低分組在該項目上的通過率或得分率。【注】高分組若在該測驗上的得分率高于低分組,則D>0,D越大,說明該項目區分兩種不同水平的程度越高。若D<0,則反映高水平組在該項目上的得分率反而低于低水平組,說明有問題。鑒別指數1.按測驗總分高低排列答卷;471965年,美國測驗專家(L.Ebel)根據長期的經驗提出用鑒別指數評價項目性能的標準,鑒別指數D項目評價0.40以上0.30-0.390.20-0.290.19以下很好良好,修改會更佳尚可,但需修改差,必須淘汰1965年,美國測驗專家(L.Ebel)根據長期的經驗提出用48相關法
計算區分度最常用的方法是相關法,即以某一項目分數與效標成績或測驗總分的相關作為該項目區分度的指標。相關越高,表明項目越具有區分的功能。相關法計算區分度最常用的方法是相關法,即以某一項目分數與效49區分度與難度的關系
難度和區分度是相對的,是針對一定團體而言的,絕對的難度和區分度是不存在的。一般來說,較難的項目對高水平的被試區分度高,較易的項目對水平低的被試區分度高,中等難度的項目對中等水平的被試區分度高。由于人的大多數心理特性呈常態分布,所以項目難度的分布也以常態分布好,即特別難與特別易的項目少一些,接近中等的項目多一些,而所有項目的平均難度為0.50,這樣不僅能夠保證多數項目具有較高的區分度,而且可以保證整個測驗對被試具有較高的區分能力。
區分度與難度的關系難度和區分度是相對的,是針對一定團體而言50測驗的信度
信度的概念信度評估的方法測驗的信度信度的概念51信度的概念
信度的定義信度(reliability)指的是測量結果的穩定性程度。注:(1)若能用統一測量工具反復測量某人的同一心理特質,則其多次測量的結果間的一致性程度就叫信度。有時也叫測量的可靠性。(2)例如:比較鋼尺與具有彈性的皮尺測量長度的信度。信度的概念信度的定義52第二單元信度評估的方法
(1)重測信度(2)復本信度(3)內部一致性系數(4)評分者信度
第二單元信度評估的方法(1)重測信度53重測信度
含義和計算使用的前提條件優點、缺點注意點使用重測信度的量表舉例
重測信度含義和計算54定義和計算
重測信度(1)含義:是指同一量表對同一組被試兩次所得結果的一致性程度。(2)計算:大小等于同一組被試在兩次測驗上所得分數的皮爾遜積差相關系數。注:(1)此測驗主要測量測驗跨時間的穩定性,所以,又稱穩定性系數。(2)當信度較大時,說明前后兩次測量的結果比較一致,測量工具比較穩定,被試的心理特質受被試狀態和環境變化的影響較小。
定義和計算重測信度55使用的前提條件(1)所測量的心理特性必須是穩定的。例如,成人的人格測驗就可以;但兒童的成就測驗就不行(例如,剛入學兒童的識字量)。(2)遺忘和練習的效果基本上互相抵消。智力測驗的間隔時間一般在6個月左右。(3)在兩次施測的間隔時期內,被試的心理特質方面沒有獲得更多的學習和訓練。使用的前提條件(1)所測量的心理特性必須是穩定的。例如,成56優、缺點優點:能夠提供測驗是否隨時間而變異的資料,可作為被試將來行為表現的依據。缺點:易受練習和記憶的影響。(1)如果兩次施測間隔的時間太短,則記憶猶新,練習的影響較大;(2)如果間隔的時間太長,則身心發展與學習經驗的積累等足以改變分數的意義,而使得相關減低。最適宜的時距隨測驗的目的、性質和被試特點而異,一般是兩周到四周為宜,時間間隔最好不超過六個月。優、缺點優點:能夠提供測驗是否隨時間而變異的資料,可作為被57注意點:同一量表,隨著第二次測量的時間不同,它可以有不同的重測信度。因此,在報告重測信度時,應說明兩次施測的間隔,以及在此期間被試的有關經歷。例如,《韋氏兒童智力量表手冊》中國修訂版(C-WISC)中,就報告了兩次測驗的時間間隔(2-7周)以及兩次的相關系數(城市:0.59-0.86,農村:0.59-0.81)。注意點:同一量表,隨著第二次測量的時間不同,它可以有不同的58使用重測信度的量表舉例
MMPI:臨床量表在相隔兩周重測,其值在0.58-0.92之間。CPI:加州心理調查表的重測信度各量表分別為0.38-0.77,平均0.66.SB4(斯坦福-比奈量表第四版)瑞文:三個版本的一些重測信度研究結果不一,正常成人為0.80-0.93。
使用重測信度的量表舉例MMPI:臨床量表在相隔兩周重測,其59復本信度
含義與計算使用的前提條件優、缺點注意點使用復本信度的量表舉例
復本信度含義與計算60含義與計算
復本信度(1)含義:指兩個平行的測驗測量同一組被試所得結果的一致性程度。(2)計算:大小等于同一組被試在兩個復本測驗上所得分數的皮爾遜積差相關系數。它是研究測驗跨形式的一致性(等值性)。復本信度的分類:(1)等值性系數(同時);(2)穩定性與等值性系數(不同時)。含義與計算復本信度61等值性系數定義:如果兩個復本測驗是同時連續施測的,則這種復本信度稱為等值性系數。大小:反映兩個復本測驗的題目差別所帶來的變異情況。等值性系數定義:如果兩個復本測驗是同時連續施測的,則這種復本62穩定性與等值性系數定義:如果兩個復本測驗是相距一段時間分兩次施測的,則這種復本信度稱為穩定性與等值性系數。它既考慮了測驗在時間上的穩定性,也考慮了不同題目樣本反應的一致性。大小:與其它信度系數相比,此種復本信度最小,也就是說,穩定性與等值性系數是對信度的最嚴格的檢驗,其值最低。穩定性與等值性系數定義:如果兩個復本測驗是相距一段時間分兩次63使用的前提條件
條件1:構造出兩份或兩份以上真正平行的測驗。注:復本測驗必須在題目內容、數量、形式、難度、區分度、指導語、時限以及所用的例題、公式和測驗等其它方面都相同或相似。條件2:被試有條件接受兩個測驗。例如,時間、經費等。使用的前提條件條件1:構造出兩份或兩份以上真正平行的測驗。64優、缺點優點:能夠避免重測信度的一些問題,如記憶、學習等。缺點:(1)如果測量的行為易受練習的影響,則復本信度只能減少而不能完全消除這種影響;由于第二個測驗只改變了題目的內容,已經掌握的解題原則,可以很容易地遷移到同類問題。(2)對許多測驗來說,建立復本是非常困難的。優、缺點優點:能夠避免重測信度的一些問題,如記憶、學習等。65注意點:第二次測驗仍會受到練習和記憶等因素的影響、一些解題的策略等技能也會產生也會產生遷移。對于穩定性與等值性系數,在報告結果時,也需要報告兩次施測的間隔,以及在此間隔內被試的有關經歷。
注意點:第二次測驗仍會受到練習和記憶等因素的影響、一些解題66使用復本信度的量表舉例
成就測驗的A、B卷。
使用復本信度的量表舉例成就測驗的A、B卷。67內部一致性系數內部一致性系數主要反映的是題目之間的關系,表示測驗能夠測量相同內容或特質的程度。(1)分半信度(2)同質性信度內部一致性系數內部一致性系數主要反映的是題目之間的關系,表示68分半信度
含義計算使用的前提條件及范圍使用分半信度的量表舉例
分半信度含義69含義
分半信度是指將兩個測驗分成對等的兩半后,所有被試在這兩半上所得分數的一致性程度。這種方法估計信度系數只需一種測驗形式,實施一次測驗。通常是在測驗實施后將測驗按奇、偶數分為等值的兩半,并分別計算每位被試在兩半測驗上的得分,求出這兩半分數的相關系數。這個相關系數就代表了兩個半測驗內容取樣的一致性程度,因而屬于內部一致性系數。
含義分半信度是指將兩個測驗分成對等的兩半后,所有被試在這兩70計算
先求半測驗的信度(皮爾遜積差相關系數)
(1)如果兩半測驗的變異數相等,則使用斯皮爾曼-布朗公式:式中rhh表示一半分數的相關系數,rxx為測驗原長度的信度估計值。
(2)如果兩半測驗的變異數不相等,則使用弗朗拉根(Flanagan)公式或盧侖公式計算先求半測驗的信度(皮爾遜積差相關系數)71使用的前提條件及范圍:
(1)分半信度通常在只能施測一次或沒有復本的情況下使用。(2)將一個測驗分成兩半的方法很多,所以,同一測驗通常會有多個分半信度。分半的方法有:按題號的奇偶性分半、按題目的難度分半、按題目的內容分半等。
使用的前提條件及范圍:(1)分半信度通常在只能施測一次或沒72使用分半信度的量表舉例
(1)CPI的分半相關系數為0.63-0.86,平均為0.78.(2)瑞文彩色本的分半信度在0.65-0.94,年輕受試者較低。標準本的分半相關信度為0.86,也是年輕者較低。(3)韋克斯勒三套智力量表(WAPPSI-R,WISC-3,WAIS-R)言語量表:分半信度在0.86-0.97操作量表:分半信度在0.85-0.94全量表:分半信度在0.90-0.98(4)SB4:內在一致性系數均在0.9-0.99之間。使用分半信度的量表舉例(1)CPI的分半相關系數為0.6373同質性信度
含義計算使用同質性信度的量表舉例同質性信度含義74含義同質性信度是指測驗內部所有題目間的一致性程度。題目間的一致性:(1)所有題目都測的是同一種心理特質;(2)所有題目得分之間具有較高的正相關。含義同質性信度是指測驗內部所有題目間的一致性程度。75當一個測驗具有較高的同質性信度時,說明測驗主要測的是某一單一心理特質,實測結果是該特質水平的反映。如果一個測驗的同質性信度不高,則說明測驗結果可能是幾種心理特質的綜合反映(應采用分測驗)。
當一個測驗具有較高的同質性信度時,說明測驗主要測的是某一單一76計算同質性信度K-R20K-R21克倫巴赫α系數計算同質性信度K-R2077(1)K-R20公式庫德和理查德遜于1937年提出,僅適用于0、1記分測驗。(1)K-R20公式庫德和理查德遜于1937年提出,僅適78(2)K-R21庫德和理查德遜于1937年提出,僅適用于0、1記分測驗。此公式只有當所有題目的難度接近時才可使用。不需逐題計算通過率。
(2)K-R21庫德和理查德遜于1937年提出,僅適用79(3)克龍巴赫α系數此公式是由克龍巴赫(Cronbach)提出的,它不要求測驗題目僅是0、1記分,可以處理任何測驗的內部一致性系數的計算問題。
(3)克龍巴赫α系數此公式是由克龍巴赫(Cronbach80例題某態度量表共7題,100個被試在各題上得分的方差分別是0.81,0.82,0.79,0.83,0.85,0.76,0.77,測驗總分的方差是14.00,此時測量的α值為?例題某態度量表共7題,100個被試在各題上得分的方差分81使用同質性信度的量表舉例
(1)諾森伯格(Rosenberg,1985)自尊量表:克龍巴赫α系數為0.77-0.88。(2)SB4的KR-20,各測驗各年齡中數平均值為0.73-0.98使用同質性信度的量表舉例(1)諾森伯格(Rosenberg82評分者信度
含義計算
評分者信度含義83含義
評分者信度是指多個評分者給同一組人的答卷進行評分的一致性程度。用于測量不同評分者產生的誤差。一般要求在成對的受過訓練的評分者之間平均一致性達0.90以上,才認為評分是客觀的。含義評分者信度是指多個評分者給同一組人的答卷進行評分的一致84計算
當評分者為兩人時,評分者信度等于兩個評分者的積差相關或等級相關系數。當多個評分者評定多個對象,評分者信度等于兩個評分者的肯德爾和諧系數進行估計。計算當評分者為兩人時,評分者信度等于兩個評分者的積差相關或85效度
第一單元:效度的概念第二單元:效度評估的方法效度第一單元:效度的概念86第一單元效度的概念效度的定義效度的性質
第一單元效度的概念效度的定義87效度的定義
效度是指所測量的與所要測量的心理特點之間符合的程度。效度是科學測量工具最重要的必備條件,一個測驗若無效度,則無論具有其它任何優點,一律無法發揮其真正的功能。因此,選用測量工具時首先要看效度。
效度的定義效度是指所測量的與所要測量的心理特點之間符合的程88效度的性質
效度具有相對性效度具有連續性
效度的性質效度具有相對性89效度的相對性
任何測驗的效度是對一定的目標來說的,或者說測驗只有用于與測驗目標一致的目的和場合才會有效。因此,不能籠統地說某測驗有效,而應該說它對測量什么有沒有效。
效度的相對性任何測驗的效度是對一定的目標來說的,或者說測驗90效度的連續性
測驗效度通常用相關系數表示,它只有程度上的不同,而沒有“全有”或“全無”的區別。因此,評價一個測驗時,不應該說“有效”或“無效,而應該說效度較高或效度較低。當然,效度是指“測量結果”的有效程度。
效度的連續性測驗效度通常用相關系數表示,它只有程度上的不同91第二單元效度評估的方法
(1)內容效度(2)構想效度(結構效度)(3)效標效度第二單元效度評估的方法(1)內容效度92內容效度
內容效度的定義內容效度的評估方法內容效度與表面效度
內容效度內容效度的定義93內容效度的定義
內容效度是指項目對欲測的內容取樣的適當程度。由于這種測驗的效度主要與測驗內容有關,所以稱內容效度。注:人們要測定“憂慮性”,就要對這個概念有個明確的內容范圍,然后從臨床觀察、病人自述、醫生筆記以及文獻報道中了解具有憂慮性的人具有哪些行為特點,從而編制“憂慮性”測驗。
內容效度的定義內容效度是指項目對欲測的內容取樣的適當程度。94內容效度的評估方法
專家判斷法(P65,雙向細目表)內容效度的評估方法專家判斷法(P65,雙向細目表)95構想效度(結構效度)
構想效度的概念構想效度的估計方法
構想效度(結構效度)構想效度的概念96構想效度的概念指測驗對理論上結構的測量程度。
構想效度的概念指測驗對理論上結構的測量程度。97構想效度的估計方法
測驗內法
測驗間的相互比較
構想效度的估計方法測驗內法98測驗內法這類方法主要是通過研究測驗的內部結構(如測驗的內容以及題目間的關系等)來分析測驗的結構效度。(1)確定測驗的內容效度
(2)考察測驗的同質性(同質性信度)
測驗內法這類方法主要是通過研究測驗的內部結構(如測驗的內容以99確定測驗的內容效度
通過確定測驗取樣的內容范圍,我們就可以利用這些資料來定義測驗所測的結構的性質。通過確定測量的內容效度便為結構效度提供了有關證據。例如:在編制語文能力測驗時,我們將內容總體描述為對詞匯下定義、對語言進行類比推理以及在文章篇句中正確運用文字的能力,這在實際上給“語文能力”的結構下了定義。確定測驗的內容效度通過確定測驗取樣的內容范圍,我們就可以利100考察測驗的同質性通過對被試在項目上的反應與總分的相關計算,以及分半系數、α系數、K-R20、K-R21等指標的計算,可以推算出測驗所測的是單一特質還是多種特質,從而確定測驗是否具有結構效度。考察測驗的同質性通過對被試在項目上的反應與總分的相關計算,以101測驗間的相互比較
相容效度
區分效度
因素效度
測驗間的相互比較相容效度102相容效度
計算被試在新舊(已有效度證據的成熟測驗)兩個同類測驗上的分數之間的相關。
相容效度計算被試在新舊(已有效度證據的成熟測驗)兩個同類測103區分效度
看它是否與測量不同結構的測驗是否具有較低的相關,用此方法確定的效度叫區分效度。例如,數學推理能力測驗與閱讀能力測驗。區分效度看它是否與測量不同結構的測驗是否具有較低的相關,用104因素效度
建立結構效度最常用的方法是:通過對一組測驗進行因素分析,找到影響測驗分數的共同因素,這種因素可能就是我們要測量的心理特質(構思)。
因素效度建立結構效度最常用的方法是:通過對一組測驗進行因素105效標效度
效標效度的定義
效標效度的評估方法
效標效度效標效度的定義106效標效度的定義
衡量測驗有效性的一個重要方法是根據測驗所作出的預測是否能證實,如果一個測驗的預測與將來實際發生的事情非常接近,那么這就是一個好測驗。例如,用大學入學考試來預測被試入學后的學習,如果預測準確性高,便說明這是一個好測驗。效標效度的定義衡量測驗有效性的一個重要方法是根據測驗所作出107效標效度的定義效標:被預測的行為是衡量測驗是否有效的標準。效標效度:就是考查測驗分數與效標的關系,看測驗對我們感興趣的行為預測得如何。因為效標效度需要在實踐中檢驗,所以,又稱實證效度。
效標效度的定義效標:被預測的行為是衡量測驗是否有效的標準。108效標效度的分類1、同時效度:與用來診斷現狀的測驗有關。例如,智力測驗以學生當時的學業成績為效標,由于學業成績是現成的,所以這種效度稱為同時效度。2、預測效度:與預測將來結果的測驗有關。例如,大學入學考試可用學生入學后的學習成績作效標,因為效標資料是在考試以后間隔一段時間后才能獲得,所以高考的效度則是一種預測效度。注:此種效度對人員的選拔和安置工作非常重要。常用的效標是專業訓練的成績、實際工作的表現等。效標效度的分類1、同時效度:與用來診斷現狀的測驗有關。例如,109效標效度的評估方法
相關法
區分法(分組法)
命中率法
效標效度的評估方法相關法110相關法
確定效標效度最常用的方法是計算測驗分數與效標測量的相關。根據變量的性質不同,可分別采用積差相關法、等級相關法、二列相關法等。當測驗分數為連續性變量,效標資料為等級評定時,可用賈斯朋(Juspen)多系列相關公式計算。
相關法確定效標效度最常用的方法是計算測驗分數與效標測量的相111區分法(分組法)
區分法:是檢驗測驗分數能否有效地區分由效標所定義的團體的一種方法。例如,在大學里,我們根據教師評定,把學生分為合格與不合格兩組,然后回過頭去查他們的高考分數,若兩組在高考分數上有顯著差異,那就可以認為高考是有效的,否則就認為是無效的。
區分法(分組法)區分法:是檢驗測驗分數能否有效地區分由效標112命中率法使用命中率法,可將測驗分數和效標資料分成兩類。在測驗分數方面是確定一個臨界分數(即分數線),高于臨界分數者預測其成功,低于臨界分數者預測其失敗;在效標資料方面是根據實際工作或學習成績,確定一個合格標準,在標準之上者為成功,在標準之下者為失敗。命中率法使用命中率法,可將測驗分數和效標資料分成兩類。在測驗113這樣便會有四種情況:(1)預測成功而實際也成功(B);(2)預測成功而實際上失敗(A);(3)預測失敗而實際上成功(D);(4)預測失敗事實上也失敗(C)。我們稱正確預測的為命中;不正確預測的為失誤。表5-5測驗命中與失誤的四種情況測驗預測失敗成功成功(A)失誤(B)命中失敗(C)命中(D)失誤這樣便會有四種情況:(1)預測成功而實際也成功(B);(2)114兩個指標
總命中率
正命中率
兩個指標總命中率115教育實驗法界定特點步驟案例研究教育實驗法界定116界定根據一定的理論假設,有計劃地控制教育活動的某些因素,以引起其它因素朝著有利于提高教育效果的方向轉變,然后檢驗假設,并由此揭示教育活動規律的綜合性研究活動。界定根據一定的理論假設,有計劃地控制教育活動的某些因素,以引117教育實驗法的步驟形成實驗假說界定實驗變量選擇實驗模式確定實驗對象制定實驗方案實施實驗評價實驗結果教育實驗法的步驟形成實驗假說118界定實驗變量確定和分解應變量選擇和設計自變量確定需要控制的干擾變量界定實驗變量確定和分解應變量119選擇實驗模式單因素設計(1)單組單因素前后測實驗(2)單因素隨機實驗(3)單因素隨機匹配實驗(4)協方差設計兩因素設計選擇實驗模式單因素設計120案例研究盧仲衡的自學輔導法實驗樣例學習(個數,變異性、呈現方式)數學學習不良的個案研究案例研究盧仲衡的自學輔導法實驗121個案研究問題提出方法(1)被試選擇(2)實驗材料(3)實驗程序:基線、處理、概括、維持結果分析與討論舉例:認知策略訓練對學習不良學生應用題解決成績的影響個案研究問題提出122被試6個學生15-19歲被選擇于LD群體中。總IQ在85-115(WISC-R,1975,Wais,1955)。所有6個學生還滿足另外幾個條件。WISC-R或WAIS的算術子測試低于平均數的1個標準差。閱讀水平至少4年級水平。此外,每個被試完成10個隨機的2步數學應用題40分,或低于40分。被試6個學生15-19歲被選擇于LD群體中。總IQ在85-1123材料材料包括策略的掛圖(圖2)和19個測試(2步應用題)、1個測試(三步應用題)、練習題(每個類型),記錄測試分數和時間的圖形。測試問題從220題的2步應用題和50題的3步應用題隨機選出。10個2步問題組成被試選擇測試和每個因變量測試(在基線、處理、維持和重新訓練階段)。概括測驗包括10個3步問題。項目不返回試題庫。每個測量中,問題的次序是隨機的。在策略獲得和策略運用練習階段,應用題的次序也是隨機的。材料材料包括策略的掛圖(圖2)和19個測試(2步應用題)、1124程序在課堂教學中接受策略訓練。策略訓練者是研究者之一。教學和測試都在課堂上。多基線設計的實驗條件包括基線、處理、概括和保持、重新訓練。程序在課堂教學中接受策略訓練。策略訓練者是研究者之一。教學和125基線在基線期間,記錄測試的時間和分數。基線數據繼續收集,直到穩定的基線是明顯的(對每一組的第一個學生)。當繼續收集剩下來的兩個學生的基線數據時,給第一個學生干預。當上升趨勢明顯,至少10個項目中至少7個正確反應的成績穩定時,策略訓練給第二個被試。在這個階段,繼續收集每組第三個被試的基線數據。對第三個被試來說,相似的程序。基線在基線期間,記錄測試的時間和分數。基線數據繼續收集,直到126處理
處理包括策略獲得階段、策略運用練習階段和測試階段,在測試階段期間收集因變量測量數據。
處理處理包括策略獲得階段、策略運用練習階段和測試階段,在測127策略獲得階段策略獲得訓練進行了3課時(每課時50分鐘)。訓練中使用的步驟包括訓練策略模型(Deschler,1981)中的6步獲得步驟。獲得步驟包括:(1)分析現在的學習習慣;(2)描述新策略;(3)模仿新策略;(4)復述新策略(5)學生練習;(6)在獲得階段的正確反饋。圖2呈現了訓練程序總結。策略獲得階段策略獲得訓練進行了3課時(每課時50分鐘)。訓練1288步數學應用題的問題解決策略:
大聲閱讀問題:教師大聲讀題,解釋學生不懂的詞語。大聲復述陳述重要信息(特別是數字);(2)大聲重復問題部分;利用自我提問技術:題目問什么?我正在尋找什么?轉化:畫一個圖形陳述問題:大聲說“我知道了…,我想求…”。強調題目中的重要信息。8步數學應用題的問題解決策略:大聲閱讀問題:教師大聲讀題,129假設:大聲說“如果我…,那么…”,“需要多少步驟”寫下運算符號估計:寫下估計的答案計算自我檢查:(1)參照問題,檢查每一步,決定運算符號的正確性;(2)檢查計算的正確性;(3)運用自我提問技術問自己是否理解答案的意思。假設:大聲說“如果我…,那么…”,“需要多少步驟”寫下運算符130策略獲得訓練概要(圖2)第一階段(1)討論基線分數、被試解決問題的方法、界定提高多少作為教學的目標(2)描述訓練的形式(3)向被試閱讀策略,回答被試提出的問題(4)使用樣例模仿策略的使用(5)使用隨機選擇的問題模仿策略的使用(6)當被試解決問題時,提供正確的反饋(7)當被試復述策略時,提供正確的反饋策略獲得訓練概要(圖2)第一階段131第二階段(1)復習策略步驟(2)被試一邊說步驟,一邊解決問題(3)監控被試策略的復述(4)重復(2)(5)重復(3)第二階段132第三階段(1)監控被試的策略復述(2)當被試一邊說步驟,一邊解決問題時,提供正確的反饋。(3)重復(1)(4)重復(2)(5)策略步驟言語表達的測試。第三階段133圖3數學應用題解決的步驟1、大聲閱讀問題2、復述(1)重要信息;(2)大聲重復問題部分;(3)題目問什么?我正在尋找什么?3、轉化:畫一個圖形4、陳述問題:我知道了…,我想求…。圖3數學應用題解決的步驟1、大聲閱讀問題1345、假設:(1)如果我…,那么…,(2)需要多少步驟?6、估計:寫下估計答案7、計算8、自我檢查:(1)檢查每一步運算符號;(2)檢查計算;(3)理解答案的意思。5、假設:135策略練習階段要求被試在策略步驟的言語表達達到100%的正確標準(圖3列舉了要求記憶的信息)。達到這個目標后,策略運用階段開始,在測試前一天,練習階段開始。包括策略步驟的言語表達和使用策略練習解決數學應用題。在練習期間,列出步驟的圖形可以得到。及時的正確反饋被提供。如果學生在2個或者3個測試中,保持7分或者更好成績,練習階段結束。如果學生分數低于7,練習階段恢復。策略練習階段要求被試在策略步驟的言語表達達到100%的正確標136測試階段測試階段收集因變量。每個測試包含10個2步數學應用題,使用與基線條件下相同的程序。此外,提示學生使用策略。不能得到圖3。測試時間被記錄。沒有完成的測試第二天完成。測試分數測試完成后告訴被試。數據包括每個測試正確的數目,完成每個測試的時間,收集這些數據作圖。成績提高的標準是在連續4次測試中至少都正確7題。通常,70%只是一個平均水平。在連續四個測試中都高于7個的維持成績表明成績的可接受性。
測試階段測試階段收集因變量。每個測試包含10個2步數學應用題137概括在最后一個處理測試的第二天,一個包含10個題目的3步數學應用題決定策略是否概括到更復雜的數學應用題中去了。5條正確作為作為可接受的標準。
概括在最后一個處理測試的第二天,一個包含10個題目的3步數學138維持概括測試2周后,一個包含10個2步數學應用題的測試,決定維持的水平。如果學生不能完成至少7個正確回答,被試被重新訓練到策略記憶達到100%的水平,提供練習階段,重新測試。當在一個測試中達到至少7個的正確率,實驗結束。為了考察更大的維持水平,3個月以后重新測試2步數學應用題。維持概括測試2周后,一個包含10個2步數學應用題的測試,決定139結果結果140教育科學研究方法課件141內容分析法界定主要途徑案例研究內容分析法界定142界定是對教育文獻的內容作客觀而系統的量化分析,并加以描述,從而對相關的教育現象作出事實判斷的研究方法界定是對教育文獻的內容作客觀而系統的量化分析,并加以描述,從143主要途徑(P96)現狀分析趨勢分析比較分析意向分析主要途徑(P96)現狀分析144案例研究口語報告分析法案例研究口語報告分析法145質的研究--口語報告分析法質的研究--口語報告分析法146教育科學研究方法課件147問題設計問題設計148大聲思維與口語報告記錄大聲思維與口語報告記錄149教育科學研究方法課件150教育科學研究方法課件151教育科學研究方法課件152教育科學研究方法課件153轉譯轉譯154教育科學研究方法課件155教育科學研究方法課件156教育科學研究方法課件157教育科學研究方法課件158教育科學研究方法課件159教育科學研究方法課件160教育科學研究方法課件161數據分析數據分析162教育科學研究方法課件163教育科學研究方法課件164一、口語報告練習題1、如圖,已知在四邊形ABCD中,AB=CD,AD=BC,點E在BC上,點F在AD上,AF=CE,EF與對角線BD相交于點O,試說明EF、BD互相平分。一、口語報告練習題1、如圖,已知在四邊形ABCD中,AB=C1652、已知ab≠0,求的值。2、已知ab≠0,求的值。166二、錄音題在△ABC中,∠B=∠C,AD⊥BC,垂足為D,E,F分別是AB,AC邊的中點,連結DE,FD,求證:四邊形AEDF是菱形二、錄音題在△ABC中,∠B=∠C,AD⊥BC,垂足為D,E167錄音題
在△ABC中,∠B=∠C,AD⊥BC,垂足為D,E,F分別是AB,AC邊的中點,連結DE,FD,求證:四邊形AEDF是菱形解:∵AD⊥BC∴ABD和ADC是直角三角形∵E、F分別是AB、AC的中點∴DE=AE,DF=AF∵∠B=∠C∴AB=AC∴AE=AF∴DE=DF=AF=AE∴四邊形AEDF是菱形
錄音題在△ABC中,∠B=∠C,AD⊥BC,垂足為168優差生解決幾何問題的策略比較研究優差生解決幾何問題的策略比較研究169序號解題步驟編碼注解1E、F是AB、AC的中點2AE=BEB3AF=CFB4從∠B,∠D證明等腰△,兩邊相等B∠D應改為∠C(口誤)5AD⊥BC,垂足為D6∠ADC=90°B7要求AEDF是菱形,A8先證明是平行四邊形,A9再證明是菱形A10AD⊥BC序號解題步驟編碼注解1E、F是AB、AC的中點2AE=BEB17011△ABD和△ADC是直角三角形B12E、F分別是AB、AC的中點13所以,它們相等D指代模糊14整個△ABC是等腰△15那么等邊△D16它又是中點D17所以DF=CEDCE應改為AE(口誤)18同理BE=DFD19那么四邊形AEDF四邊相等D20那么直接可以證明是菱形B11△ABD和△ADC是直角三角形B12E、F分別是AB、A1711先證明AEDF是平行四邊形A2∵∠B=∠C3∴△ABC是等腰△B4E、F分別是AC、AC的中點5∴AE=AFB6AE=AF7AE=AF8作輔助線,E連接FB9△AEF是等腰△B10∴∠AEF=∠AFEB11∴∠DEF=∠DFED12那么,△DEF也是等腰△B13AF=EF=DE=AED14∴四邊形AEDF是菱形B1先證明AEDF是平行四邊形A2∵∠B=∠C3∴△ABC是等172第五章教育研究的質性方法訪談調查法敘事研究法第五章教育研究的質性方法訪談調查法173訪談調查法界定特點步驟案例研究訪談調查法界定174界定研究者通過與被調查者面對面進行交談,以口頭問答的形式來了解某人、某事、某種行為態度和教育現象的一種調查方法。界定研究者通過與被調查者面對面進行交談,以口頭問答的形式來了175特點調查過程靈活深入獲取信息完整真實適用范圍更為廣泛特點調查過程靈活深入176步驟確定調查方式(結構式?)做好訪談準備調控訪談過程整理訪談資料步驟確定調查方式(結構式?)177案例學習陳向明:《王小剛為什么不上學了--一位輟學生的個案調查》,《教育研究與實驗》,1996,1.案例學習陳向明:《王小剛為什么不上學了--一位輟學生的個案調178敘事研究方法界定特點步驟案例研究敘事研究方法界定179界定就是以敘述故事的方式來描述人們的經驗、行為和生活方式,通過所敘述的故事來探究經驗、行為的意義,及其蘊涵的思想和哲理。界定就是以敘述故事的方式來描述人們的經驗、行為和生活方式,通180特點以質性研究方法為工具以教育中的故事為對象教育實踐者成為研究主體形成認識時采用歸納的方式特點以質性研究方法為工具181步驟確定研究問題選擇研究對象進入研究現場進行觀察訪談整理分析資料撰寫研究報告步驟確定研究問題182案例研究一葉少燕,《我的教育故事:情感還是方法》,中國教育報,2003,1,21案例研究一葉少燕,《我的教育故事:情感還是方法》,中國教育報183案例研究二肖正德、李長吉:《山村小學青年教師需要的敘述研究》,教育理論與實踐,2003,10案例研究二肖正德、李長吉:《山村小學青年教師需要的敘述研究》184教育科學研究方法揚州大學教育科學學院郭兆明guozhaom@教育科學研究方法185教育科學研究方法教育研究的過程(第三編)教育研究方法的類型(第二編)教育科學研究方法教育研究的過程(第三編)186教育研究的過程(第三編)課題的選擇(第八章)研究方案的設計(第九章)資料的整理與成果的表述(第十章)教育研究的過程(第三編)課題的選擇(第八章)187第八章研究課題的選擇發現研究問題檢索相關文獻確立研究課題第八章研究課題的選擇發現研究問題188發現研究問題實際需要前人的研究發現研究問題實際需要189實際需要(討論)數學(閱讀)學習不良學生的認知特點及其干預研究盧仲衡的自學輔導實驗法顧冷沅青浦數學教學改革布盧姆的教學評價的新突破80年代以來師范生素質的發展趨勢研究高職院校學生職業性向測試分析研究實際需要(討論)數學(閱讀)學習不良學生的認知特點及其干預研190前人的研究“一步評價”技術研究樣例學習的研究(1)單個樣例的研究(子目標,無具體目標)(2)多個樣例的研究(樣例個數、樣例呈現方式)(3)樣例學習與問題解決的比較前人的研究“一步評價”技術研究191檢索相關文獻文獻檢索在教育科研中的作用教育文獻的種類及主要分布文獻檢索的過程和主要方法檢索相關文獻文獻檢索在教育科研中的作用192文獻檢索在教育科研中的作用避免重復勞動,提高科學研究的效益做好文獻綜述文獻檢索在教育科研中的作用避免重復勞動,提高科學研究的效益193教育文獻的種類及主要分布書籍報刊網絡媒體(中國知網,CNKI)教育文獻的種類及主要分布書籍194文獻檢索的過程和方法過程(主題、關鍵詞、作者、來源)方法(按時間查、按照引文查)文獻檢索的過程和方法過程(主題、關鍵詞、作者、來源)195確立研究課題確立研究課題的思維策略論證研究課題的主要問題確立研究課題確立研究課題的思維策略196確立研究課題的思維策略分析課題的研究價值(結合項目申報)(1)理論價值(2)實踐價值考察研究人員的主觀條件考慮研究的客觀條件
確立研究課題的思維策略分析課題的研究價值(結合項目申報)197在選擇課題時,要盡量避免:(1)范圍太大,無從下手;(2)在現有條件下,難度較大,資料缺乏;(3)屬于經驗感想之談,而不是科研題目。在選擇課題時,要盡量避免:(1)范圍太大,無從下手;198論證研究課題的主要問題研究問題的性質(理論研究、應用研究)研究的目的和意義(研究價值)國內外相關研究現狀、可能有所突破之處。研究的可能性、基本條件研究的步驟及成果形式論證研究課題的主要問題研究問題的性質(理論研究、應用研究)199第九章教育研究方案的設計制定研究方案的主要注意事項:(1)陳述研究課題(2)論述研究的目的和意義(3)闡述研究假設和依據(4)闡述研究內容(5)確定研究對象(6)選擇抽樣方法(7)選擇研究方法和工具(8)制定行動計劃第九章教育研究方案的設計制定研究方案的主要注意事項:200第十章教育研究的資料整理與成果表述研究成果的的基本格式(1)題目(20字以內)(2)摘要和關鍵詞(3)主體【引言、方法、結果、討論(定量研究)】(4)參考文獻第十章教育研究的資料整理與成果表述研究成果的的基本格式201第二編教育研究方法的類型教育研究的實證方法(第四章)1、問卷調查法2、教育測量法3、教育實驗法4、內容分析法教育研究的質性方法(第五章)1、訪談調查法2、敘事研究法第二編教育研究方法的類型教育研究的實證方法(第四章)202第四章教育研究的實證方法問卷調查法教育測量法教育實驗法內容分析法第四章教育研究的實證方法問卷調查法203問卷調查法界定特點步驟案例研究【問卷舉例(SCL90,職業興趣、16PF,開發者問卷)】問卷調查法界定204界定是研究者用嚴格設計的問卷,通過書面語言與被調查者進行交流,來收集研究對象關于教育問題或教育現象的信息和資料的方法。界定是研究者用嚴格設計的問卷,通過書面語言與被調查者進行交流205特點調查工具標準化調查過程標準化調查結果標準化研究效率高特點調查工具標準化206步驟設計前的探索設計問卷的結構設計問卷初稿試用和修改問卷發放和回收問卷(回收率應不低于70%)分析調查結果步驟設計前的探索207設計問卷初稿選擇調查類型選擇問題形式斟酌問題表述設計規范答案關注問題數量(時間控制)合理排列問題設計問卷初稿選擇調查類型208選擇調查類型就調查內容而言,選擇綜合調查或專題調查。就調查目的而言,選擇常模調查或比較調查就調查范圍而言,選擇普遍調查或抽樣調查選擇調查類型就調查內容而言,選擇綜合調查或專題調查。209選擇問題形式填空式是否式多項單選式多項限選式表格式(答題紙)或量表式(P83)排序式(P83)選擇問題形式填空式210案例研究中小學生家庭作業心理現狀的調查分析上海市中小學生家庭教育現狀的調查分析五年制師范生心理健康狀況SCL-90的調查分析小學數學作業批改的現狀的調查分析中小學生閑暇生活狀況的調查分析物理教師課堂教學行為的調查分析案例研究中小學生家庭作業心理現狀的調查分析211教育測量法界定特點步驟個案研究教育測量法界定212界定教育測量法:根據某種規則,以數量化的形式描述教育現象的某種屬性。界定教育測量法:根據某種規則,以數量化的形式描述教育現象的某213特點以測驗為工具對研究對象進行測試,從而獲得數量化的結果,并通過進一步分析獲得相關結論。例如,了解學生的知識和能力發展情況。特點以測驗為工具對研究對象進行測試,從而獲得數量化的結果,并214編制測驗的步驟確定測驗目的確定測驗內容確定測驗形式篩選題目(難度、區分度)標準化過程鑒定測驗(信度、效度)編寫測驗指導書編制測驗的步驟確定測驗目的215項目分析
第一單元項目難度第二單元項目區分度項目分析第一單元項目難度216第一單元項目難度
項目難度的定義
項目難度的計算方法難度水平的確定
第一單元項目難度項目難度的定義217項目難度的定義
項目難度(difficulty)是指題目的難度。【注】(1)在非能力測驗(如人格測驗)中,類似的指標是“通俗性”,即取自相同總體的樣本中,能在答案方向上回答該題的人數,其計算方法與難度相同。(2)難度的指標通常以通過率表示,以答對(通過)該題的人數百分比來表示:
P=(R/N)×100%,P表示項目難度,N表示全體被試數,R為答對(通過)該項目的人數。從公式可以發現:難度越大,P值越小。
項目難度的定義項目難度(difficulty)是指題目的難218計算方法
二分法計分項目非二分記分的項目計算方法二分法計分項目219二分法計分項目
心理測驗的項目大多為選擇題,通過計1分,錯誤計0分。1、當被試較少時,對這類題目可以直接使用公式P=(R/N)×100%計算難度。2、當被試較多時,則可根據測驗總成績將被試分成三組:分數最高的27%被試分為高分組,分數最低27%被試為低分組,中間46%的被試為中間組。分別計算高分組和低分組的通過率,以兩組通過率的平均值作為每一題的難度。其公式為:
P=(PH+PL)/2式中P表示難度,PH和PL分別代表高分組和低分組通過率。二分法計分項目心理測驗的項目大多為選擇題,通過計1分,錯誤220非二分記分的項目
當測驗項目為問答題或不能用二分法記分的形式時,一般用下面的公式計算難度。非二分記分的項目當測驗項目為問答題或不能用二分法記分的形式221難度水平的確定
項目難度測驗的難度
難度水平的確定項目難度222項目難度
進行難度分析的主要目的是為了篩選項目,項目的難度多高合適,取決于測驗的目的、性質以及項目的形式。項目難度進行難度分析的主要目的是為了篩選項目,項目的難度多223測驗目的
準確測量個體的差異。在選擇題目時,最好使試題的平均難度接近0.50,而各題難度在0.50±0.20之間。注:(1)若P=0或1時;(2)P=0.5時,舉一個極端的例子,假如某測驗各試題間的相關系數均為1,難度均為0.50,那么就有可能使50%的被試答對所有的題目得滿分;另外50%的被試無法通過任何試題得0分)測驗目的準確測量個體的差異。在選擇題目時,最好使試題的平224測驗的性質
當測驗用于選拔或診斷時,應該比較多地選擇難度值接近錄取率的項目。(1)若測驗是要選拔少數最優秀的被試,測驗就應該有相當高的難度,P值就應該小。例如,如果錄取率為20%,那么題目難度最好確定為20%,使得恰好20%的優秀被試通過;(2)假如測驗是要診斷出少數較差的被試,則測驗難度應該小,P值應該高,使得只有少數被試不能通過。測驗的性質當測驗用于選拔或診斷時,應該比較多地選擇難度值接225測驗的形式
對于選擇題來說,P值一般應該大于概率水平。例如,對于是非題,其難度值應該為0.75最為合適;而對于四選一的題目,其難度值約為0.63時最為適宜。
測驗的形式對于選擇題來說,P值一般應該大于概率水平。例如,226測驗的難度
通過考察測驗分數的頻數分布,可以對測驗的難度作出直觀檢驗(常態分布,偏態分布:正偏態分布、負偏態分布)。(1)如果被試的取樣具有代表性,對于中等難度的測驗,其測驗總分應該接近常態分布。如果得分多數偏高或偏低,則分別為“負偏態分布”和“正偏態分布”。(2)正偏態分布,即大多數得分集中在低端,說明編制的測驗對于所要研究的樣本團體來說偏難,因此,必須增加足夠數量的較容易的項目;(3)負偏態分布,即大多數得分集中在高分端,說明測驗過容易,必須增加足夠數量的有高難度的項目。測驗的難度通過考察測驗分數的頻數分布,可以對測驗的難度作出227第二單元項目區分度
項目區分度的定義項目區分度的計算方法區分度與難度的關系
第二單元項目區分度項目區分度的定義228項目區分度的定義
項目區分度(itemdiscrimination),也叫鑒別力,是指測驗項目對被試的心理特性的區分能力。
項目區分度的定義項目區分度(itemdiscrimina229項目區分度的計算方法
鑒別指數相關法
項目區分度的計算方法鑒別指數230鑒別指數1.按測驗總分高低排列答卷;2.確定高分組與低分組,每一組取答卷總數的27%;3.分別計算高分組與低分組在該項目上的通過率或得分率。4.按下列公式估計出項目的鑒別指數:D=PH-PL,式中D為鑒別指數,PH為高分組在該項目上的通過率或得分率,PL為低分組在該項目上的通過率或得分率。【注】高分組若在該測驗上的得分率高于低分組,則D>0,D越大,說明該項目區分兩種不同水平的程度越高。若D<0,則反映高水平組在該項目上的得分率反而低于低水平組,說明有問題。鑒別指數1.按測驗總分高低排列答卷;2311965年,美國測驗專家(L.Ebel)根據長期的經驗提出用鑒別指數評價項目性能的標準,鑒別指數D項目評價0.40以上0.30-0.390.20-0.290.19以下很好良好,修改會更佳尚可,但需修改差,必須淘汰1965年,美國測驗專家(L.Ebel)根據長期的經驗提出用232相關法
計算區分度最常用的方法是相關法,即以某一項目分數與效標成績或測驗總分的相關作為該項目區分度的指標。相關越高,表明項目越具有區分的功能。相關法計算區分度最常用的方法是相關法,即以某一項目分數與效233區分度與難度的關系
難度和區分度是相對的,是針對一定團體而言的,絕對的難度和區分度是不存在的。一般來說,較難的項目對高水平的被試區分度高,較易的項目對水平低的被試區分度高,中等難度的項目對中等水平的被試區分度高。由于人的大多數心理特性呈常態分布,所以項目難度的分布也以常態分布好,即特別難與特別易的項目少一些,接近中等的項目多一些,而所有項目的平均難度為0.50,這樣不僅能夠保證多數項目具有較高的區分度,而且可以保證整個測驗對被試具有較高的區分能力。
區分度與難度的關系難度和區分度是相對的,是針對一定團體而言234測驗的信度
信度的概念信度評估的方法測驗的信度信度的概念235信度的概念
信度的定義信度(reliability)指的是測量結果的穩定性程度。注:(1)若能用統一測量工具反復測量某人的同一心理特質,則其多次測量的結果間的一致性程度就叫信度。有時也叫測量的可靠性。(2)例如:比較鋼尺與具有彈性的皮尺測量長度的信度。信度的概念信度的定義236第二單元信度評估的方法
(1)重測信度(2)復本信度(3)內部一致性系數(4)評分者信度
第二單元信度評估的方法(1)重測信度237重測信度
含義和計算使用的前提條件優點、缺點注意點使用重測信度的量表舉例
重測信度含義和計算238定義和計算
重測信度(1)含義:是指同一量表對同一組被試兩次所得結果的一致性程度。(2)計算:大小等于同一組被試在兩次測驗上所得分數的皮爾遜積差相關系數。注:(1)此測驗主要測量測驗跨時間的穩定性,所以,又稱穩定性系數。(2)當信度較大時,說明前后兩次測量的結果比較一致,測量工具比較穩定,被試的心理特質受被試狀態和環境變化的影響較小。
定義和計算重測信度239使用的前提條件(1)所測量的心理特性必須是穩定的。例如,成人的人格測驗就可以;但兒童的成就測驗就不行(例如,剛入學兒童的識字量)。(2)遺忘和練習的效果基本上互相抵消。智力測驗的間隔時間一般在6個月左右。(3)在兩次施測的間隔時期內,被試的心理特質方面沒有獲得更多的學習和訓練。使用的前提條件(1)所測量的心理特性必須是穩定的。例如,成240優、缺點優點:能夠提供測驗是否隨時間而變異的資料,可作為被試將來行為表現的依據。缺點:易受練習和記憶的影響。(1)如果兩次施測間隔的時間太短,則記憶猶新,練習的影響較大;(2)如果間隔的時間太長,則身心發展與學習經驗的積累等足以改變分數的意義,而使得相關減低。最適宜的時距隨測驗的目的、性質和被試特點而異,一般是兩周到四周為宜,時間間隔最好不超過六個月。優、缺點優點:能夠提供測驗是否隨時間而變異的資料,可作為被241注意點:同一量表,隨著第二次測量的時間不同,它可以有不同的重測信度。因此,在報告重測信度時,應說明兩次施測的間隔,以及在此期間被試的有關經歷。例如,《韋氏兒童智力量表手冊》中國修訂版(C-WISC)中,就報告了兩次測驗的時間間隔(2-7周)以及兩次的相關系數(城市:0.59-0.86,農村:0.59-0.81)。注意點:同一量表,隨著第二次測量的時間不同,它可以有不同的242使用重測信度的量表舉例
MMPI:臨床量表在相隔兩周重測,其值在0.58-0.92之間。CPI:加州心理調查表的重測信度各量表分別為0.38-0.77,平均0.66.SB4(斯坦福-比奈量表第四版)瑞文:三個版本的一些重測信度研究結果不一,正常成人為0.80-0.93。
使用重測信度的量表舉例MMPI:臨床量表在相隔兩周重測,其243復本信度
含義與計算使用的前提條件優、缺點注意點使用復本信度的量表舉例
復本信度含義與計算244含義與計算
復本信度(1)含義:指兩個平行的測驗測量同一組被試所得結果的一致性程度。(2)計算:大小等于同一組被試在兩個復本測驗上所得分數的皮爾遜積差相關系數。它是研究測驗跨形式的一致性(等值性)。復本信度的分類:(1)等值性系數(同時);(2)穩定性與等值性系數(不同時)。含義與計算復本信度245等值性系數定義:如果兩個復本測驗是同時連續施測的,則這種復本信度稱為等值性系數。大小:反映兩個復本測驗的題目差別所帶來的變異情況。等值性系數定義:如果兩個復本測驗是同時連續施測的,則這種復本246穩定性與等值性系數定義:如果兩個復本測驗是相距一段時間分兩次施測的,則這種復本信度稱為穩定性與等值性系數。它既考慮了測驗在時間上的穩定性,也考慮了不同題目樣本反應的一致性。大小:與其它信度系數相比,此種復本信度最小,也就是說,穩定性與等值性系數是對信度的最嚴格的檢驗,其值最低。穩定性與等值性系數定義:如果兩個復本測驗是相距一段時間分兩次247使用的前提條件
條件1:構造出兩份或兩份以上真正平行的測驗。注:復本測驗必須在題目內容、數量、形式、難度、區分度、指導語、時限以及所用的例題、公式和測驗等其它方面都相同或相似
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 品牌代理營銷合作合同書
- 特色鄉村旅游民宿集群項目旅游產品創新與特色打造研究報告
- 2025年母嬰用品跨境電商市場品牌競爭力提升與品牌合作模式研究報告
- 公司春節值班活動方案
- 公司答謝晚宴活動方案
- 公司春節期間活動方案
- 公司月餅制作活動方案
- 公司直播大賽策劃方案
- 公司新員工團建策劃方案
- 公司組建樂隊策劃方案
- 2023-2024學年廣西壯族自治區南寧市小學語文六年級期末深度自測試卷詳細參考答案解析
- 國開《學前兒童語言教育活動指導》形考1-4試題及答案
- 海康2023綜合安防工程師認證試題答案HCA
- 濁度儀使用說明書
- GB/T 14404-2011剪板機精度
- GB/T 14294-1993組合式空調機組
- GA 1517-2018金銀珠寶營業場所安全防范要求
- 提高痰留取成功率PDCA課件
- 組合導航與融合導航解析課件
- 伊金霍洛旗事業編招聘考試《行測》歷年真題匯總及答案解析精選V
- 深基坑支護工程驗收表
評論
0/150
提交評論