




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
整理為word格式整理為word格式整理為word格式教育統計和教育測量鎮江市教育局教研室周凱在教育、教學研究中,我們常常要進行評價。在評價過程中,定性是重要的,然而定量同樣是必要的。為了使教育、教學研究深化和精確化,需要在占有科學數據的基礎上,運用科學的手段和方法對數據進行處理,從而得出科學的結論。教育、教學研究中的數據是由測量法產生的,對數據的搜集、整理和分析,對研究結果的解釋,則需要通過統計法來實現。一、教育統計1、教育統計的意義教育統計是運用數理統計的原理和方法研究教育問題。它的主要任務是研究如何整理和分析由教育調查、教育測量所獲得的數字資料,并以此為依據,進行科學推斷,揭示教育現象所蘊含的客觀規律。從應用角度來分,教育統計主要有三方面的內容:描述統計、推斷統計和實驗統計。下面簡介描述和推斷統計的一些內容。2、描述統計的意義及內容我們去看學生的成績計分冊,只看到一個個學生的分數(稱原始數據),這些分數在未經整理之前是零亂的、不系統的,而且數據愈多,愈覺紛亂。因此,需要對統計資料進行繪圖、制表、計算等初步的整理工作,以描述研究對象的統計特性。描述統計就是對已獲得的數據進行整理、概括,顯現其分布特征的統計方法。它的主要內容有:統計表和統計圖、集中量、差異量、相關系數等。2.1統計表和統計圖統計表是用來表達統計指標與被說明事物之間數量關系的表格。舉例如下:表1:某年級某學科某班學生考試成績統計(本卷滿分100分)分數段100~9090~7575~6060~3030以下人數9161484百分率(%)17.631.427.515.77.8本表在統計學中稱為頻數分布表(落在各個小組內的數據的個數叫做頻數,表中各分數段內的人數就是頻數),每一分數段(即分數區間)都有上限和下限,比如區間90~75中,90稱為上限,75稱為下限,而75又是區間75~60的上限。統計時一般包含下限,而不包含上限,但滿分100分這個上限例外。從表1中可以得到如下信息:75~90這一分數段人數最多,有16人;60分(及格)以上有39人;60分以下有12人,其中30分以下4人,需要盡快補差等。上表是將研究的對象按一個標志分類的,稱為單向表。將研究的對象按兩個或兩個以上標志分類的統計表,稱為雙向或多統計表。如,下表就是將學生成績按等第、班級、性別三個標志分類的。整理為word格式整理為word格式整理為word格式表2:某年級學生操行評定表等第一班二班三班合計男女男女男女男女優良中差686258415931510317940683118261331626103合計2218181920186055編制統計表的要求是:(1)表的結構要簡單明了,層次清楚。(2)表的標題要簡明扼要地、確切地反映表的內容,寫在表的上端的中央位置。(3)表的標目有橫、縱標目之分。一般將統計表所要敘述的主要對象放在橫標目上,而將用以敘述的統計指標在縱標目上。(4)表內數據排列要整齊,小數點位置要對齊,缺數據格或無數據格要劃斜線。(5)表的標題、標目或數字有未盡之意的地方,應加腳注說明,表中資料的來源應在底線下加以注明。統計圖是以幾何圖形的形式表達統計資料數量關系的重要工具,它形象直觀,使人看了一目了然,印象深刻,容易記憶。頻率分布表與頻率分布直方圖是統計表和統計圖的一種,由于它在統計工作中的地位相對重要,故著重加以介紹。將一群數據中的每一個數據(或每一組數據)所出現的頻率分布情況列成統計表的形式,就是頻率分布表;對其中的連續性數據還可以繪成統計圖的形式,這就是頻率分布直方圖。以下結合表3的數據來說明編制頻率分布表和頻率分布直方圖的步驟。表3:某年級80名學生數學成績7873687163655853554851545966637168737985877974687463667159555660666372697480605766646472696975758080817570646667676061616267676765656570768283909776777770707165(1)求極差:最大值-最小伙值=97-48=49(2)決定組數與組距:在決定組數時,必須考慮到數據整理的目的,一方面在于簡化資料,以利于顯示其規律性;另一方面又必須適當保持資料的細節,以免失之過粗。若分組時組數過多,不僅計算麻煩,而且由于每組數據甚少,不易反映整個分布的規律;反之,組數過少,由于失之過粗,誤差較大,也不能反映資料的特征。一般分組的數目視數據的多少而定,大體上,50個左右的數據分5~8組,100個左右的數據分8~12組,100個以上的數據分12~16組。本例有80個數據,分10組為宜。整理為word格式整理為word格式整理為word格式組數確定之后,可由下列式子計算組距:組距=極差/組數=49/10=4.9≈5(3)決定分點:將數據按照5分的距離分組,分成:48~5353~5858~6363~6868~7373~7878~8383~8888~9393~98這時我們看到,有些數據(如48、53、58)本身就是分點,不好決定它們究竟應該屬于哪一組。為了避免出現這種情況,可以使分點比數據多取一位小數,并且把第1小組的起點稍微減小一點。例如,可將第1小組的起點定為47.5,這樣分成的10個小組是:47.5~52.552.5~57.557.5~62.562.5~67.567.5~72.572.5~77.577.5~82.582.5~87.587.5~92.597.5~97.5(4)列頻率分布表:分組頻數頻率47.5~52.520.025052.5~57.560.075057.5~62.590.112562.5~67.5220.275067.5~72.5160.200072.5~77.5120.150077.5~82.580.100082.5~87.530.037587.5~92.510.012592.5~97.510.0125合計801.0000(5)畫頻率分布直方圖:為了將頻率分布表中的結果直觀形象地顯示出來,需畫出頻率分面直方圖:↑頻率│組距│┌──┐││││││││├──┐│││││││├──┐││││││┌──┤││├──┐││││││││┌──┤│││││整理為word格式整理為word格式整理為word格式│││││││├──┐│┌──┤││││││├─┬─┐└─┴──┴──┴──┴──┴──┴──┴──┴──┴─┴─┴──→47.552.557.562.567.572.577.582.587.592.597.5成績80名學生數學成績分布直方圖通過對一組數據的統計分析,繪制其頻率分布直方圖,就可以看出其是否遵循正態分布或偏正態分布。2.2集中量集中量是描述數據集中趨勢的量,它主要有三種:算術平均數,中位數,眾數。(1)算術平均數學科考試后所計算的平均分,就屬于算術平均數。若頻數較小,如計算班級平均分,則方法一般是:所有被試分數的和除以被試人數。即=由于大家都很熟悉,舉例從略。當觀察數據中出現相同值的時候,比如,有f個χi,i=1,2,……,k,則可用下列公式計算平均數:=f,其中f+f+…+f=n。這個平均數稱加權平均數,f,f,…,f叫做權。例1某校在教改實驗中采用五級計分考核,實驗班與對照班的數學成績如下:實驗班:等第優秀良好中等及格不及格人數277240對照班:等第優秀良好中等及格不及格人數12161121現規定優秀為90分,良好為80分,中等為70分,及格為60分,不及格為50分,問哪個班的成績較好?解:實驗班=(90×27+80×7+70×2+60×4)≈84(分)對照班=(90×12+80×16+70×11+60×2+50×1)≈79(分)經比較,實驗班的成績好。又=f=+x+…+x整理為word格式整理為word格式整理為word格式設p=(i=1,2,…,k),則=x這是加權平均數計算公式的另一種形式,其中p(i=1,2,…,k)叫做權重,p+p+…+p=1。例2某校規定學生的體育學期成績由三部分組成:早鍛煉及體育課外活動表現占學期成績的10%,體育理論測試占30%,體育技能測試占60%。一學生上述三項成績依次為90分、85分、82分,求該生這學期的體育成績。解該生這學期體育成績=90×10%+85×30%+82×60%≈84(分)。(2)中位數在一次家庭年收入調查中,抽查了15個家庭的年收入(單位:萬元),將其從低到高排列,依次是:0.91.01.01.11.11.21.21.31.41.41.51.51.61.718.1上述數據的平均數為2.4(萬元),比被抽查的前14個家庭的年收入高出許多,顯然不能反映這組數據的集中趨勢(前14個數據的大小比較接近,最后1個數據與它們的差異較大),這時,如果用最中間的數據1.3(萬元)來描述這組數據,則可不受個別變動較大數據的影響。將一組數據按大小依次排列,處在最中間位置的一個數據(或最中間兩個數據的平均數)叫做這組數據的中位數,如,寫出3,5,1,9,8的中位數:這里共5個數,從大到小排列為9,8,5,3,1,排列后處在最中間的數是5,5就是這組數據的中位數;寫出3,5,1,9,8,6的中位數:這里共6個數,從大到小排列為9,8,6,5,3,1,排列后處在最中間的兩個數的平均數為5.5,5.5就是這組數據的中位數。中位數的性質是:數組中大于中位數和小于中位數的數據的個數相等。表4為某年級某學科某班學生考試成績統計:分數段90~10080~9070~8060~7050~6040~5030~4020~3010~20人數51712842211累計數52234424648525354組中值958575655545352515求表4所示考試成績的平均分和中位數。說明:區間上限和下限的平均數稱為這個區間的組中值,它是這一區間所有分數的代表,即這個區間內的所有分數都用組中值代替。用“加權法”求平均分:先求出每一組的組中值與本組人數的積,再求這些積的和,最后用這個和除以各組人數的和,所得商就是平均分。解所求平均分=(95×5+85×17+75×12+…+15×1)÷54≈69.6(分)用“插值法”求中位數:由累計數知,按從高到低的順序,數到80分有22人,與總人數之半差5人。中位數在70─80之間,本區間有12人,假設等距排列,相鄰兩人分數差是10÷12=0.833分。由此中位數=80-0.833×5=75.8。列綜合式:中位數=80-×(54÷2-22)=75.8(分)。整理為word格式整理為word格式整理為word格式根據中位數和平均分的大小可以粗略估計分數的分布。注意到只有一半學生的分數低于中位數,當平均分69.6低于中位數75.8時,說明低分很“低”。(3)眾數一組數據中,出現次數最多的那個數值就是眾數。如:數組3,4,5,3,6,5,4,5中,出現次數最多的數值是5,稱這組數據的眾數是5。在象表4這樣的頻數分布表中,粗略估計眾數的方法是:頻數(人數)最多一組的組中值。表4中的眾數是85。眾數也可以計算,但比較繁瑣且用處不大(當數據接近正態分布時,常用皮爾遜的經驗正式來估計眾數),就不介紹了。計算平均數時,所有的數據都參加運算,所以它能較為充分地利用數據所提供的信息,且有良好的統計性質,如,用樣本平均數估計總體平均數,但它容易受異常值的影響。中位數的優點是計算簡單,受異常值影響較小,但它不能充分利用數據的信息。當一組數據中,某些數據多次重復出現時,眾數往往是我們尤為關心的一種統計量,但抽樣方法不同對其影響較大。2.3差異量有兩個搬運隊,職工的年齡分別如下(單位:歲):甲隊:22,26,28,31,34,37,39乙隊:15,18,27,29,37,43,48兩隊人數相等,且平均年齡都是31歲,但顯然乙隊年齡差距大。為了定量地描述這一特征,引入差異量。表示一組數據離散程度的量稱為差異量。它是描述數據分布狀況的另一重要特征量。差異量越大,表示數據分布的范圍越廣,越不整齊。介紹兩種差異量:標準差和差異系數。(1)標準差數據與平均數的差稱為離差,離差平方的平均數稱為方差,方差的算術平方根稱為標準差,記著σ。如,甲隊職工年齡離差分別是-9,-5,-3,0,3,6,8,(依次將年齡減31),則方差是[(-9)+(-5)+(-3)+0+3+6+8]÷7=32,標準差σ==5.66(歲)。標準差和平均數一樣,都有單位。根據標準差的定義,其計算公式是σ=,其中表示平均數。根據標準差的計算公式,可求得乙隊年齡的標準差是11.4歲。由于σ甲<σ乙,則乙隊職工年齡的離散程度較大。計算一組數據的平均數和標準差可以借助于科學計算器完成。(2)差異系數標準差可以用來比較兩組數據之間離散程度的大小,但有兩種情況這種比較毫無意義:一是兩組數據的測量單位不同;二是兩組數據的測量單位雖然相同,但它們的平均數相差較大。對于這兩種情況可利用相對差異量整理為word格式整理為word格式整理為word格式(稱為差異系數)進行比較。差異系數是標準差與平均數的百分比,用符號CV表示。差異系數的意義在于它是以平均數為單位來衡量差異程度,差異系數大,表明離散程度大。常用于:①比較同一團體中不同單位資料的差異程度。例4某班學生平均身高162.5cm,標準差為5.8cm;平均體重50.1kg,標準差為3.64kg。試問身高與體重哪個離散程度大?解由于單位不同,不可以直接比較兩個標準差,現比較它們的差異系數:CV高=×100%≈3.57%,CV重=×100%≈7.27%。由此可知:雖然體重的標準差小,但實際離散程度較大。②比較單位相同而平均數相差較大的不同團體資料的差異程度。例5某一測驗,初三年級的平均分是50分,標準差是4.12;高一年級的平均分是80分,標準差是6.04。問這兩個年級的測驗分數中哪一個離散程度大?解:由于平均數相差較大,不可以直接比較兩個標準差,現比較它們的差異系數:CV初三=×100%≈8.24%,CV高一=×100%≈7.55%。顯然初三年級的測驗分數離散程度大。2.4相關系數數學成績好的學生,物理成績也好,但數學成績好的學生,體育成績不一定好,依據這種說法,我們就說數學成績與物理成績相關程度高,數學成績與體育成績相關程度低,甚至不相關。用來描述兩個變量相互之間變化方向及密切程度的數字特征量稱為相關系數,一般用r表示。積差相關系數一般用下面的公式進行計算:r=/σσ表5:10名學生數學與物理成績如下表,計算數學與物理成績的相關系數序號12345678910平均值標準差數學(X)7471726876736770657571.13.42物理(Y)7675717073796571627671.84.96乘積XY56245325511247605548576743554970403057005119.1r==0.83,這說明數學成績與物理成績的相關程度高。從理論上說,相關系數r的值在-1到+1之間,若r為正,則稱這兩個量成正相關;若r為負,則稱這兩個量成負相關;若r接近于零,則稱這兩個量成零相關或不相關。整理為word格式整理為word格式整理為word格式二、教育測量1、教育測量的意義要理解教育測量的意義,首先要了解一般測量的意義。測量的最基本特征是將事物進行區分。區分的過程要按照一定的法則進行,區分的結果要能用數學的方式進行描述。因此,測量是按照一定的法則,用數學方法對事物的屬性進行描述的過程。按此定義,教育測量是按照一定的法則,用數學方法對教育對象的若干屬性進行描述、區分的過程。根據測量的定義,可知測量(包括教育測量)應包含三個要素:①測量的對象---事物的屬性;②測量的工具---某種法則;③測量的結果---某種數學表達形式(很多情況下是用實數表示的)。舉例說明測量的三個要素:測量學生的身高①測量的對象(事物的屬性):學生的身高;②測量的工具(某種法則):赤足免冠、抬頭挺胸等一系列的規定;③測量的結果(數字):××cm(公分)。測量學生的英語聽說水平①測量的對象(事物的屬性):學生的英語聽說水平;②測量的工具(某種法則):用預先編制好的試卷,限定時間準備,朗讀一段文章并回答老師提出的問題等測試規定;③測量的結果(數字):××分。2、教育測量的特點教育測量與一般測量相比,有如下的特點:(1)教育測量一般是間接測量。教育測量檢測的是人的知識、技能、動機、態度、品德等心理屬性,這些都是人的大腦活動的反映,我們無法象測量身高、體重一樣直接測量,而只能根據人的外顯行為間接測量人的心理活動的水平與特點。與此同時,我們只能由樣本成績推斷總體水平,比如測量學生的英語聽說水平,所用的測試試卷中所涉及的詞匯語言只是學生應該掌握的詞匯語言的一部分,根據這一部分的得分去估計和推測學生的總體水平。因此間接測量是教育測量的特點之一。(2)教育測量的度量單位是相對的。教育測量沒有統一的標準,若試卷容易,得分就高,則一分的份量就輕;若試卷較難,得分就低,則一分的份量就重。實際上,就在同一次試驗中,不同題目中的一分份量也不一定一樣。因此教育測量中的度量單位是相對的。(3)教育測量的相對準確性。教育測量的內容往往涉及到人的心理,易受內外條件,比如動機、態度、情緒、健康、睡眠、光線、氣候等的影響,因而教育測量的正確性是整理為word格式整理為word格式整理為word格式相對的。3、教育測量的質量要求教育測量的質量要求一般包括以下幾個方面:(1)效度,即有效程度。可以用數學式子定義效度,但太抽象。現將效度的意義描述如下:測量(包括測驗)都是有一定的目標的,效度刻劃了測量達標程度的高低,是反映測量有效性與準確性的一項指標。舉一反例,用磅秤來測量學生的身高是無效的,這樣的測量效度為零。再舉一例,出這樣一道數學題給小學生解答:3童分9卵,童均幾何?如果要考查學生“等分除法”的掌握情況可能效度極低,因為學生不能正確解答,并不是因為數量關系不清,而是讀不懂題。為了提高測量的效度,在確定測量的工具(如編制試卷)前,要認真擬定測量的目標。關于效度,量化是比較困難的,但一般可以由專家作出定性的判斷。(2)信度,即可信性,指的是測量一致性的程度。一個好的測量工具必須穩定可靠,多次測量結果要保持一致,否則就不可信,比如說用橡皮筋制作的皮尺測量身高,測量結果不可能一致,因而這樣的測量就無信度。理論上,信度可定義為:由學生間確實存在的差異而造成的真實分數的方差σ與實測分數方差σ的比。但實際上,學生的真實分數是不知道的,因此必須尋求估計考試信度的方法。估計信度的主要方法有:①再測法:在條件完全相同的情況下,用同一份試卷對同一批學生考兩次,計算這兩次結果的相關系數,如果相關程度較高,則說明信度較高,反之則信度較低。②等值法:設計兩份內容、題量、格式、難度、區分度、平均分、標準差都相同或相近的測試題,在短的時間內進行兩次測試,計算這兩次結果的相關系數。如果相關程度較高則說明信度較高,反之則信度較低。③折半法:將同一份測試題按奇數題、偶數題分成兩部分,分別計算奇數題、偶數題的總分,再計算它們的相關系數。信度與效度的關系是:無信度的測量一定是無效的測量,比如用橡皮筋制作的皮尺來測量身高,肯定無效;有信度的測量不一定就是有效的測量,比如用磅秤來測量學生的身高,無論測量多少次,結果都一樣,從測量結果的“一致性”考慮,測量是可信的,然而無效。因此,信度是效度的必要條件,而不是充分條件。(3)難度。難度是指測試試題的難易程度。難度一般用大寫字母P表示。在學科測驗中,某題的難度一般用所有被試在該題的平均得分率來表示,即所有被試在該題的平均得分難度=─────────────該題的滿分數表6:計算某次考試試卷中各試題的難度整理為word格式整理為word格式整理為word格式題號1234…本題滿分值20102015…本題平均值197.27.23.6…本題難度P0.950.720.360.24…注意:難度(得分率)總在0到1之間,且數值越大試題越易。(4)區分度。區分度表示測試題目對學生學業水平鑒別的程度,用符號D表示。這個量標志著該測試題鑒別能力的大小。從理論上說,具有良好區分度的題,水平高的學生應得高分,水平低的學生應得低分;如果反過來了,則說明該題區分度低。測試專家將試題的區分度稱為測試是否有效的指示器,它是評價試題質量和篩選試題的主要指標和依據。估計區分度的方法大致有兩種:分組法和相關法。第一種方法:分組法。操作過程如下:第一步,分組:將所有被試按總分順序排列(從高到低,從低到高都可以),然后將這些被試分為三組:①從最高分開始的總人數的27%分為一組,稱為高分組;②從最低分開始的總人數的27%分為一組,稱為低分組;③余下的46%也算一組,不過在下面的計算過程中就不用他們的數據了。第二步,統計:比如說要計算A題的區分度,①計算高分組中A題的得分率,用符號PH表示;②計算低分組中A題的得分率,用符號PL表示。第三步,計算:A題的區分度D=PH-PL有時也用PH和PL的值來估計試題的難度,公式是P=(PH+PL)/2。表7:計算某次考試試卷中各試題的區分度題號1234…高分組Ph0.850.150.850.45…低分組Pl0.780.070.240.55…區分度D0.070.080.61-0.1…估計難度P0.8150.110.5450.5…第1題區分度低,也容易;第2題區分度低,題難;第3題區分性能好,難度適中;第4題得分率雖高,但高分組得分率反而低,因而區分性能極差,屬怪題。由計算公式可知:從理論上說區分度是從-1到+1之間的一個數。難度接近于1(很容易的題)和難度接近于0(很難的題)區分度都低。有資料說,在常模參照性(選拔性)考試中,應該要使D≥0.3,且0.4<D≤0.7為佳,D<0.3的題要淘汰(有意設計的比較容易的保分題除外,但D<0的題要堅決淘汰)。第二種方法:相關法。要計算某題的區分度,只要計算該題實得分與該題分值的相關系數,用此相關系數估計該題的區分度。過去由于計算工具落后,所以計算相關系數很繁,現在借助于電子計算機,無論用分組法還是用相關法計算區分度,都比較方便。三、標準分我省2003年高考將實行“3+大綜合+1”的模式。實行該模式的省份(如廣東省)規定:“整理為word格式整理為word格式整理為word格式(標準分)合成。”在“3+大綜合+1”的高考中使用“標準分”合成考試成績,主要是為了平衡選項“1對于“標準分”這一內容,有如下問題:1.什么是標準分?2.標準分Z分數的計算公式。3.標準分名稱的由來。4.標準分Z分數的應用。5.為什么要將標準分Z分數轉換成T分數,如何轉換?1、標準分是以標準差為單位來表示一個原始分數在正態分布的團體中所處相對位置(偏離平均數的位置)的一種量數。2、標準分Z分數的計算公式:Zi=(x)/σ,i=1,2,…,n,其中為平均分,σ為標準差。由計算公式可知,標準分可正、可負,也可以為零。高于平均分的,其標準分為正;低于平均分的,其標準分為負;等于平均分的,其標準分為零。因此,標準分Z分數可以表明原始分數在團體中所處的位置:Z為正值,則其成績高于一般;Z為負值,則其成績低于一般。3、由標準分Z分數的計算公式可得:=0,σ=1,這樣“標準分Z分數”實際上是將原始分數標準化。這就是“標準分”名詞的由來。注:“標準分Z分數”是差異量,是無名數。4、標準分Z分數的應用:例7某一學生8次數學考試的成績如下表:12345678原始分│88
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論