心理統計學月期末考試指導_第1頁
心理統計學月期末考試指導_第2頁
心理統計學月期末考試指導_第3頁
心理統計學月期末考試指導_第4頁
心理統計學月期末考試指導_第5頁
已閱讀5頁,還剩9頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、0272心理統計學2016年6-7月期末考試指導一、考試說明本課程閉卷考試,滿分100分,考試時間90分鐘。可能的考試題型包括:1、單項選擇題2、判斷題3、簡答題4、計算題5、綜合應用題二、重點復習內容(一) 緒論1、心理學統計學的內容:描述統計、推論統計、實驗設計。其中,描述統計的指標包括數據的集中趨勢,數據的離散趨勢和數據間的相關2、數據的種類按照測量的水平,可以劃分為稱名變量、等級變量、等距變量和比率變量。(1)稱名變量,是指根據事物的某一特征,用來劃分、區別事物的不同種類所形成的變量。這類數碼并無數量和序列的含義,不能進行數量化分析,不能做加減乘除的運算。(2)等級變量,在對事物進行分

2、類過程中,依據事物某種屬性程度的大小排列順序形成的變量。等級變量既無相等單位,也無絕對零,不同組的等級變量間不能進行加減乘除的運算。(3)等距變量,是指在觀測標識事物某一特定屬性時,具有相對參照點、有相等單位的變量。可以進行加減運算,但是由于等距變量的參照點是相對的,即無絕對零點,因此不能進行乘除的運算。例如,測量溫度的。(4)比率變量,是指既有相等單位又有絕對零參照點的變量,如身高、體重、反應時、各種感覺閾值的物理量等。這類變量可以進行加減乘除的運算。(二)統計圖表1、次數分布表:各種次數分布的列表形式和圖示形式。次數分布包括簡單次數分布、分組次數分布、相對次數分布、累積次數分布等。2、編制

3、次數分布表的步驟(1)求全距:從最大值的數據中減去最小值的數據,所得差數就是全距。用符號R表示(2)定組數(3)求組距:指每一組的間距,用符號i表示。(4)定組限:指各組數據在數值上的起點值和終點值。(5)求組中值:各組實際上限數值與實際下限數值的中點數值,即上、下限數值的平均值。(6)歸類劃記:將原始觀測值按照一定的順序逐一歸組。(7)記錄各組次數(f)。(8)核對,抄錄新表。3、連續變量的單位是無限的,例如整數180的實上限和下限分別為179.5和180.5,而測量數據8.35的下實限是8.345。4、累加次數分布表:如果想知道某個數值以下或以上的數據的數目,就要用累加次數。5、次數分布圖

4、:編制次數分布表與繪制次數分布圖,對于了解一組數據的分布情況,平均水平,差異情況等非常有用。由于數據的性質不同,有時實驗結果的次數分布圖上會出現雙峰。(三)集中量數集中量數主要用來描述一組數據的集中趨勢,常用的代表性的集中量數有算術平均數、中數、眾數。1、算術平均數:又稱平均數,是集中量數中性能最好的一個統計量,一般用M表示。平均數是一種受極端數據值影響的統計量。2、加權平均數加權算術平均數是指一組數據中每個數據與其權重乘積的總和除以權重總和所得的商。在心理與教育研究中,經常會遇到由各個平均數計算總平均數這類實際的統計計算問題。在這個問題中,可以把各小組的平均分數,視為該小組每個個體的分數,而

5、把每個小組的人數,視為權數。3、次數分布表中算術平均數的計算對于已經列成次數分布表的數據,其算術平均數的計算公式為:式中,為各組的組中值,為各組的次數,N為總次數,即。4、中數與眾數中數:又稱中點數,中位數,中值。符號為Md或Mdn。中數是按一定順序排列在一起的一組數據中居于中間位置的數。當數據的個數為偶數時,則取據中間兩個數據的平均數為中位數。對于數據較多的資料,其算術平均數與中位數的值不會相差太大。眾數:又稱為密集數、范數等,常用符號M0表示,眾數是指在次數分布中出現次數最多的那個數的數值。5、平均數、中數與眾數三者之間的關系在正態分布中三者相等,在正偏態分布中,平均數大于中數,中數大于眾

6、數。在負偏態分布中,平均數小于中數,中數小于眾數。M<Md<Mo。對于數據較多的資料,其算術平均數與中位數的值不會相差太大。(四)差異量數差異量數是對一組數據的變異性,即離中趨勢特點進行度量和描述的統計量,也稱為離散量數。1、全距、百分位差和四分差全距又稱兩極差,用符號R表示,用最大值減去最小值就是全距。例如,4,4,5,3,5,5,2。這列數據的全距為3百分位差是用百分位數之間的差值來表示離中趨勢的一種差異量數。四分差,又稱為四分位差,通常用符號Q來表示,指在一個次數分配中,中間50的次數的全距之半,也就是上四分點與下四分點之差的一半。例如,已知在甲分布中P90-P10=38,在

7、乙分布中P90-P10=24,兩個分布的分散程度,則甲>乙。2、標準差、方差(1)方差:也稱變異數,均方。作為樣本統計量,用符號s2 表示,作為總體參數,用2表示。它是每個數據與該組數據平均數之差乘方后的均值,即離均差平方后的平均數。標準差的計算公式為標準差是一組同質數據間變異度大小的量度指標,但是如果兩組數據平均數相差較大時,不能采用標準差進行比較。標準差、方差是描述數據的離散趨勢最好的統計值。(2)方差性質:可加性、可分解性標準差特性:每一個觀察值都加一個相同常數C之后,計算得到的標準差等于原標準差。每一個觀察值都乘一個相同常數C,則所得到的標準差等于原標準差乘以常數C。以上兩點結合

8、,每一個觀察值都乘以一個常數C(C不等于0),再加上一個常數d,所得標準差等于原標準差乘以常數C。(3)方差、標準差的意義:是表示一組數據離散程度的最好指標。其值越大,表示數據的離散程度越大,該組數據越分散;其值越小,表示次數分布的數據比較集中,數據的離散程度越小。3、分組資料標準差的計算方法對于次數分布表中的數據標準差計算公式為:4、差異系數:又稱變異系數、相對標準差等,是一種相對差異量,用CV表示,為標準差對平均數的百分比,計算公式:CV=S/M×100%。差異系數的心理與教育研究中常用于:(1)同一團體不同觀測值離散程度的比較,如身高和體重離散程度的比較;(2)對于水平相差較大

9、,但進行的是同一種觀測的各種團體,進行觀測值離散程度的比較。5、標準分數:(1)又稱基分數或Z分數,是以標準差為單位表示一個原始分數在團體中所處位置的相對位置量數。標準分數的計算公式:(2)標準分數在實際中的應用:用于比較幾個分屬性質不同的觀測值在各自數據分布中相對位置的高低;計算不同值的觀測值的總和或平均值,以表示在團體中的相對位置;表示標準測驗分數。(五)相關系數1、相關系數用于描述雙變量數據相互之間的關系,是兩列變量間相關程度的數字表示形式,或者說是用來表示相關強度的指標。樣本相關系數用r表示,總體一般用表示。相關系數的取值介于-1.00至+1.00之間,常用小數形式表示。相關系數的正負

10、號,表示相關方向,取值的大小表示相關的程度。如果兩個相關系數取值相同,正負號不同,則相關程度相同。當XY相關程度很小時,從X推測Y的可靠性就很小。2、散點圖(1)散點圖是用相同大小圓點的多少或疏密表示統計資料數量大小及變化趨勢的圖。通常以圓點分布的形態表示兩種現象間相關程度。(2)在實際中的用途:在相關研究中,通常用散點圖表示兩個變量之間的關系。通過點的散布形狀和疏密程度來顯示兩個變量的相關趨勢和相關程度,能夠對原始數據間的關系做出直觀而有效的預測和解釋。因此,散點圖是確定變量之間是否存在相關關系及關系緊密程度的簡單又直觀的方法。3、積差相關適用的條件:(1)兩列數據都是測量的數據,而且兩列變

11、量各自總體的分布都是正態的,即正態雙變量。(2)兩列變量之間的關系應是直線性的,非直線性的雙列變量,不能計算線性相關。(3)兩變量測量到的數據必須是成對的數據,對于不成對的數據無法計算相關,即使計算,得到的相關也沒有意義。計算公式: 式中 ,N為成對數據的數目,為X變量的標準差,Sy為Y變量的標準差。利用原始數據計算,公式可以轉化為:其計算步驟為:(1)計算變量的、和;(2)計算變量的、和;(3)計算,;(4)將有關數據代入公式,求得。例如,計算12名學生兩項心理測驗的得分的相關系數,可以利用積差相關。4、等級相關(1)斯皮爾曼等級相關:適用于兩變量的資料為等級測量數據,且具有線性關系;連續變

12、量的測量數據,按其大小排成等級,也可以用等級相關法計算;不要求總體呈正態分布。例如,想了解某一測驗結果(測驗結果服從正態分布)與文化程度是否有關聯,可以采用等級相關。5、相關系數的選擇:主要取決于要處理數據的性質類別以及某一相關系數需要滿足的假設條件。6、點二列相關兩列變量一列是正態連續性變量,另一列是二分變量,描述這兩個變量之間的相關,稱為點二列相關。7、肯德爾和諧系數一般常用來表示評分者信度。(六)概率分布1、概率的基本性質概率的公理系統:任何一個隨機事件A的概率都是非負的;在一定條件下,必然發生的必然事件的概率為1;在一定條件下必然不發生的事件,既不可能事件的概率為0。任何一個隨機事件的

13、概率介于0和1之間。在統計推斷中小概率事件一般被稱為不可能發生的事件。事件的概率僅由事件本身決定,與我們用什么方法去求它無關。 2、正態分布(1)正態分布又叫常態分布,是連續隨機變量概率分布的一種。自然界,人類社會,心理與教育中大量現象均按正態的形式分布。正態分布曲線函數又稱密度函數,一般方程為:其中,是圓周率3.14159.e是自然對數的底2.71828.;X為隨機變量取值;為理論平均數,為理論方差;y為概率密度,即正態分布的縱坐標。(2)正態分布的特點正態分布的形式是對稱的,它的對稱軸是經過平均數點的垂線;正態分布的中央點(即平均數點)最高,然后逐漸向兩側下降,曲線的形式是先向內彎,然后向

14、外彎,拐點位于正負一個標準差處,曲線兩端向靠近基線處無限延伸,但終不能與基線相交;正態曲線下的面積為1,過平均數點的垂線將其面積劃分為相等的兩部分;正態分布是一族分布,它隨隨機變量的平均數,標準差的大小與單位不同而有不同的形態;正態分布中各差異量數值相互間有固定的比例;正態分布曲線下,標準差與概率(面積)有一定的數量關系。決定正態分布曲線的最高點在橫軸上確切位置的是平均數(即)。(3)在實際中的應用化等級評定為測量數據;確定測驗題目的難易度在能力分組或等級評定時確定人數測驗分布的正態化例如,某班級一次考試成績服從正態分布,全班平均成績為70分,標準差為10分,一個學生成績為80分,他在全班的名

15、次為前20%又如,某班成績服從正態分布,平均數為80,標準差為4分,那么得76分至80分之間的學生比率為0.343、樣本分布:是樣本統計量的分布,是統計推論的重要依據。常用的樣本分布有平均數及方差的分布。當樣本足夠大時,樣本分布與總體分布相同。(1)平均數的樣本分布:所謂平均數的樣本分布是指從隨機變量為正態分布的總體中,采取有放回隨機抽樣方法,每次從這個總體中抽取大小為n的一個樣本,計算出它的平均數,這樣抽取無限多次就將獲得無限多個平均數,這無限多個平均數構成的分布就是平均數的樣本分布。正態分布以及漸進正態分布: 樣本平均數的分布:總體服從正態分布且總體方差已知,該統計量對應的標準誤為:;總體

16、服從正態分布且總體方差未知時,該統計量對應的標準誤為 方差與標準差的分布:自正態總體中抽取容量為n的樣本,當n足夠大時(n30),樣本方差及標準差的分布,漸趨于正態分布。(七)參數估計1、自由度自由度是指統計運算與推斷中變量值獨立自由變化的數目,用符號df表示。自由度與統計運算和統計推斷中樣本容量及限制因素的個數有關。2、參數和統計量參數又稱為總體參數,是指描述一個總體情況的一些統計指標;統計量又稱為樣本統計量,是用來描述樣本情況的一些統計指標。3、點估計和區間估計點估計:是用樣本統計量來估計總體參數。樣本統計量為數軸上某一點值,估計的結果也以一個點的數值表示,所以成為點估計。區間估計:就是根

17、據估計量以一定可靠程度推斷總體參數所在的區間范圍,它是用數軸上的一段距離表示未知參數可能落入的范圍,它雖不具體指出總體參數等于什么,單能指出未知總體參數落入某一區間的概率有多大。3、抽樣分布統計量是樣本的函數,它是一個隨機變量。統計量的分布稱為抽樣分布。4、置信區間置信區間或稱置信間距,是指在某一置信度時,總體參數所在的區域距離或區域長度。置信度是指估計總體參數落在某一區間的可能性或概率,而落在區間外,或指估計總體參數落在某一區間時可能犯錯誤的概率也稱為顯著性水平,用符號a表示。例如置信度為0.95的置信區間是指總體參數落在該區間之內,估計正確的概率為95,而出現錯誤的概率為5。5、區間估計的

18、基本原理總體參數區間估計的基本原理是依據樣本統計量的分布規律及樣本分布的標準誤。(1)總體方差的區間估計:根據分布: 自正態分布的總體中,隨機抽取容量為n的樣本,其樣本方差與總體方差比值的分布為分布,這樣可以直接查表確定其比值的0.95和0.99置信區間。再進一步用下式確定總體方差的0.95和0.99置信區間。查df=n-1的表確定與的值,代入不等式得到。(2)總體平均數的區間估計當總體方差已知時,樣本平均數的分布為正態分布或漸近正態分布,此時,平均數分布的標準差。根據正態分布,和標準分數,有68.26%的落在上下一個之間,有95%的落在上下1.96個之間,有99%的落在上下2.58個之間。在

19、實際研究中,只有一個,可看做無限多個中的一個。即為有68.26%的機會被包含在任何一個平均數之間。犯錯誤的概率為(1-68.26%)。因為不能確定樣本平均數究竟落在的左側還是右側,所以用平均數加減一定數量的標準誤計算置信區間。其他總體參數的估計原理與平均數的估計原理相同,但所依據的樣本分布及標準誤不同。6、平均數的標準誤:是指樣本平均數分布的標準差,為了與總體的標準差相區別,一般用標準誤來命名。(八)假設檢驗1、假設檢驗在統計學中,通過樣本統計量得出的差異作出一般性結論,判斷總體參數之間是否存在差異的推論過程就叫做假設檢驗。(1)假設檢驗的基本思想是“反證法”式的推理,通過檢驗虛無假設的真偽來

20、反證研究真實假設的真偽,若為真,則為假,而為假,為真,而且無論作出是真還是假,其結論都帶有概率性質。(2)拒絕H0假設時所犯統計錯誤的概率為<,在假設檢驗中,通常用1來表示統計檢驗力(3)假設檢中的兩類錯誤:型錯誤(I類錯誤)和型錯誤(II類錯誤)。當兩總體確實存在差異,應該推翻虛無假設,但統計的結果是不能推翻虛無假設時,就發生了II類錯誤。(4)雙側檢驗和單側檢驗如果要檢驗一個平均數大于另一個平均數是否達到顯著水平需用單側檢驗。即檢驗兩組的差異顯著性時,只考慮AB之意義,不考慮AB之可能性者,為單側檢驗(若上述A與B之間的關系全部相反,亦為單側檢驗);同時考慮包含AB和AB兩種可能性者

21、,為雙側檢驗。2、假設檢驗的一般步驟:(1)首先虛無假設為樣本均值與總體均值無差異,備則假設是兩者有差異。(2)第二步,要選擇適當的檢驗統計量。如在總體正態分布,總體方差已知的情況下,就選擇Z分數作為檢驗統計量,而總體正態分布,總體方差未知的條件下,選擇t檢驗,總體非正態分布的條件下,使用近似Z檢驗。(3)第三步要規定顯著性水平,從而確定拒絕域。(4)第四步是計算檢驗統計量的值。根據定義,計算Z值,t值和Z的值。(5)最后一步是根據顯著性水平和統計量分布,查相應的統計表。得到接受域和拒絕域的臨界值,將計算出的統計量與之比較,做出接受或拒絕虛無假設的決策。3、總體平均數的顯著性檢驗(1)總體正態

22、分布,總體標準差未知小樣本()時當總體標準差未知時檢驗樣本平均數與總體平均數間的差異,其標準誤中的總體標準差要用樣本標準差代替。當小樣本()時,標準誤為。大樣本()時當總體分布正態,總體標準差未知時,只要是大樣本,檢驗樣本平均數與總體平均數間的差異時可用檢驗。因為大樣本()時,用樣本標準差代替總體標準差,樣本平均數的分布近似地服從正態,其標準誤為4、兩個獨立樣本平均數的差異檢驗(1)總體方差已知,兩獨立樣本平均數間差異的檢驗當總體正態分布,總體方差已知時,無論樣本大小,均可采用檢驗,檢驗公式為: 其中分別為兩樣本平均數;分別為兩樣本對應的總體的方差,分別為兩樣本容量。(2)總體方差未知,獨立大

23、樣本平均數間差異的檢驗,其中分別為兩樣本平均數;分別為兩樣本對應的方差,分別為兩樣本容量,分母是的標準誤。(3)總體方差未知,獨立小樣本平均數間差異的檢驗 ()其中分別為兩樣本平均數;分別為兩樣本容量,。當樣本容量相等(即)時,上述公式可簡寫為:例如,為了了解男女被試走迷宮所用時間是否有顯著差異,隨即抽取男女各26名,知道男女兩組的平均數和標準差,總體方差未知,可采用上述公式。4、平均數差異的顯著性檢驗,是對兩個樣本平均數之間差異的檢驗,目的在于由樣本平均數之間的差異來檢驗各自代表的總體之間的差異。(九)方差分析1、方差分析(1)方差分析的目的是通過F檢驗討論組間變異在總變異中的作用,借以對兩

24、組以上的平均數進行差異檢驗,得到一個整體性的檢驗結果。如果F檢驗的結果差異不顯著,說明實驗中的自變量對因變量沒有顯著影響,檢驗就此結束。如果F檢驗的結果差異顯著,因為它只表明幾個實驗處理組的兩兩比較中至少有一對平均數間的差異達到了顯著水平,至于是哪一對卻沒有回答。此時需要進行事后檢驗。方差分析不能同時檢驗任意兩個平均數之間的差異。(2)方差分析的基本假定變異的可加性;總體服從正態分布;方差齊性2、對于一元線性回歸方程有效性的F檢驗,總的變異可以被分解為回歸平方和和殘差平方和兩部分3、方差分析的一般步驟(1)建立假設方差分析的實質是假設各樣本來自同一個正態總體,然后用F檢驗來判斷這一假設是否成立

25、。建立的假設具體寫為:,至少有兩個平均數不相等(2)求平方和和自由度即分別求出總體、組間、組內的平方和及相應自由度。(3)求均方和。(4)進行F檢驗首先求F值,然后查F分布表找到臨界值,和,并進行比較。如果計算的值,則推翻原假設,認為至少有兩個平均數間差異顯著;如果,則認為各樣本來自同一個正態總體。(5)列方差分析表將方差分析的過程和結果列在一個表中,在實際統計研究報告中,并不詳細描述計算過程,而只將分析的過程和結果列在如下形式的表中。4、單因素方差分析在實驗中如果僅有一個實驗因素,這個因素又分成k種不同水平(k>2)或k種不同處理;將N名被試隨機分成k個實驗組,每個實驗組又被隨機指定接

26、收一種實驗處理,這種實驗設計就叫做單因素完全隨機化設計。依據原始數據進行方差分析的步驟,與上述一般步驟一致,包括建立假設、求平方和與自由度、求均方、進行F檢驗、列方差分析表。(十)檢驗和其他非參數檢驗1、參數檢驗和非參數檢驗參數檢驗法和非參數檢驗法是兩類不同的統計推斷方法。Z檢驗、t檢驗、F檢驗等,是在假設總體正態分布的前提下,用樣本中所含有的信息推斷總體相應參數的特征,稱之為參數檢驗法。在研究的總體分布非正態或分布形態不清時,通過樣本信息去推斷總體時,不能直接對總體參數進行檢驗,而是通過檢驗其分布情況實現的,稱之為非參數檢驗法。2、檢驗檢驗是一種非參數檢驗方法,它既適用于單樣本,也可用于兩樣

27、本,但樣本數目不能太少。主要用來統計分析計數數據,即個數、次數等不連續變量。在單因素卡方檢驗中,樣本N,K種實驗處理,自由度為K-1檢驗的假設:分類相互排斥,互不包容;觀測值的相互獨立;期望次數至少在5個以上。檢驗的基本公式:,為實際觀測次數,為某理論次數。3、預研究10名被試實驗前后的反應時是否存在顯著差異,已知其分布為非正態,最恰當的統計方法是符號檢驗。(十一)線性回歸1、線性回歸:回歸分析是探討變量間數量關系的一種常用統計方法。它通過建立變量間的數學模型對變量進行預測和控制。2、相關系數和回歸系數之間存在一定的關系,由此可以推斷變量x和y的關系,例如,從X推測Y的回歸系數為-0.80,說

28、明X和Y兩變量是負相關。3、簡單回歸分析模型:在簡單模型中,其中參數a、b分別表示截距與斜率,叫做因變量或被預測變量,X叫做自變量或預測變量。因變量的觀察值與預測值之間的差異叫做殘差。4、線性回歸分析的假設條件(1)特定自變量X對應的因變量Y,應服從方差相等的正態分布;(2)不同觀測誤差項之間相互獨立;(3)自變量和因變量之間具有線性關系。4、考察兩個服從正態分布的連續變量之間的因果關系,可以采用線性回歸。使用最小二乘法建立線性回歸模型。如考察自我概念對學習成績影響。建立回歸方程的具體步驟為: 帶入公式進行計算。進一步檢驗有效性:, ,查F值表,進行檢驗。5、決定系數:決定系數是相關系數的平方

29、例如,以學習成績為效標,得到某一智力測驗的效標關聯效度為0.80。將此測驗用于預測時,其測驗結果可解釋學習成績變異的64%三、答題技巧1、單項選擇題:根據題干描述,結合學過的知識點選出最符合的選項。2、判斷題:一般是對學科中基本問題與概念的描述,結合學習的內容進行判斷。3、簡答題:是對于學科中基本問題或重點公式等的理解和識記;根據題干要求,回答要點。4、計算題:結合所學知識,根據相關公式和計算要求,進行計算。5、綜合應用題:需要對課程內容有一個綜合把握和理解,根據題目要求,對課程中涉及到的知識點進行提取,并結合公式進行計算或闡述。四、重點復習題(一)單項選擇題1、甲和乙兩名學生在數學和語文考試

30、中的分數如下:平均分數標準差甲考生乙考生語文7087057數學5545770則( C )。(A) 甲考生與乙考生的成績一樣好 (B) 甲考生的成績較好(C) 乙考生的成績較好 (D) 無法比較2、有8個數據80,90,82,85,91,88,84,92,則它們的中位數是( C )。(A)85 (B)88 (C)86.5 (D)91 3、某班級一次英語考試成績服從正態分布,全班平均成績為70分,標準差為10分,一個學生成績為80分,他在全班的名次為( B )。(A) 前10 (B)前 20 (C)后10 (D) 后204、下面是某校四個班級學生某次考試結果,計算全年級的平均成績應采用的方法是(

31、C )。(A)計算算術平均數 (B)計算變異系數(C)計算加權平均數 (D)計算標準分數5、某種補腦藥聲稱能讓小孩聰明起來,研究人員將一個幼兒園的小孩隨機分成兩組,其中一組服用一個療程的補腦藥,而另一組則用糖水代替。對實驗后的智力測驗數據做t檢驗進行比較,看看補腦藥是否有效。將服用補腦藥作為第一組,服用糖水的作為第二組,該檢驗應該用( C )。(A) 雙側檢驗 (B)左側檢驗 (C)右側檢驗 (D)以上都可以6、已知某小學一年級學生的平均體重為25千克,體重的標準差為3.7千克,平均身高110厘米,標準差為6.2厘米,關于體重和身高離散程度的敘述,正確的是( B )。(A)身高的離散程度較體重

32、大 (B) 身高的離散程度較體重小(C) 一樣大 (D)條件不夠,無法比較7、已知智商測驗的平均分為100,標準差為15,某人智商為130,智商比他低的人約占( D )。(A)5% (B)50% (C)95% (D)98%8、對于一元線性回歸方程有效性的F檢驗,總的變異可以被分解為( D )。(A)誤差平方和和區組平方和兩部分;(B)殘差平方和、組間平方和和區組平方和三部分;(C)總平方和、回歸平方和和殘差平方和三部分;(D)回歸平方和和殘差平方和兩部分。9、已知某智力測驗測試結果服從正態分布,總體方差未知,從中隨機抽取10名被試,其平均值,方差2,則總體均值的0.95的置信區間為( A )。

33、(A) (B)(C) (D)10、對于樣本平均數而言,總體服從正態分布且總體方差未知時,該統計量對應的標準誤為( C )。(A) (B) (C) (D) (二)判斷題1、抽樣分布是參數區間估計的基本原理。 ( T )2、無論在何種條件下,我們均可用標準差來直接比較兩組同質數據的離散程度。 ( F )3、在統計推斷中小概率事件一般被稱為不可能發生的事件。 ( T )(三)簡答題1、什么是抽樣分布,以樣本平均數的抽樣分布為例,說明總體參數區間估計的基本原理。2、舉例說明計數數據分析的基本原理及主要功能(列舉其中主要的兩項即可)。3、什么是散點圖,簡單敘述散點圖在實際研究中的用途。4、以樣本均值與總

34、體均值差異顯著性檢驗為例,說明假設檢驗的基本原理與步驟。(四)計算題某小學三年級數學測驗成績呈正態分布,從中隨機抽取17名學生成績如下:80,69,82,75,92,99,67,78,83,100,82,75,69,83,78,88,95。(1)試估計三年級數學測驗平均成績的0.95和0.99的置信區間; (2)比較不同置信度下區間估計結果的差異,根據這一差異你可出得到什么結論。(五)綜合應用題研究者預回答在四種不同處理條件下,被試的反應是否存在差異。隨機抽取5名被試,分別接受四種不同的實驗處理,結果如下表(假設測試結果服從正態分布,各處理組方差齊性)。實驗處理被試A1A2A3A4123452

35、3556334674467854566(1)該研究設計屬于哪種設計,自變量和因變量分別是什么,應用什么方法分析數據?(2)對上表中的數據進行分析,回答四種處理下,被試反應是否存在差異?該實驗設計是否成功?()五、參考答案(一)單項選擇題CCBCC BDDAC(二)判斷題T F T(三)簡答題1、答案要點:統計量是樣本的函數,它是一個隨機變量。統計量的分布稱為抽樣分布。總體參數區間估計的基本原理是依據樣本統計量的分布規律及樣本分布的標準誤總體參數區間估計:當總體方差已知時,樣本平均數的分布為正態分布或漸近正態分布,此時,平均數分布的標準差。根據正態分布,和標準分數,有68.26%的落在上下一個之

36、間,有95%的落在上下1.96個之間,有99%的落在上下2.58個之間.在實際研究中,只有一個,可看做無限多個中的一個。即為有68.26%的機會被包含在任何一個平均數之間。犯錯誤的概率為(1-68.26%)。因為不能確定樣本平均數究竟落在的左側還是右側,所以用平均數加減一定數量的標準誤計算置信區間。其他總體參數的估計原理與平均數的估計原理相同,但所依據的樣本分布及標準誤不同。2、答案要點:對于計數數據的統計分析,一般應使用屬性統計方法,因為這類數據是按照事物的屬性進行多項分類的。計數數據的分析在多數情況下不是對總體參數的檢驗,而是對總體分布的假設檢驗。它往往依據樣本的頻數分布,在一定的可靠性程度上推斷樣本所屬的總體是否服從某種理論分布或某種假設分布,這樣一種檢驗稱為檢驗。檢驗的原理是檢驗樣本觀測次數(或百分比)與理論或總體次數(百分比)的差異性。比較觀察值與理論值的差別,如果兩者的差別越小,檢驗結果越不容易達到顯著性水平;兩者差異越大,檢驗結果越可能達到顯著水平。基本公式如下:這里, 表示樣本的實際頻數 表示總體的理論頻數值表示統計值與理論量的差異程度。一旦其大于某一臨界值,即可獲得顯著的統計結論。它的主要功能有: 檢驗一個因素多項分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論