




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第六部分心理統(tǒng)計學筆記(1 )基本概念總體:具有某些共同的、可觀測特征的一類事物的全體,構(gòu)成總體的每個基本單元稱為個 體樣本:由于不能或沒必要對整個總體進行研究,我們只能從總體中選擇出一些個體代表總體,這些個體的集合叫樣本變量:本身是變化的或者對于不同個體有不同值得特征或條件常量:本身不變且對不同的個體的值也相同參數(shù):描述總體的數(shù)值,它可以從一次測量中獲得,也可以從總體的一系列測量中推論得到比例:全組中取值為X的比例,p二f/N插值法:一種求兩個已知數(shù)值之間中間值的方法,其假設(shè)所求解點附近數(shù)據(jù)呈線性變化統(tǒng)計量:描述樣本的數(shù)值,與參數(shù)的獲得方式相同隨機取樣:從總體抽取樣本的一種策略,要求總體中的
2、每一個個體被抽到的機會均等取樣誤差:樣本統(tǒng)計量與相應(yīng)的總體參數(shù)之間的差距偏態(tài)分布:分數(shù)堆積在分布的一端,而另一端成為比較尖細的尾端,其與對稱分布對應(yīng)次數(shù)分布:一批數(shù)據(jù)在某一量度的每一個類目所出現(xiàn)的次數(shù)情況離散型變量:由分離的、不可分割的范疇組成,臨近范疇之間沒有值存在連續(xù)型變量:在任何兩個觀測值之間都存在無限多個可能值,它可被分割成無限多個組成 部分(2 )學習建議將注意放在概念上,心理統(tǒng)計應(yīng)該是一門概念性的科學,而非純數(shù)學。一定要將統(tǒng)計方法與心理學研究的情景結(jié)合起來學習。弄懂一個概念再開始學習下一個,心理統(tǒng)計中的概念應(yīng)用性較差卻是之后做題的基礎(chǔ)。做題按照推薦格式能避免出錯幾率。(3 )統(tǒng)計檢
3、驗總表數(shù)據(jù)類型單樣本問題獨立樣本比相關(guān)樣本比多組樣本的比較相關(guān)問題較較獨立樣本重復(fù)測量學 總體單樣本t/z獨立樣本相關(guān)樣本t獨立樣本方重復(fù)測量方Pearson巨 正態(tài)檢驗t/z檢驗差分析差分析積差相關(guān)段分布檢驗分布大樣本下的大樣本下的大樣本下的轉(zhuǎn)化為順序型轉(zhuǎn)化為順序形態(tài)相應(yīng)的t/z相應(yīng)的t/z相應(yīng)的t檢型未知檢驗檢驗驗順序型符號檢驗法曼-惠特尼維爾克松克-瓦氏單向弗里德曼雙SpearmanU檢驗T檢驗方差分析向等級方差等級相關(guān)分析命名型X 2匹配度檢X 2獨立性檢符號檢驗法X 2獨立性檢驗X 2獨立性檢驗驗驗一、描述統(tǒng)計描述統(tǒng)計是指用來整理、概括、簡化數(shù)據(jù)的統(tǒng)計方法,側(cè)重于描述一組數(shù)據(jù)的全貌,
4、表達 一件事物的性質(zhì)。(一)統(tǒng)計圖表統(tǒng)計表和統(tǒng)計圖簡單明確、生動直觀地表達數(shù)量關(guān)系,具有一目了然、整潔美觀、容易理 解等特點。它們是對數(shù)據(jù)進行初步整理,以簡化的形式加以表現(xiàn)的兩種最簡單的方式。在 制定統(tǒng)計圖表之前,一般首先要對數(shù)據(jù)進行以下兩種初步整理:數(shù)據(jù)排序:按照某種標準,對收集到的雜亂無章的數(shù)據(jù)按照一定順序標準進行排列統(tǒng)計分組:根據(jù)被研究對象的特征,將所得到數(shù)據(jù)劃分到各個組別中去.統(tǒng)計圖統(tǒng)計圖:用點、線、面的位置、升降或大小來表達統(tǒng)計資料數(shù)量關(guān)系的一種陳列形式 組成:坐標軸、圖號、圖題、圖目、圖尺、圖形、圖例、圖注 分類:條形圖、圓圖、線性圖、直方圖、散點圖、莖葉圖.統(tǒng)計表統(tǒng)計表:將要統(tǒng)計
5、分析的事物或指標以表格的形式列出來,以代替煩瑣文字描述的一種表 現(xiàn)形式組成:隔開線、表號、名稱、標目、數(shù)字、表注分類:簡單表、分組表、復(fù)合表(二)集中量數(shù)集中量數(shù)又叫集中趨勢,是體現(xiàn)一組數(shù)據(jù)一般水平的統(tǒng)計量。它能反映頻數(shù)分布中大量數(shù) 據(jù)向某一點集中的情況。算數(shù)平均數(shù)(1)定義算數(shù)平均數(shù):即所有觀察值的總和與總頻數(shù)之商,簡稱為平均數(shù)或均數(shù)平均數(shù)一般與標準差、方差相結(jié)合使用。(2)特點在一組數(shù)據(jù)中每個變量與平均數(shù)之差的總和等于零在一組數(shù)據(jù)中,每一個數(shù)都加上一個常數(shù)C,所得的平均數(shù)為原來的平均數(shù)加常數(shù)C在一組數(shù)據(jù)中,每一個數(shù)都乘以一個常數(shù)C,所得的平均數(shù)為原來的平均數(shù)乘以常數(shù)C(3)意義算數(shù)平均數(shù)是
6、應(yīng)用最普遍的一種集中量數(shù),它在大多情況下是真值最好的估計值。(4)優(yōu)缺點優(yōu)點:反應(yīng)靈敏、計算嚴密、計算簡單、簡明易解、適合于進一步用代數(shù)方法鹽酸、較少 受抽樣變動的影響缺點:易受極端數(shù)據(jù)的影響、不能在出現(xiàn)模糊數(shù)據(jù)時計算2 .中數(shù)(1)定義中數(shù):按順序排列在一起的一組數(shù)據(jù)中居于中間位置的數(shù),在這組數(shù)據(jù)中,有一半數(shù)據(jù)比它大,一般數(shù)據(jù)比它小,等價于百分位數(shù)是50的那個數(shù)。(2)算法數(shù)列總個數(shù)為奇數(shù)時,第(n+1)/2個數(shù)就是中數(shù)數(shù)列總個數(shù)為偶數(shù)時,可取位于中間的兩個數(shù)的平均數(shù)作為中數(shù)分布中有相等的數(shù)時,將重復(fù)的數(shù)字看成一個連續(xù)體,利用中間分數(shù)的精確上下限使用 插值法(3)優(yōu)缺點優(yōu)點:計算簡單、容易理
7、解、不受極端值影響、能在有模糊數(shù)據(jù)情況下使用、可在順序型 數(shù)據(jù)時使用缺點:代表性低、不夠靈敏、穩(wěn)定性低、需要排序、不能進一步做代數(shù)運算.眾數(shù)(1)定義眾數(shù):在次數(shù)分布中出現(xiàn)次數(shù)最多的那個數(shù)的數(shù)值眾數(shù)可能不只一個。在正偏態(tài)分布時,平均數(shù)最靠近尾端,中數(shù)位于其與眾數(shù)之間。(2)優(yōu)缺點優(yōu)點:能在數(shù)據(jù)不同質(zhì)的情況使用,能避免極端值干擾缺點:不穩(wěn)定、代表性差、不夠靈敏、不能做進一步的代數(shù)運算(三)差異量數(shù)差異量數(shù)就是對一組數(shù)據(jù)的變異性,即離中趨勢特點進行度量和描述的統(tǒng)計量,也稱為離 散量數(shù)。.離差與平均差離差:分布中的某點到均值得距離,其符號表示了某分屬于均值之間的位置關(guān)系而數(shù)值表示了它們之間的絕對距離
8、離差之和始終為零。平均差:次數(shù)分布中所有原始數(shù)據(jù)與平均數(shù)絕對離差的平均值方差與標準差和方:每一個離差值平房求和由于離差正負值互相抵消無法代表離中趨勢我們引入和方的概念(1)總體的方差和標準差方差:每個數(shù)據(jù)與該組數(shù)據(jù)平均數(shù)之差乘方后的均值,即離均差平房后的均數(shù)作為樣本統(tǒng)計量用符號S2表示,作為總體參數(shù)用符號g表示,也叫均方。標準差:方差的平方根作為樣本統(tǒng)計量用符號S表示,作為總體參數(shù)用符號a表示。(2)樣本的方差和標準差樣本的變異性往往比它來自的總體的變異性要小。為了校正樣本數(shù)據(jù)帶來的偏差,在計算 樣本方差時,我們用自由度來矯正樣本誤差,從而有利于對總體參數(shù)更好的無偏差估計:(3 )性質(zhì)每一個觀
9、測值都加一個相同的常數(shù)C之后,計算得到的標準差等于原來的標準差每一個觀測值都乘以一個相同的常數(shù)C,所得到的標準差等于原標準差乘以這個常數(shù)(4)意義方差與標準差是表示一組數(shù)據(jù)離散程度的最好指標,它們是統(tǒng)計描述與統(tǒng)計推斷分析中最 常用的差異量數(shù),它們的優(yōu)點有:反應(yīng)靈敏、計算嚴謹、計算容易、適合代數(shù)運算、受抽樣變動影響小、意義簡單明了3 .變異系數(shù)當遇到下列情況時,不能用絕對差異量來比較不同樣本的離散程度,而應(yīng)當使用相對差異 量數(shù),最常用的就是差異系數(shù)。兩個或兩個以上樣本所使用的觀測工具不同,所測的特質(zhì)相同兩個或兩個以上樣本使用的是同種觀測工具,所測的特質(zhì)相同,但樣本間水平差異較大差異系數(shù):一種最常
10、用的相對差異量,為標準差對平均數(shù)的百分比相對量數(shù).百分位數(shù)百分位數(shù):在整個分布中,在某一值之下或等于該值的分數(shù)的百分比,所對應(yīng)的分數(shù)百分位數(shù)和百分等級是同一操作定義的兩端。當我們求累計次數(shù)占總體的百分比是,所對應(yīng)的分數(shù)和百分比的值分別為百分位數(shù)和百分等級。.百分等級百分等級:常模團體中低于該分數(shù)的人所占總體的百分比百分等級一定要對應(yīng)分數(shù)區(qū)間的精確上限。百分等級和百分位數(shù)都可以由已知 數(shù)據(jù)用差值法求解。.標準分數(shù)(1 )定義標準分數(shù):以標準差為單位表示一個原始分數(shù)在團體中所處位置的相對位置量數(shù),也叫Z 分數(shù)離平均數(shù)有多遠,即表示原始分數(shù)在平均數(shù)以上或以下幾個標準差的位置。性質(zhì)Z分數(shù)無實際單位,是
11、以平均數(shù)為參照點,以標準差為單位的一個相對量一組原始分數(shù)轉(zhuǎn)換得到的Z分數(shù)可正可負,所有原始分數(shù)的Z分數(shù)之和為零原始數(shù)據(jù)的Z分數(shù)的標準差為1若原始分數(shù)呈正態(tài)分布,則轉(zhuǎn)換得到的所有Z分數(shù)均值為0,標準差為1的標準正態(tài)分 布(3 )優(yōu)點可比性一一不同性質(zhì)的成績,一經(jīng)轉(zhuǎn)換為標準分數(shù),就可在同一背景下比較可加性一一不同性質(zhì)的原始數(shù)據(jù)具有相同的參照點,因此可相加明確性一一知道了標準分數(shù),利用分布寒暑表就能知道其百分等級穩(wěn)定性一一轉(zhuǎn)換成標準分數(shù)之后,規(guī)定了標準差為1,保證了不同性質(zhì)分數(shù)在總分數(shù)中 權(quán)重一樣 (4)應(yīng)用比較幾個分屬性質(zhì)不同的觀測值在各自數(shù)據(jù)分布中相對位置的高低計算不同質(zhì)的觀測值得總合或平均值,
12、以表示在團體中的相對位置若標準分數(shù)中有小數(shù)、負數(shù)等不易被人接受的問題,可通過Z=aZ+b的線性公式將其 轉(zhuǎn)化成新的分數(shù)(如韋氏成人智力量表)相關(guān)量數(shù)由于實驗法適用范圍的限制,有的時候我們只能對變量間進行相關(guān)研究,也就是看兩者是 否有互相跟隨的變化關(guān)系。相關(guān)研究所得到的是一種描述統(tǒng)計,我們僅僅能用其描述兩個 變量互相跟隨的程度大小,至于他們之間是否有因果關(guān)系或者是共變關(guān)系則不可妄下定論。相關(guān)系數(shù):兩列變量間相關(guān)程度的數(shù)字表現(xiàn)形式作為樣本的統(tǒng)計量用r表示,作為總體參數(shù)一般用p表示。正相關(guān):兩列變量變動方向相同負相關(guān):兩列變量中有一列變量變動時,另一列變量呈現(xiàn)出與前一列變量方向 相反的變動零相關(guān):兩
13、列變量之間沒有關(guān)系,各自按照自己的規(guī)律或無規(guī)律變化.積差相關(guān)也就是Pearson相關(guān)。(1 )前提數(shù)據(jù)要成對出現(xiàn),即若干個體中每個個體都有兩種不同的觀測值,并且每隊數(shù)據(jù)與其它 對子相互獨立兩列變量各自總體的分布都是正態(tài)的,至少接近正態(tài)兩個相關(guān)的變量是連續(xù)變量,也即兩列數(shù)據(jù)都是測量數(shù)據(jù)兩列變量之間的關(guān)系應(yīng)是直線性的(2 )公式r也就等于X和Y共同變化的程度除以X和Y各自變化的程度。.等級相關(guān)也就是Spearman相關(guān)(1 )適用范圍當研究考察的變量為順序型數(shù)據(jù)時,若原始數(shù)據(jù)為等比貨等距,則先轉(zhuǎn)化為順序型數(shù)據(jù)當研究考察的變量為非線性數(shù)據(jù)時公式將原始數(shù)據(jù)轉(zhuǎn)化為順序型數(shù)據(jù),仍然用Pearson相關(guān)公式
14、計算即可。肯德爾等級相關(guān)(1 )肯德爾W系數(shù)也叫肯德爾和諧系數(shù),原始數(shù)據(jù)資料的獲得一般采用等級評定法,即讓K個被試對N件實 物進行等級評定。其原理是評價者評價的一致性除以最大變異可能性。R代表評價對象獲得的K個等級之和甘代表等級評定的對象的樹木K代表等級評定者的數(shù)目(2 )肯德爾U系數(shù)#其與肯德爾W系數(shù)所處理的問題相同,但評價者采用對偶比較法,即將N件事物兩兩配對 分別進行比較%為對偶比較記錄表中ij格中的擇優(yōu)分數(shù)4點二列相關(guān)與二列相關(guān)(1 )點二列相關(guān)適用于一列數(shù)據(jù)為等距正態(tài)變量,另一列為離散型二分變量。X是與二分稱名變量的一個值對應(yīng)的連續(xù)變量的平均數(shù)pX是與二分稱名變量的另一個值對應(yīng)的連續(xù)
15、變量的平均數(shù)qp與q是二分稱名變量兩個值各自所占的比率s是連續(xù)變量的標準差(2)二列相關(guān)適用于兩列變量都是正態(tài)等距變量,但其中一列變量被人為地分成兩類。y為標準正態(tài)曲線中p值對應(yīng)的高度,查正態(tài)分布表能得到5 g相關(guān)適用于兩個變量都是只有兩個點值或只表示某些質(zhì)的屬性。其中a、b、c、d分別為四格表中左上、右上、左下、右下的數(shù)據(jù)二、推斷統(tǒng)計推論統(tǒng)計就是指運用一系列的數(shù)學方法,將從樣本數(shù)據(jù)中獲得的結(jié)果推廣到樣本所在的總 體。進行推論統(tǒng)計的關(guān)鍵在于所抽取的樣本要能夠盡量接近所要研究的總體。推斷統(tǒng)計的數(shù)學基礎(chǔ)1 .概率概率:表明隨即時間出現(xiàn)可能性大小的客觀指標概率的定義包含以下兩種,當觀測次數(shù)夠多時他們
16、是相等的。后驗概率:對隨機事件進行n次觀察,某一事件A出現(xiàn)的次數(shù)m與觀測次數(shù)n的比 值在n趨近無窮時所穩(wěn)定在的常數(shù)p先驗概率:在滿足試驗可能結(jié)果數(shù)有限且每一種結(jié)果出現(xiàn)的可能性相等的條件下,隨機事件包含的結(jié)果數(shù)除以結(jié)果總數(shù)2 .正態(tài)分布當樣本量足夠大時,我們會發(fā)現(xiàn)生活中許多變量的分布都近似于正態(tài)曲線,因此有“上帝 偏愛正態(tài)分布”一說。特點正態(tài)曲線的形狀就像一口掛鐘,呈對稱分布,其均值、中數(shù)、眾數(shù)實際上對應(yīng)于同一個 數(shù)值大部分的原始分數(shù)都集中分布在均值附近,極端值相對而言比較少曲線兩端向靠近橫軸處不斷延伸,但始終不會與橫軸向交正態(tài)分布曲線轉(zhuǎn)化為z分數(shù)后人以z分數(shù)與零點對應(yīng)曲線下面積固定用法依據(jù)Z分
17、數(shù)求概率,即已知標準分數(shù)求面積從概率求Z分數(shù),即從面積求標準分數(shù)值已知概率或Z值,求概率密度,即正態(tài)曲線的高.二項分布二項分布:對于一個事件有兩種可能A和B,但我們對這一事件觀察n次,事件A發(fā)生的 總次數(shù)的概率分布就是二項分布二項分布的均值為r = pn方差公式為。2 = npq標準差的公式為。=麗抽樣原理與抽樣方法(1 )抽樣原理抽樣的基本原則是隨機性原則,所謂隨機性原則,是指在進行抽樣時,總體中每一個個體 是否被抽選的概率完全均等。由于隨機抽樣使每個個體有同等機會被抽取,因而有相當大 的可能使樣本保持和總體有相同的結(jié)構(gòu),或者說,具有最大的可能使總體的某些特征在樣 本中得以發(fā)現(xiàn),從而保證由樣
18、本推論總體。(2)抽樣方法簡單隨機取樣法系統(tǒng)隨機取樣法分層隨機取樣法多段隨機取樣法5 .抽樣分布樣本分布:樣本統(tǒng)計量的分布,是統(tǒng)計推論的重要依據(jù)(1 )正態(tài)分布及漸近正態(tài)分布樣本統(tǒng)計量為正態(tài)分布或者接近正態(tài)分布的情況都可根據(jù)正態(tài)分布的概率進行統(tǒng)計推論。總體分為正態(tài)或接近正態(tài),方差已知,樣本平均數(shù)和方差的分布為正態(tài)分布樣本平均數(shù)分布的平均數(shù)和方差與母體的平均數(shù)和方差有如下關(guān)系:樣本的方差及標準差的分布也漸趨于正態(tài)分布,其分布的平均數(shù)與標準差和總體有如下關(guān)系: (2 ) t分布 t分布是一種與方差無關(guān)而與自由度有關(guān)的分布,很類似正態(tài)分布,我們可以將正態(tài)分布 看作t分布當自由度為正無窮時的特例。總體
19、分布為正態(tài),方差未知時,樣本平均數(shù)的分布為t分布:其中其中sn-1(3)x 2分布X 2分布的構(gòu)造是從一個服從正態(tài)分布的總體中每次抽去n個隨機變量,計算其平方和之 后標準化的一個分布。分布曲線下的面積都是1,但伴隨著n取值的不同,自由度改變, 曲線分布形狀不同,而當自由度趨近于正無窮時X 2分布即為正態(tài)分布,因此其于t分布 一樣都是一族分布,而正態(tài)分布都是其中的特例。(4 ) F分布如果有兩個正態(tài)分布的總體,我們從其中各自取出兩個樣本,各自計算出X 2,則: 更多情況下,我們所計算的F兩樣本取自相同總體,此時可將上式化簡為:參數(shù)估計當在研究中從樣本獲得一組數(shù)據(jù)后,如何通過這組信息,對總體特征進
20、行估計,也就是如 何從局部結(jié)果推論總體的情況,稱為總體參數(shù)估計。總體參數(shù)估計問題可以分為點估計與 區(qū)間估計。1 點估計、區(qū)間估計與標準誤良好估計量的標準無偏性一一用多個樣本的統(tǒng)計量估計總體參數(shù)的估計值,其偏差的平均數(shù)為零有效性一一當總體參數(shù)的無偏估計不止一個統(tǒng)計量時,無偏估計變異小者有效性高,變 異大者有效性低,即方差越小越好一致性一一當樣本容量無限增大時,估計值應(yīng)能夠越來越接近它所估計的總體參數(shù)充分性一一樣本的統(tǒng)計量是否充分地反映了全部n個數(shù)據(jù)所反映總體的信息點估計:用樣本統(tǒng)計量來估計總體參數(shù),因為樣本統(tǒng)計量為數(shù)軸上某一點值,估計結(jié)果也 以一個點的數(shù)值表示區(qū)間估計:根據(jù)估計量以一定可靠程度推
21、斷總體參數(shù)所在的區(qū)間范圍,這個區(qū)間就叫做置信區(qū)間,相應(yīng)的概率成為置信度,這兩個量是共通變化的, 置信區(qū)間越大,置信度越高;區(qū)間估計是用數(shù)軸上的一段距離表示未知參數(shù)可能落入的范圍及落入該范圍 的概率。標準誤:樣本平均數(shù)分布的標準差總體方差未知時用估算的總體方差計算標準誤。總體平均數(shù)的估計當總體方差未知時,則使用t分布對應(yīng)置信度標準差與方差的區(qū)間估計標準差的區(qū)間估計方差的區(qū)間估計假設(shè)檢驗可以說,每一個實驗的存在,僅僅是為了給事實一個反駁虛無假設(shè)的機會。一一R.A.Fisher1 .假設(shè)檢驗的原理假設(shè)檢驗:統(tǒng)計學中的一種推論過程,通過樣本統(tǒng)計量得出的差異作為一般性結(jié)論,判斷 總體參數(shù)之間是否存在差異
22、假設(shè)檢驗的實質(zhì)是對可置信性的評價,是對一個不確定問題的決策過程,其結(jié) 果在一定概率上正確的,而不是全部。(1 )兩類假設(shè)對于任何一種研究而言,其結(jié)果無外乎有兩種可能,即是否符合我們預(yù)期。一般來說證偽 一件事情比證實一件事容易,在行為科學的研究中,由于我們無法了解總體中除樣本以外 的個體情況,因此嘗試拒絕虛無假設(shè)的方法優(yōu)于證明備擇假設(shè)。備則假設(shè):因變量的變化、差異卻是是由于自變量的作用往往是我們對研究結(jié)果的預(yù)期,用H表示。虛無假設(shè):實際上什么也沒有發(fā)生,我們所預(yù)計1的改變、差異、處理效果都不存在觀察到的差異只是隨機誤差在起作用,用町表示。(2 )小概率原理小概率原理:小概率事件在一次試驗中幾乎是
23、不可能發(fā)生的至于什么就算小概率事件,那就是我們在計算前明確的決策標準,也就是顯著性水平a。 在檢驗過程中,我們假設(shè)虛無假設(shè)是真實的,同時計算出觀測到的差異完全是由于隨機誤 差所致的概率。之后將其與我們實現(xiàn)界定好的顯著性水平比較,從而考慮是否依據(jù)小概率 原理來拒絕虛無假設(shè)。兩類錯誤(本部分內(nèi)容請參照實心信號檢測論對照來看。一一MJ注)I型錯誤:當虛無假設(shè)正確時,我們拒絕了它所犯的錯誤,也叫a錯誤研究者得出了處理有效果的結(jié)論,而實際上并沒有效果,即所謂“無中生有”II型錯誤:當虛無假設(shè)是錯誤的時候,我們沒有拒絕所犯的錯誤,也叫R錯誤假設(shè)檢驗未能偵查到實際存在的處理效應(yīng),即所謂“失之交臂”兩類檢驗的
24、關(guān)系a +p不一定等于1在其他條件不變的情況下,a與6不可能同時減小或增大檢驗的方向性單側(cè)檢驗:強調(diào)某一方向的檢驗,顯著性的百分等級為a雙側(cè)檢驗:只強調(diào)差異不強調(diào)方向性的檢驗,顯著性百分等級為a /2對于同樣的顯著性標準,在某一方向上,單側(cè)檢驗的臨界區(qū)域要大于雙側(cè)檢驗,因此如果差異發(fā)生在該方向,單側(cè)檢驗犯。錯誤的概率較小,我們也說它的檢驗效力更高。假設(shè)檢驗的步驟根據(jù)問題要求,提出虛無假設(shè)和備擇假設(shè)選擇適當?shù)臋z驗統(tǒng)計量確定檢驗的方向性并規(guī)定顯著性水平計算檢驗統(tǒng)計量的值將統(tǒng)計量的值與臨界值對比做出決策樣本與總體平均數(shù)差異的檢驗(1 )總體正態(tài)分布且方差已知 z = bo其中。一=理obsb_Xn四
25、0和氣分別為總體的平均數(shù)和方差(2)總體正態(tài)分布而方差未知tobsX-R tobsX-R 0s_X其中S -s- = 而 S =X、:nS為用樣本和方估算出的總體方差兩樣本平均數(shù)差異的檢驗- X 一 .一 Zg=y= X-X2這是兩樣本平均數(shù)檢驗的通用公式,所不同的僅在于標準誤的計算DX(1)總體方差已知獨立樣本相關(guān)樣本b志寸2 +氣-2駕2其中r為兩組變量之間的相關(guān)系數(shù)(2)總體方差未知獨立樣本(方差差異不顯著時)相關(guān)樣本: d 2-里a.相關(guān)系數(shù)未知:b 一 =(T 其中d為每一對對應(yīng)數(shù)據(jù)之差 dxn In -17b.相關(guān)系數(shù)已知:b dX=zf2王方差齊性檢驗(1 )樣本方差與總體方差當
26、從正態(tài)分布的總體中隨機抽取容量為n的樣本時,其樣本方差與總體方差比值服從X 2 分布:X 2 =竺由自由度df = n -1查X 2表,依據(jù)顯著性水平判斷b 2 0(2)兩個樣本方差之間獨立樣本S 2F =寸其中當兩樣本自由度相差不大時可用s代替s 1 小查表時 df = n -1,df = n -1相關(guān)樣本S 2 一 S 2t = t 1 / 2 其中 df = n - 24s2s2 L - r2 相關(guān)系數(shù)的顯著性檢驗積差相關(guān)r當 p =0 時:t =,其中 df = n 2;1-r 2 n 2當p尹0時:先通過查表將r和p轉(zhuǎn)化為費舍Z和Z然后進行Z檢驗等級相關(guān)和肯德爾w系數(shù)r p在總體相關(guān)
27、系數(shù)為零時:查各自的相關(guān)系數(shù)表,判定樣本相關(guān)顯著方差分析1 .方差分析的原理與基本過程(1 )方差分析的概念方差分析的目的是推斷多組資料的總體均數(shù)是否相同,也即檢驗多組數(shù)據(jù)之間的均數(shù)差異 是否有統(tǒng)計意義。當我們用多個t檢驗來完成這一過程時,相當于從t分布中隨機抽取多 個t值,這樣落在臨界范圍之外的可能大大增加,從而增加了 I型錯誤 的概率。我們可以 把方差分析看作t檢驗的增強版。(2)方差的可分解性方差分析依據(jù)的基本原理就是方差的可加性原則。作為一種統(tǒng)計方法,方差分析把實驗數(shù) 據(jù)的總變異分解為若十個不同來源的分量。數(shù)據(jù)的變異由兩部分組成:組內(nèi)變異:由于實驗中一些希望加以控制的非實驗因素和一些未
28、被有效控制的未知因素造 成的變異,如個體差異、隨機誤差組內(nèi)變異是具體某一個處理水平之內(nèi)的,因此在對總體變異進行估計的時候不 涉及研究的處理效應(yīng)。組間差異:不僅包括組內(nèi)變異的誤差因素,還包括了是不同組所接受的實驗處理不同造成 的影響如果研究數(shù)據(jù)的總變異是由處理效應(yīng)造成的,那么組間變異在總變異中應(yīng)該占 較大比例。MS表示組間方差,MS =鳥,df = k -1,k表示實驗條件的個數(shù)BB dfBBMS表示組內(nèi)方差,MS =寫,df = k(n-1),n表示每種實驗條件中的被試個數(shù)WW df WJ W方差分析的基本假定樣本必須來自正態(tài)分布的總體每次觀察得到的幾組數(shù)據(jù)必須彼此獨立各實驗處理內(nèi)的方差應(yīng)彼此
29、無顯著差異為了滿足這一假定,我們可采用最大F比率法F =%,求出各樣本中方差最大值與 max s 2 min最小值的比,通過查表判斷。方差分析的基本步驟I求平方和總平方和是所有觀 則值與總平均數(shù)的離差的平方總和SS廣z X2-(gN)其中G表示所有數(shù)據(jù)的總合,N表示總共的數(shù)據(jù)個數(shù)組間平方和是每組的平均數(shù)與總平均數(shù)的離差的平方再與該組數(shù)據(jù)個數(shù)的乘積的總 和SS =EF n (X - G ) = Z T V - G 2/,G為數(shù)據(jù)總均值,T為每組數(shù)據(jù)和,n為該組 b_ i_|/n/ Niii數(shù)據(jù)個數(shù)組內(nèi)平方和是各被試的數(shù)值與組平均數(shù)之間的離差的平方總和(注:sst = ssb + SSW推薦用于檢
30、驗之前的計算,而不是被當作快捷計算的方式)II計算自由度m計算均方w計算f值V查F值表進行F檢驗并做出判斷W陳列方差分析表完全隨機設(shè)計的方差分析隨機區(qū)組設(shè)計的方差分析隨機區(qū)組設(shè)計中同質(zhì)被試參加所有水平下測試,因此,組間變異不包括個體差異的影響。 而每一個水平之內(nèi)仍然是由不同被試共同完成的,于是我們?nèi)匀粚⒖傮w變異分為組間變異 和組內(nèi)變異,但需要進一步將組內(nèi)變異分為被試間變異和誤差引起的變異。這樣,我們就可以在F檢驗時,將被試間變異從組內(nèi)變異中去除,使得檢驗結(jié)果更靈敏。個體誤差用SSR表示,而隨機誤差用SSE表示,它們的和等于組內(nèi)差異SSF = MSb 其中 MS =圣而 SS = SS - SS
31、 ; df =(k 1)G -1)MSe df E W r EV(Z R )SSr=L- - G2N其中Z R為同一區(qū)組的數(shù)據(jù)之和,或者同一被試在不同處理下的乘 i =1積的和讓我們回憶一下兩個相關(guān)樣本平均數(shù)假設(shè)檢驗,可以發(fā)現(xiàn)那里出現(xiàn)的情況和這里的多樣本 方差分析相仿。也就是說,對于同樣的實驗數(shù)據(jù),當我們把它看作是由獨立樣本得出或相 關(guān)樣本得出時,就要采用不同的檢驗方法,從而有可能得出不同的結(jié)論。在假定為相關(guān)樣 本的數(shù)據(jù)得出的顯著性差異如果換作背景是獨立樣本就可能只能接受虛無假設(shè)。這實際上 是因為相關(guān)情況下樣本之間差異的減小使得對應(yīng)檢驗要使用的統(tǒng)計量變大,檢驗也就更加 靈敏了。兩因素方差分析在
32、兩因素實驗設(shè)計中,研究者同時用兩種影響因素作為自變量研究它們對某一因變量的影 響,其實驗結(jié)果比單因素設(shè)計更實際。(1 )交互作用與主效應(yīng)主效應(yīng):某個自變量的不同水平對因變量所造成的影響的差異交互作用:一個因素對因變量的影響因另一個因素的不同水平而不同如果兩個因素彼此獨立,即不管其中一個因素處于哪個水平,另一個因素的不 同水平均值間的差異都保持一致,則不會產(chǎn)生交互作用。統(tǒng)計原理為了看清各因素獨立作用和交互作用的影響,我們進一步將組間差異分解:其中SS與SS分別表示a因素與b因素的組間平方和,SS表示交互作用的平方和abaxbdf = a -1 ; df = b -1 ; df =(a-1)(b-
33、1); df = N - a x bF的計算(這里討論獨立樣本) TOC o 1-5 h z F = 竺其中MS =曳這里的SS是假定全體數(shù)據(jù)只根據(jù)a因素分為兩組所計算的組間 a MSa dfaWa差異F = 里其中MS =匹這里的SS也同樣為假設(shè)只根據(jù)b因素分組所計算的組間差異b MSwb 寸七bF =竺其中MS =竺“這里的SS 為總體組間差異減去SS和SS得到axb MSaxb dfaxba b5 .事后檢驗由方差分析只能得到顯著差異的結(jié)果,事后檢驗使我們能夠比較各組,發(fā)現(xiàn)差異具體產(chǎn)生 在什么地方。事后檢驗采用成對比較的方式,每次比較兩個組的差異。這里我們只介紹常 用的紅絲帶檢驗而不是過
34、氣的內(nèi)褲檢驗HSD檢驗法I把要比較的各個平均數(shù)從小到大作等級排列II處理條件的數(shù)目k,自由度f 查表得到相應(yīng)顯著性的q值III計算作為臨界值的HSD = qjMSw/n (當為隨機區(qū)組時用MSe代替MS )W把要比較的兩個平均數(shù)的差與臨界值比較,若超過則認為差異顯著回歸分析1 .一元線性回歸分析(1 )基本概念回歸分析:通過大量的觀測發(fā)現(xiàn)變量之間存在的統(tǒng)計規(guī)律性,并用一定的數(shù)學模型表示變 量相關(guān)關(guān)系的方法只有一個自變量并且統(tǒng)計量成大體一次函數(shù)的線性關(guān)系的回歸分析叫一元線性回歸分析。在一元線性回歸中,我們用r = a + AX作為回歸方程,代表X與Y的線性關(guān)系 其中:a表示該直線在Y軸的截距b表示該直線的斜率也就是r的變化率X為自變量,通常是研究者事先選定的數(shù)值Y為對應(yīng)于X對變量Y的估計值(2)最小二乘法所謂最小二乘法,就是如果散點圖中每一點沿Y軸方向到直線的距離的平方和最小,則認 為這條直線的代表性最好,即使用其作為回歸方程。這樣我們使得總誤差= Y-Y )最小。E(x - X)Y - Y)-其中 b = EtF ; a =
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025人教版(PEP)三年級下冊期末模擬卷(含答案含聽力原文無音頻)
- 工業(yè)園區(qū)綠色低碳化改造方案
- 工業(yè)廢棄地生態(tài)修復(fù)實踐案例
- 工業(yè)旅游的發(fā)展現(xiàn)狀及前景分析
- 工業(yè)機器人技術(shù)培訓及故障排除
- 工業(yè)污染防治與生態(tài)保護
- 工業(yè)生產(chǎn)中熱風爐的節(jié)能技術(shù)應(yīng)用案例
- 工業(yè)污染對森林環(huán)境的影響與修復(fù)策略
- 工業(yè)污染防治的技術(shù)與策略研究
- 工業(yè)自動化設(shè)備維護與管理系統(tǒng)
- 廣東省廣州市番禺區(qū)2020年七年級第二學期期末區(qū)統(tǒng)考試卷(含答案)
- 藥物研發(fā)自動化-全面剖析
- 股權(quán)回購合同協(xié)議書范本6篇
- 課程思政說課公務(wù)員制度講座情境創(chuàng)設(shè)下雙線四點的課程思政融入設(shè)計
- 2024年衛(wèi)生管理領(lǐng)軍者考試試題及答案
- 飼料行業(yè)粉塵防爆
- 預(yù)制菜烹飪知識培訓課件
- 2025版各行業(yè)《重大事故隱患執(zhí)法檢查參考標準》
- 美國反商業(yè)賄賂合作制度對我國治理商業(yè)賄賂的啟示
- 2025年江蘇省職業(yè)院校技能大賽中職組(食品藥品檢驗)參考試題庫資料及答案
- 禮讓行車培訓
評論
0/150
提交評論