中國農(nóng)業(yè)大學(xué)生物統(tǒng)計復(fù)習(xí)提綱(共16頁)_第1頁
中國農(nóng)業(yè)大學(xué)生物統(tǒng)計復(fù)習(xí)提綱(共16頁)_第2頁
中國農(nóng)業(yè)大學(xué)生物統(tǒng)計復(fù)習(xí)提綱(共16頁)_第3頁
中國農(nóng)業(yè)大學(xué)生物統(tǒng)計復(fù)習(xí)提綱(共16頁)_第4頁
中國農(nóng)業(yè)大學(xué)生物統(tǒng)計復(fù)習(xí)提綱(共16頁)_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、緒論(xln)隨機(jī)抽樣:保證總體中的每一個研究對象都有一個已知且相等并不為零的概率被選取作為(zuwi)樣本的抽樣方法。1統(tǒng)計(tngj)工作的基本步驟1設(shè)計:這是對整個統(tǒng)計工作的規(guī)劃,具體規(guī)定做什么,怎么做,什么時候做,誰去做,預(yù)計可能需要什么資源以及可能取得的結(jié)果等。2搜集資料,就是按照設(shè)計的規(guī)定,及時取得完整而準(zhǔn)確的數(shù)據(jù)資料;3整理資料,即按照設(shè)計指定的方式方法,審核校正資料,使資料系統(tǒng)化、條理化。4統(tǒng)計分析資料,即按照設(shè)計規(guī)定的方法,進(jìn)行合理的歸類總結(jié),計算相應(yīng)的統(tǒng)計指標(biāo),進(jìn)行適合的統(tǒng)計檢驗和綜合理論分析。2統(tǒng)計資料的類型和特點計量資料通過度量衡的方法測得的研究對象的研究指標(biāo)的值,它是

2、有單位的,大多數(shù)計量資料是連續(xù)性資料,即可以有小數(shù)計數(shù)資料先將研究對象按照某種特性分成不同的組/類,然后清點各組/類所包含研究對象的個數(shù)而得到的資料,可以說沒有單位,屬于間斷性資料,不能有小數(shù)等級資料介于計量資料和計數(shù)資料之間,盡管等級資料能部分反映量的變化,但不能具體說明每個研究對象的研究指標(biāo)的數(shù)量值;雖然也是清點個數(shù)得到的,但能部分反映量的變化。3總體與樣本總體是指根據(jù)研究目的而確定的研究對象的全體。更確切地說,總體是指同質(zhì)的所有研究對象某項研究變量值的集合。因此,實際工作中,當(dāng)有明確而具體的研究指標(biāo)時,總體是指所有研究對象的該項研究指標(biāo)值的集合;而沒有明確而具體的研究指標(biāo)時,總體則是所有

3、研究對象的集合。樣本是指從總體中抽取的部分研究對象。4誤差非抽樣誤差:1. 抽樣框誤差; 2. 無回答誤差;3. 計量誤差。抽樣誤差:是指抽樣研究時由于抽樣而造成的研究結(jié)果與真實值之間的誤差。抽樣研究時,由于只選擇了部分研究對象進(jìn)行研究,這部分研究對象所反映出來的研究結(jié)果肯定與全部研究對象的真實值之間會有誤差,這是產(chǎn)生抽樣誤差的直接原因抽樣;但從根本上說,研究對象之間存在變異,部分和全部是不一樣的,即產(chǎn)生抽樣誤差的根本原因是變異。正因為這直接原因和根本原因,只要是抽樣研究,就存在抽樣誤差。抽樣誤差是不可避免的。1. 改進(jìn)抽樣方法,使樣本更具代表性;2. 增加樣本量,使樣本量達(dá)到一定水平;3.

4、選擇變異程度小的指標(biāo)作為研究指標(biāo)。5小概率(gil)事件指在一次觀察(gunch)/研究(ynji)中,只發(fā)生大概率事件,不發(fā)生小概率事件。或者說,在一次觀察/研究中,小概率事件不發(fā)生。計量資料的描述性研究1頻數(shù)表/頻數(shù)圖的繪制繪制頻數(shù)表時,應(yīng)根據(jù)樣本量的大小合理確定所分的組數(shù),其原則是能正確反映數(shù)據(jù)分布規(guī)律。分的組數(shù)太多,不方便以后的應(yīng)用;分的組數(shù)太少,不能正確反映數(shù)據(jù)的規(guī)律。因此,繪制頻數(shù)表時,所分的組數(shù)既不能太多也不能太少。一般以分815組為宜。2頻數(shù)表/頻數(shù)圖的用途(1)揭示資料的分布特征和分布類型,據(jù)此判斷資料的對稱性;(2)便于發(fā)現(xiàn)可疑值;(3)便于進(jìn)一步計算指標(biāo)和統(tǒng)計分析處理。3

5、集中趨勢(1)算術(shù)均數(shù),簡稱均數(shù)。適合于對稱分布資料,尤其是正態(tài)分布資料; (2)幾何均數(shù)。適合于成倍變化的數(shù)據(jù)(數(shù)學(xué)上稱等比級數(shù)),尤其是對數(shù)正態(tài)分布資料; (3)中位數(shù)。適合于偏態(tài)分布資料、不規(guī)則分布資料或說分布不清楚資料和開放性資料。中位數(shù)的適用范圍比較廣泛,即使是對稱分布的資料,中位數(shù)也會接近或等于算術(shù)均數(shù)/幾何均數(shù)。(4)百分?jǐn)?shù)。4離散趨勢(1)極差(2)四分位數(shù)間距(3)方差(variance)方差越大,變異越大;反之亦然。總體(或說理論)方差用符號2表示;樣本(或說估計)方差用符號s2表示。優(yōu)點:考慮了所有觀察/測量值的變異,比較穩(wěn)定。缺點:量綱(即單位)發(fā)生了改變,有時無法解釋

6、。(4)標(biāo)準(zhǔn)差(無缺點)(5)變異系數(shù)1. 比較單位不同的多組資料的變異程度;2. 比較均數(shù)相差懸殊的多組資料的變異程度。5正態(tài)分布位置(wi zhi)參數(shù)均數(shù);形狀(xngzhun)參數(shù)標(biāo)準(zhǔn)差 總面積100%(1);幾個(j )特殊數(shù): -2.580.5% -1.962.5% -1.6455.0%正態(tài)變換標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布資料的表示方法:N(,2) 6正常值范圍通常把絕大多數(shù)(如90%、95%和99%)研究對象的某指標(biāo)值范圍稱為該研究對象該指標(biāo)的正常值范圍。最常用的有95%正常值范圍。估計方法 正態(tài)分布法/百分位數(shù) (1)太大太小都不正常; / P2.5-P97.5 (2)太大不正常,越小

7、越好; /0-P95 (3)太小不正常,越大越好。 / P5-用途:評判某觀察對象某指標(biāo)是否正常。質(zhì)量控制:在實驗研究中,用來控制誤差,保證數(shù)據(jù)質(zhì)量。7標(biāo)準(zhǔn)誤(standard error)概念:樣本均數(shù)的標(biāo)準(zhǔn)差計算:理論 樣本意義:說明樣本均數(shù)的變異程度,反映抽樣誤差的大小。標(biāo)準(zhǔn)誤越小,抽樣誤差越小,用樣本均數(shù)估計總體均數(shù)的可靠性越大。與樣本量的關(guān)系:S 一定,n增大,標(biāo)準(zhǔn)誤減小。也就是說,樣本量越大,標(biāo)準(zhǔn)誤越小(1)概念不一樣:標(biāo)準(zhǔn)差是方差的平方根,而標(biāo)準(zhǔn)誤是樣本均數(shù)的標(biāo)準(zhǔn)差。(2)計算方法不一樣。(3)意義不一樣:標(biāo)準(zhǔn)差反映個體測量值的變異程度,而標(biāo)準(zhǔn)誤反映樣本均數(shù)(群體測量值)的變異程

8、度。(4)用途不同:標(biāo)準(zhǔn)差用于估計正常值范圍,而標(biāo)準(zhǔn)誤用于估計總體參數(shù)和假設(shè)檢驗。(5)特點不同:標(biāo)準(zhǔn)差還可以反映樣本均數(shù)的代表性,而標(biāo)準(zhǔn)誤還可以反映抽樣誤差的大小,衡量用樣本均數(shù)估計總體參數(shù)的可靠性。8 t分布(fnb)概念(ginin):在作正態(tài)變換的過程中,如果用小樣本的均數(shù)和標(biāo)準(zhǔn)差替代變換公式中的均數(shù)和標(biāo)準(zhǔn)差,得到的結(jié)果(ji gu)就不再是z值,我們用t值表示新的結(jié)果,該值的分布稱為t分布。特點:與z分布相比,t分布曲線也是以0為中心、單峰、左右對稱的曲線。但t分布曲線中點處比標(biāo)準(zhǔn)正態(tài)曲線低,兩側(cè)尾部比正態(tài)曲線翹得高; 曲線形狀與樣本量(嚴(yán)格地說是自由度)有關(guān)。自由度越小,與正態(tài)曲線

9、相差越大;自由度越大,越接近正態(tài)曲線。 是一組曲線。計量資料的統(tǒng)計推斷1概念:由樣本的信息來推論總體特征的過程,稱為統(tǒng)計推斷。2內(nèi)容:參數(shù)估計(點估計,區(qū)間估計)和假設(shè)檢驗3可信區(qū)間:利用樣本均數(shù),按一定的可信程度(置信度)估計得到的總體均數(shù)所在的范圍。估計方法:z分布法大樣本100+ 理論標(biāo)準(zhǔn)差已知小樣本可信區(qū)間vs正常值范圍:(1)概念不同;(2)估計方法不同:估計正常值范圍用標(biāo)準(zhǔn)差,而估計可信區(qū)間用標(biāo)準(zhǔn)誤;(3)意義不同:正常值范圍說明正常情況下絕大多數(shù)該指標(biāo)的測量值所在的范圍,而可信區(qū)間是按一定置信度估計得到的總體均數(shù)所在的范圍。(4)用途不同:正常值范圍用于評判某研究對象的該指標(biāo)是否

10、正常,而可信區(qū)間用于推論總體的參數(shù)。(5)特點不同:由于指標(biāo)的性質(zhì)不同,其正常值范圍常有單雙側(cè)之分,而其總體均數(shù)可信區(qū)間絕大多數(shù)情況下都是雙側(cè)的。4假設(shè)檢驗?zāi)康囊饬x:兩個樣本均數(shù)或者一個樣本均數(shù)和一個總體均數(shù)不相同的原因。判斷/區(qū)分均數(shù)不同是哪一個原因造成的。前提條件:首先要滿足統(tǒng)計推斷的條件;其次要具有可比性,可比性是指除要研究/考察的因素外,其它可能影響結(jié)果的因素都相同或相近;此外要求均數(shù)具有良好的代表性和可靠性。一般步驟:1建立假設(shè) 檢驗(jinyn)假設(shè),又稱無效假設(shè),用符號(fho)H0表示(biosh)。一般假設(shè)比較的樣本來自相同的總體,或者說它們所代表的總體相同。備擇假設(shè),用符號

11、H1表示。與檢驗假設(shè)相對立。單側(cè)檢驗和雙側(cè)檢驗有些不同。 單側(cè)或雙側(cè)檢驗的確定2確定檢驗水準(zhǔn) 又稱顯著性水平,用符號表示,是區(qū)分大小概率事件的標(biāo)準(zhǔn)/界限,是我們?nèi)藶檫x擇而確定的。一般定為0.05或者0.01。3選擇檢驗方法,計算統(tǒng)計量 根據(jù)研究設(shè)計的類型、資料的特點/類型和比較研究的目的,選擇檢驗方法。一旦確定了檢驗方法,計算什么樣的統(tǒng)計量以及如何計算該統(tǒng)計量就可以確定。4確定概率值P 這里的概率P是指,如果比較的兩個均數(shù)所代表的總體相同,那么在這個相同的總體中作隨機(jī)抽樣研究,得到均數(shù)差值至少是現(xiàn)在所觀察到的這么大這一事件的概率。5進(jìn)行統(tǒng)計學(xué)判斷,進(jìn)而作出推斷結(jié)論P,差別無統(tǒng)計學(xué)意義,或者說差

12、別不顯著P,差別有統(tǒng)計學(xué)意義,或者說差別顯著 “差別”的含義 推斷結(jié)論:所研究的總體有/無差別,是否相同。5 z檢驗z的絕對值越大,所對應(yīng)的面積P越小。適用于大樣本或理論標(biāo)準(zhǔn)差已知 兩大樣本均數(shù)比較6 t檢驗(jinyn)自由度()一定(ydng)時,t越大,p越小;概率(gil)(p)一定時,越大,t越小。小樣本正態(tài)資料;兩樣本均數(shù)比較時,兩總體方差齊(相同)配對t檢驗配對設(shè)計將受試對象按一定條件配成對子,再分別給予每對中的兩個受試對象以不同的處理。優(yōu)點增加了處理組間的均衡性,提高了實驗效率形式1兩組受試者分別接受兩種不同的處理;2同一樣品,用兩種不同的方法測試;3同一受試者,在不同時間接受

13、同一種方法的處理和測試。解決配對資料的比較,先要求出各對測量值的差值的均數(shù)和標(biāo)準(zhǔn)差。從理論上講,如果兩組之間沒有區(qū)別,那么差值的總體均數(shù)應(yīng)該等于0。因此,可以將配對資料的t檢驗看成差值的樣本均數(shù)與已知的總體均數(shù)0之間的比較。n是對子數(shù) 成組t檢驗 小樣本正態(tài)資料;方差齊。先兩樣本的方差齊性檢驗再計算統(tǒng)計量 7兩類錯誤(cuw)I類錯誤(cuw):拒絕(jju)了實際上成立的H0 。最大允許概率為顯著性水平,是人為確定的,一般為0.05或者0.01。II類錯誤:不拒絕實際上不成立的H0概率為,一般很難確定。1-稱為檢驗效能或把握度(power of test),是指兩總體確有差別,按水準(zhǔn)能發(fā)現(xiàn)它

14、們有差別的能力。兩類錯誤 1不能同時發(fā)生;2樣本量確定的情況下,越大,越小;3 越小,越大;4 確定的情況下,增加樣本量,可減少。發(fā)生原因:抽樣及抽樣誤差;人為確定的大小;小概率理論。方差分析1基本思想:根據(jù)研究設(shè)計方法和分析的需要,將全部觀察值之間的變異總變異,按設(shè)計和需要分解為兩個或多個部分再作分析。2適用條件:隨機(jī)獨立資料;服從正態(tài)分布;方差齊。3完全隨機(jī)設(shè)計的單因素方差分析4區(qū)組設(shè)計(shj)的兩因素方差分析方差分析:對于配伍(piw)因素 對于(duy)處理因素5多樣本均數(shù)間的兩兩比較多個樣本均數(shù)間每兩個均數(shù)之間的比較,常用q檢驗,也稱SNK法。式中 是誤差或組內(nèi)均方。其中(qzhn

15、g)是檢驗水準(zhǔn),a為比較(bjio)的兩組間包含的組數(shù),v為誤差(wch)或組內(nèi)自由度。最小顯著差法,LSD相對數(shù)1常用指標(biāo):構(gòu)成比(proportion):又稱構(gòu)成指標(biāo),表示事物或現(xiàn)象內(nèi)部各組成部分的比重或分布。()總和等于或;()不能同時都增大或減小。一般要使結(jié)果保留兩位小數(shù)。率(rate):又稱頻率指標(biāo),說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。()分子是發(fā)生某現(xiàn)象的觀察單位數(shù),分母是可能發(fā)生該現(xiàn)象的觀察單位總數(shù)。(2)觀察單位。(3)比例基數(shù)K。相對比(ratio):反映指標(biāo)間的相對水平。甲/乙2動態(tài)數(shù)列按照一定的時間(shjin)順序,將一系列描述某事物的統(tǒng)計指標(biāo)依次排列起來,以便觀察和比較該事物

16、在時間上的變化和發(fā)展趨勢。這些統(tǒng)計指標(biāo)可以是絕對數(shù)、相對數(shù)或平均數(shù)等。動態(tài)數(shù)列分析是建立在相對比基礎(chǔ)(jch)上的,采用定基比和環(huán)比兩種方式。常用(chn yn)的分析指標(biāo)有:絕對增長量、發(fā)展速度與增長速度、平均發(fā)展速度和平均增長速度。3應(yīng)用相對數(shù)的注意事項分母不能太小比與率不能混用合并率(總率)的計算可比性抽樣誤差假設(shè)檢驗4標(biāo)準(zhǔn)化法(合在一起算出人數(shù),再比較)條件:小組構(gòu)成影響總率;小組構(gòu)成各不相同;比較總率。(1)標(biāo)化率不能反映實際水平,只能用于比較;(2)選用標(biāo)準(zhǔn)不同,標(biāo)化率會改變,但比較結(jié)果只有一個,不能改變;(3)比較標(biāo)化率,也要作顯著性檢驗。5率的標(biāo)準(zhǔn)誤和區(qū)間估計總體率的可信區(qū)間

17、標(biāo)準(zhǔn)誤: 小樣本時,可直接查相應(yīng)的統(tǒng)計表而得到某陽性數(shù)時的可信區(qū)間。 樣本量不太小,總體率既不太小,也不太大,接近0.5時,樣本率近似正態(tài)分布。此時總體率的可信區(qū)間為6率的檢驗樣本率與總體率比較 陽性數(shù)比較小時,可直接計算概率P,進(jìn)而完成檢驗。 滿足近似正態(tài)條件時,可用z檢驗。兩樣(lingyng)本率的比較近似(jn s)正態(tài)分布時,仍可用z檢驗(jinyn)。統(tǒng)計圖表統(tǒng)計表種類:簡單表:按一個研究特征/標(biāo)志/標(biāo)識分組復(fù)合/組合表:按二個或二個以上研究特征/標(biāo)志/標(biāo)識分組繪制原則:重點突出,簡單明了;主謂分明,層次清楚繪制要求:標(biāo)題,標(biāo)目,線條,數(shù)字,備注統(tǒng)計圖直條圖(bar graph):

18、 適用于相互獨立的、無連續(xù)關(guān)系的間斷性資料的比較。種類:單式直條圖和復(fù)式直條圖圓圖和百分條圖: 適用于構(gòu)成比資料。普通線圖:用線段的上升和下降來表示某事物在時間上的發(fā)展變化或者某現(xiàn)象隨另一現(xiàn)象變遷的情況。適用于連續(xù)性資料半對數(shù)線圖:橫軸是算術(shù)尺度,縱軸為對數(shù)尺度。因縱軸是對數(shù)尺度,所以不能為0和負(fù)數(shù)。反映的是相對速度,特別適用于絕對值相差懸殊的資料間比較。直方圖: 常用于表示連續(xù)性資料的頻數(shù)分布,故又稱頻數(shù)圖。用矩形的面積表示頻數(shù)分布數(shù)列中各組頻數(shù)的多少,面積總和相當(dāng)于各組頻數(shù)的總和。散點圖:用點的密集程度和趨勢表示兩種現(xiàn)象間的關(guān)系。適用于雙變量資料,且變量均為連續(xù)性變量。直線回歸與相關(guān)1回歸

19、(hugu)分析目的(md):發(fā)現(xiàn)并描述(mio sh)兩變量之間的依存關(guān)系2應(yīng)用條件:自變量容易測定,容易控制;在各種自變量的情況下,應(yīng)變量服從正態(tài)分布。3統(tǒng)計學(xué)意義:自變量x每變化一個單位,應(yīng)變量y平均改變的單位數(shù)。4直線回歸方程建立b是回歸系數(shù)(regression coefficient):等于回歸直線的斜率(slope),其統(tǒng)計學(xué)意義是自變量x每變化一個單位,應(yīng)變量y平均改變的單位數(shù)。截距(a)和回歸系數(shù)(b)的估計:最小二乘法(least square method)原理:保證各實測點至直線的縱向距離的平方和最小5直線回歸方程的假設(shè)檢驗殘差和剩余標(biāo)準(zhǔn)差殘差(residual)是應(yīng)變

20、量的實際觀察值與估計值之間的差。 剩余標(biāo)準(zhǔn)差Sy.x,又稱回歸標(biāo)準(zhǔn)差,表示應(yīng)變量的實際觀察值對于回歸直線的離散程度。應(yīng)變量總離均差平方和(又稱總平方和): 回歸系數(shù)假設(shè)檢驗根據(jù)上述應(yīng)變量總離均差的分解(fnji)可知,回歸系數(shù)(方程)的檢驗可用方差分析方法(fngf)。也可用t檢驗(jinyn) Sb是回歸系數(shù)的標(biāo)準(zhǔn)誤6直線回歸方程的應(yīng)用預(yù)測(forecast)條件均值及其可信區(qū)間:當(dāng)已知自變量的某一個取值時,將該取值代入回歸方程中,便可求得對應(yīng)的應(yīng)變量估計值。該估計值是對給定自變量條件下的平均值的估計,是條件均值。要得到條件均值的可信區(qū)間,首先要計算該估計值的標(biāo)準(zhǔn)誤。個體應(yīng)變量值的容許區(qū)間

21、個體應(yīng)變量值的標(biāo)準(zhǔn)誤為控制:利用回歸方程進(jìn)行逆運算 7應(yīng)用直線回歸應(yīng)注意的問題回歸分析要有實際意義;應(yīng)先繪制散點圖,作初步判斷;在自變量的變化范圍內(nèi)進(jìn)行預(yù)測;自變量和應(yīng)變量必須明確,不能混用。直線(zhxin)相關(guān)1直線(zhxin)相關(guān)的概念:雙正態(tài)變量之間的直線(zhxin)相關(guān)關(guān)系2相關(guān)的幾種情形:散點圖 正相關(guān);負(fù)相關(guān);零相關(guān)(或稱不相關(guān))3相關(guān)程度:用直線相關(guān)系數(shù)客觀地反映。相關(guān)系數(shù)的特點:沒單位;在-11之間。4直線相關(guān)分析的步驟:繪制散點圖,初步判斷是否有可能存在直線相關(guān)關(guān)系;計算樣本相關(guān)系數(shù);對樣本相關(guān)系數(shù)進(jìn)行檢驗。5注意的事項:相關(guān)分析要有意義;結(jié)論只能局限在所測數(shù)據(jù)的范圍內(nèi),不能任意外延;相關(guān)關(guān)系不是因果關(guān)系。6等級相關(guān):適用的情形:非雙正態(tài)資料;資料分布型未知;原始數(shù)據(jù)為等級資料。等級相關(guān)系數(shù),和查表rs (n)比,得P和比非參數(shù)統(tǒng)計概念:對所統(tǒng)計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論