高級生物統計044課件_第1頁
高級生物統計044課件_第2頁
高級生物統計044課件_第3頁
高級生物統計044課件_第4頁
高級生物統計044課件_第5頁
已閱讀5頁,還剩62頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四節最優設計

對于一定的回歸模型,在給定的因子空間的某一區域上,可以設計出多種試驗方案,每個方案都存在它的最大誤差方差。在這些試驗方案中挑選出最大誤差方差最小的方案,用它的試驗結果估計的回歸方程,其回歸預測值與實際觀測值的擬合程度最高,因而這種試驗方案是最優的。最優設計(optimumdesign)就是從試驗誤差方差最小的基本目的出發,得出的一種試驗設計方法。為了判斷一種試驗設計是不是最優設計,已經提出了很多優良性準則,如D—優良性、G—優良性、E—優良性、U—優良性、A—優良性等。一、D—最優設計原理

(一)回歸模型與試驗方案1、回歸模型對于給定的p維歐氏因子空間區域中的點

,無論變量之間的回歸關系如何,其回歸模型的一般形式可表示為:若記

回歸模型(4—45)也可表示為:若進行了t次試驗,則模型(4-46)的結構矩陣X為:信息矩陣A為

模型(4—45)包含了最常見的各種回歸模型。例如,當f1(x),f2(x),…,fm(x)為一組冪函數時,若取p=2,m=6,模型(4—45)就是二元二次回歸模型。

其中x1,x2,…,xt稱為方案W的譜點。離散型方案的信息矩陣A(W)為

(4-50)

如果將離散型方案中每個點的重復次數用其與總次數的比值pi=ni/N表示,且pi可以在[0,1]中任意取值,這種方案稱為連續型方案(continuousscheme),即其中,pi稱為xi點的測度,。(二)D—優良性與G—優良性

1、D—優良性為了確定一個試驗方案是不是最優方案,必須給出判斷最優性的標準。1943年Wald提出了信息矩陣行列式最大值判別法,1959年Kiefer稱這種判別法為D—最優性,又稱為D—優良性。對于同一回歸模型(4—45)的兩個不同的試驗方案W1和W2,如果方案W1的信息矩陣行列式的值大于方案W1的信息矩陣行列式的值,即|A(W1)|>|A(W2)|,則認為在D—優良性意義上,方案W1比方案W2優良。由于相關矩陣C(W)是信息矩陣A(W)的逆矩陣,|C(W)|·|A(W)|=1,因此|A(W1)|>|A(W2)|等價于|C(W1)|>|C(W2)|?!纠?·9】設單因素試驗的回歸模型為試比較下列兩個試驗方案的D—優良性。其行列式為:W1的相關矩陣及其行列式分別為:對于試驗方案W2,相應的計算結果為:由于|A(W1)|>|A(W2)|,|C(W1)|<|C(W2)|,因此在D—優良性意義上,試驗方案W1優于W2。在給定的因子空間的某一區域上,可以設計出多種試驗方案。所有方案中信息矩陣行列式最大的方案稱為區域上的D—最優方案,簡稱D—最優方案。顯然,D—最優方案是針對因子空間的某一區域而言的,對于不同的區域可能存在不同的D—最優方案。其中,其回歸方程為:b的方差協方差矩陣回歸預測值的方差(4-56)當以σ2為單位時,記回歸預測值的方差為,則

對于給定的因子空間區域上的任意一個試驗方案W,回歸預測值的方差d(x,W)在區域上總存在最大值。若該區域上試驗方案W1的回歸預測值的最大方差小于試驗方案W2的回歸預測值的最大方差,即則認為在G—優良性意義上,方案W1優于方案W2。對于試驗方案W1,由(4—57)式得:

3x2+2在區域-1≤x≤1上的最大值為5,因而對于試驗方案W2

3x2-2x+2在區域-1≤x≤1上的最大值為7,因而1、試驗方案W*是D—最優方案,則有2、試驗方案W*是G—最優方案,則有根據這一定理,可以構造和檢驗D—最優方案。【例4·11】設兩因素試驗的回歸模型為:y=1+2x1+3x2+ε(-1≤xj≤1,j=1,2)判斷下列試驗方案W是不是D—最優方案。首先,將離散型方案W表示成連續型方案。其次,計算各試驗點回歸預測值的方差。

根據模型(4—45),此例p=2,m=3,f1(x1,x2)=1,f2(x1,x2)=x1,f3(x1,x2)=x2,F'(x1,x2)=(1x1

x2)。根據(4—52)式,試驗方案W的信息矩陣

相關矩陣

回歸預測值的方差

于是得到試驗方案W的三個試驗點回歸預測值的方差分別為:

最后,根據等價定理來判斷。由于試驗方案W的三個試驗點回歸預測值的方差均等于待定回歸系數的個數m,因此試驗方案W在區域-1≤xj≤1(j=1,2)上是D—最優方案。二、飽和D—最優設計

在進行試驗設計時,為了減小試驗誤差,提高試驗的精確性,應盡可能選擇最優的試驗方案。另一方面,為了節省人力、物力和財力,也應盡量縮小試驗規模,提高試驗的效率。對于回歸設計來說,效率最高的試驗就是水平組合數(即處理數)等于回歸方程中需要估計的回歸系數個數的試驗。具有這種特點的試驗設計稱為飽和設計(saturateddesign)。由于飽和設計沒有剩余自由度,因而不能估計誤差。若要進行誤差估計,飽和設計試驗必須設置若干重復。(一)一次飽和D—最優設計及其統計分析

1、設計方法對于一次回歸模型其回歸系數的個數m=p+1。在p維立方體-1≤xj≤1上,選取p+1個各坐標為-1或1的頂點(apex)構成的設計就是一次飽和D—最優設計。

當p=1時,(x=1)和(x=-1)構成的設計為一次飽和D—最優設計。當p=2時,正方形區域的4個頂點(x1=1,x2=1),(x1=1,x2=-1),(x1=-1,x2=1)和(x1=-1,x2=-1)中的任意3個都可構成一次飽和D—最優設計。前面【例4·11】就是一個p=2的一次飽和D—最優設計。當p=3時,立方體區域上有23-1個部分頂點構成一次飽和D—最優設計。當p=4,5,6時,一次飽和D—最優設計見表4—51。當p=7時,7維立方體區域上有27-4個部分頂點構成一次飽和D—最優設計。一般地,當m=p+1=2q(q為正整數)時,p個因素的一次飽和D—最優設計可以用型2p的全因子試驗的部分實施法給出。2、統計分析由于飽和設計試驗結果的統計分析與其他回歸設計基本相同,因此下面僅結合實例進行介紹。但需注意的是,飽和設計沒有剩余自由度,對回歸方程和回歸系數的顯著性檢驗在試驗無重復和有重復時都與一般的回歸分析方法有所不同。【例4·12】

在油菜再生研究中,應用p=4的一次飽和D—最優設計分析培養基中2,4-D(Z1)、6-BA(Z2)、GA3(Z3)和AgNO3(Z4)對再生頻率的影響。試驗方案和試驗結果如表4—52所示。進行分析。本例的回歸方程

將設計方案中的編碼值和試驗結果代入回歸方程,并用矩陣形式表示。估計回歸系數的計算過程和計算結果如下于是可得用編碼因素表示的回歸方程各處理的回歸預測值列于表4-52的最后一列。由此可見,預測值與實際測察值完全吻合,說明回歸方程的擬合效果很好。飽和設計試驗無重復時不能對回歸系數的顯著性進行檢驗,只能對回歸方程進行近似檢驗。一般可采用控制點檢驗法,詳見本章第五節。為了應用方便,回歸方程需用實際因素表示。由實際因素與編碼因素的關系

可得

將其代入上述回歸方程即得(二)二次飽和D—最優設計及其統計分析

1、設計方法對于二次回歸模型其回歸系數的個數m=1/2(p+2)(p+1)。Box于1971年和1972年給出了p=2和p=3的二次飽和D—最優設計,列于表4—53。對于p≥4的二次飽和D—最優設計,至今尚未解決。但p<7的近似飽和D—最優設計已給出,稱最優混合設計。【例4·13】

為了研究小麥氮肥和磷肥施用量對產量影響的數量關系,計劃每666.67m2純N施用量的下水平和上水平分別為0和12.5kg,P2O5施用量的下水平和上水平分別為0和10kg。試采用二次飽和D—最優設計安排試驗方案。

此例p=2。根據表4—55求得各編碼因素與實際因素之間的關系:

編碼值為-1時,純N施用量Z1=0,P2O5施用量Z2=0;編碼值為1時,純N施用量Z1=12.5,P2O5施用量Z2=10;編碼值為-0.1315時,純N施用量Z1=6.25×(1-0.1315)=5.428,P2O5施用量Z2=5×(1-0.1315)=4.343;編碼值為0.3945時,純N施用量Z1=6.25×(1+0.3945)=8.176,P2O5施用量Z2=5×(1+0.3945)=6.973。由此可以獲得本試驗的試驗方案如表4—54所示。2、統計分析

【例4·14】按照【例4·13】安排的試驗方案進行試驗,重復2次,隨機區組設計,試驗結果(產量:kg/666.67m2)列入表4—54。進行分析。首先,按照單因素隨機區組試驗結果進行方差分析,檢驗處理間的差異顯著性,見表4—55,檢驗結果表明各處理間的差異顯著,而區組間差異不顯著。由于兩個區組間的差異不顯著,下面的回歸分析采用兩次重復的平均值。其次,估計各個回歸系數。

本例的回歸方程為將設計方案中的編碼值和試驗結果代入回歸方程,并用矩陣形式表示。估計回歸系數的計算過程和計算結果如下:于是可得用編碼因素表示的回歸方程再次,檢驗回歸方程的顯著性。雖然飽和設計沒有剩余自由度,但如果試驗安排一定的重復(2~3次),則可由試驗誤差來檢驗回歸方程和回歸系數的顯著性。假設試驗共有k個處理,重復n次,隨機區組設計;第j次重復中第i個處理的觀測值為yij,第i個處理的平均值為,試驗總的平均值為,由回歸方程估計的第i個處理的預測值為?;貧w平方和及其自由度為m為回歸系數的個數(在飽和設計試驗中,m=k)。誤差平方和及其自由度為

于是可用近似檢驗回歸方程的顯著性。本例中,各處理的回歸預測值列于表4-54的最后一列,回歸平方和SSR、誤差平方和SSe和F值分別為:F檢驗極顯著,說明回歸方程表示的回歸關系存在。第四,檢驗回歸系數的顯著性。

回歸系數t檢驗的計算公式為:——誤差均方bj——第j個回歸系數Cjj——相關矩陣第j行第

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論