




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 請教:PB-design,最陡爬坡實驗,CCD等中的響應面分析的相關問題請教:PB-design中的相關問題 在實驗設計的過程中,通過閱讀文獻了解到了很多的,但是同時也積累了很多問題解決不了,希望各位高手們指點一二不勝感激.1 在PB設計中出現的dummy variable的具體含義到底是什么?是對照組嗎?如果不是應該遵循什么樣的原則去設計呢?2 在PB中實驗組數應該是變量數加1,那么在相關的文獻中看到15個變量設計為:15+1+4,其中4是dummy variable,但是表格中這4個變量也是有高低水平的變化的,那么設計時是作為15個變量來考慮還是19個呢?3 想問
2、問在最陡爬坡實驗中,步長的選擇有什么要求嗎?純經驗還是有公式的?4 在設計CCD試驗那的時候是否要包括全因子實驗設計?5 什么是中軸點? 各位高手幫幫忙啊,謝謝了小妹我也正在做這塊試驗,是培養基優化的剛做完單因素試驗正在想下面該怎么設計呢?是PB?還是最陡爬坡?還是兩個都要做?反正最后是要做響應面的希望大蝦們多多多指點一下下另外,關于,我也在想,是不是必須要做空白項的呢?那么空白項里面的+1,-1是沒有具體的水平值的亞,那么在實驗中具體該怎么操作呢?謝謝各位不吝指教了我自己是怎么想的:單因子實驗只是為了保險使PB實驗的結果更加明顯而進行的預實驗,PB實驗本身就是有篩選單
3、因子的功能,如果有把握是可以直接做PB的.而我的實驗是先進行單因子,然后是PB,根據PB的實驗分析數據做最陡爬坡實驗,否則不能很好的確定爬坡的方向以及步長.最陡爬坡實驗的步長的選擇:根據前面PB實驗的結果,做一階方程的法線,法線方向就是爬坡方向,步長就根據回歸系數和規范變量的比值在通過自然變量來換算,算到的結果在綜合實際的情況就可以基本確定步長了這個是最近看文獻理解到的一些,希望哪位高手指點一下dummy variable 不是對照組。如果你的實驗次數為4的整數倍。那么看你考察的因素是多少個。比如你有9個,那么至少要使用 runs=12次 的PB設計。此時,有3個空列。一般的處理方法是,等間距
4、空列。實在不行,你就隨機選吧。這并不妨礙你的實驗結果。空列只是為了估算誤差。2. 這樣吧,如果我這樣表述,看你是否能夠理解。我剛好有15個因素,想做PB,正好 runs=16 符合我的要求。可是,這樣一來,估算誤差呢?因為沒有多余空列了。那么,再往上加列,只有再加4列。剛好19因素,20次實驗,其中有4個空列。你認為這多出來的一列(16-15=1),我想你是這樣算的吧。那你運行一下軟件,看看15因素的PB, runs=16,到底是15列,還是16列?列是因素,行是實驗次數。并不是列數=行數。描述:如何確定步長:圖片: 圖片: 描述:4 在設計CCD試驗那的時候是否要包括全因子實驗設計?圖片:
5、看了這張圖,我想答案應該是不言而喻了!描述:CCD各個設計點的作用:圖片: 綜合最后兩個問題.如有異議,歡迎繼續發帖,大家共同學習!幾篇用響應面優化培養基的文章!0 這幾篇都是用響應面優化培養基的文章。響應面現在是比較常用的優化培養基的方法,但是好多人(包括我在內)都不是很清楚。由于最近我要進行培養基的優化,所以找了很多文章來研究。一般的文章都是一帶而過,看了也不明白。這幾篇過程還算詳細,對理解有一定的幫助。希望對大家有所幫助。我在看文章的過程中,我總結出了優化培養基的步驟。拿出來跟大家分享一下,共同學習和交流一下。有錯誤的話希望大家及時提出。第一步:在眾多實驗因素中找出主要因素。在這步實驗中
6、你可以應用正交試驗(因素比較少)和PB(Plackett-Burman)實驗。這兩種方法都可以找出主要因素。尤其是PB實驗,它可以在很多的因素中,用較少的實驗篩選出主要因素(一般選取大于90%)。通過PB實驗還可以看出各因素的作用效果,即是增加還是減少濃度會使響應值向最優移動。第二步:是主要因素的取值逼近中心點,最陡爬坡實驗這步實驗不是必須做的,如果你確定你的實驗取值已經逼近中心點,那么你可以直接進行第三步的分析。但是你要是不能確定或不相信這些取值那你就要進行最陡爬坡實驗。這步實驗根據第一步實驗進行。為了盡快逼近最優值,增加步長通常取最大。我現在還沒找到取最大步長的公式,有誰知道的話麻煩發一下
7、。細履平沙版主,幫忙解決一下,謝謝。這樣就能找到中心點。第三步:響應面分析現在常用的有中心復合法和BB法(Box-Behnken)。在這步實驗時最好因素不要太多,因素太多直接影響到試驗次數,現在經典的一般是三因素。通過這步分析可以的回歸方程,進而得到最優培養基。并且還能得到因素相互作用對響應值的影響。在這里我對x,即+1、1的取值還不太清楚,的取值也不是很清晰,希望大家幫忙解答一下。這是我最近的學習結果,希望大家批評和指正。 此貼被細履平沙在2008-06-05 18:55重新編輯 附件: 采用響應面分析法優化吩嗪_1_羧酸的發酵條件.pdf (180 K) 下載次數:4 需要經驗值:20 附
8、件: 發酵法產氫培養基的響應面分析優化.pdf (908 K) 下載次數:4 需要經驗值:20 附件: 酵母內海藻糖積累條件的優化.pdf (213 K) 下載次數:4 需要經驗值:20 附件: 響應面法優化納豆激酶液體發酵.pdf (217 K) 下載次數:5 需要經驗值:20關于培養基的優化試驗套路0 正交試驗和均勻設計方法進行培養基優化已取得諸多成功的例子。 正交試驗適合因子較多而因子水平不多的試驗設計,從試驗次數上看,是至少為因子數的平方。 均勻設計適合于因子少,而水平多的試驗,從試驗次數看,至少是因子數的兩倍。 兩種方法雖然多從拉丁方設計衍生而來,
9、不過效率卻更高。 現如今,大多流行響應曲面設計來優化培養基。 首先,我們要從眾多培養基成分及影響的環境因素中篩選出具有主效應的因子。這時,通常采用篩選試驗。主要有全因子因析設計和PlackettBurman設計。兩種篩選試驗,各有千秋,但都能以最少的試驗次數篩選出主效應因子。其中全因子設計能夠表現出因子的三級以上交互作用,而PlackettBurman設計由于是兩水平設計,所以交互作用只在二級交互作用。另外還有部分因子因析設計。 篩選到了主效應因子,我們就可以開始進行下一步優化試驗。此時,主要有中心復合設計和Box-Behnken設計。 中心組合
10、設計是一種國際上較為常用的響應面法,是一種5水平的實驗設計法。采用該法能夠在有限的實驗次數下,對影響生物過程的因子及其交互作用進行評價,而且還能對各因子進行優化,以獲得影響過程的最佳條件。 Box- Behnken設計是另一種國際上較為常用的響應面法,是一種3水平的實驗設計法。同樣具有響應面法的優點。近年來利用該法進行生物過程優化的文獻比用中心組合設計法的明顯地少。 通常以上說的響應曲面設計和數據分析,都可以通過一些統計軟件來運行,十分簡便。 為此,我將本人一直在使用的Mintab綠色軟件上傳,希望大家能夠好好利用,搞好試驗設計,節省人力無力,為經濟帶來騰飛
11、(別忘了日本很大程度上就是因為田口宏一的正交設計表,在二戰后迅速崛起!)謝謝西風,看你的回復我很有同感,我當時剛開始做RSM也是摸不到頭腦,沒辦法,只有看文獻一步一步的摸索過來的。為了不讓帖子沉了,也為了有需要的戰友節省時間,心中對試驗設計有個大概的框架,我先拋磚引玉,簡單講下我做培養基優化的一點體會。可能有些戰友認為,試驗設計優化培養基就是找幾種培養基成分放在一起做幾個組合進行試驗就行了,其實這樣做往往是得不到最適的結果的,尤其在做響應面分析(RSM)的時候,試驗得到的圖形可能不是一個完美的曲面圖,我見過一些別人發的文章,它的曲面圖是一個扭曲的圖形,高點根本沒有出現在圖形中,那試驗得到的根本
12、不是最適的培養基組分,當然這種文章一般不會出現在核心期刊上的。這種情況一般都是沒有在做RSM前,做“爬坡試驗”的結果,“爬坡試驗”的目的在于找出RSM設計的中心點,保證結果的準確性。另外一點需要提出的是RSM的一個缺點就是分析的因素不能太多,經典的是三因素的試驗設計,如果你的因素比較多,那不妨試試方開泰的均勻設計。要做RSM就要先找出有顯著影響的因素,剔除一些對結果影響不顯著的因素,所以在“爬坡試驗”之前還需要一個PB試驗,PB能從眾多因素中很簡單的找出對試驗結果影響最為顯著的因素,排除一些影響不顯著的因素,降低后續試驗的工作量,又能保證結果的準確性。PB和“爬坡試驗”對于剛接觸試驗設計的戰友
13、,比較陌生點,加上發表文章中很少,全面的把整個試驗設計寫出來的,一般的都是只寫RSM這部分,也有幾篇文章是PB+RSM的,還有先做RSM后做“爬坡試驗”的。我個人認為PB-“爬坡試驗”-RS,這種試驗設計的思路比較符合邏輯,又比較全面。如果做畢業論文的培養基優化部分,可以使內容比較豐富。當然如果是做畢業論文的話,在綜合試驗設計之前,還有個更基礎的工作,就是單因素試驗,那種放棄單因素試驗的想法也完全錯誤的,尤其是沒有一個基礎配方的時候。我做的菌種是我自己從本實驗室菌種庫篩出來,然后又做了誘變育種,所以是沒有合適的培養基的,所以做了很多工作,用單因素試驗首先大致確定C、N、P、無機鹽、微量元素的種
14、類及水平。大致講了一下,說的比較散亂,或許不太好明白。希望大家把問題提出來,我們一起針對具體問題具體分析。講得不錯,都是很好的心得。先用PB進行顯著性分析是一個很好的建議。另外可以從歷史數據中找到合適的數據,然后再用軟件進行分析,就可以不用再做實驗就可找到影響顯著的因素和水平范圍。響應面分析,其實用我們常見的軟件就可以做出來。首先對各個單因素的試驗結果進行歸納,后選擇變量的變化區間還變化間隔就可以,常見的軟件如DPS就可以了。用這個軟件可以完成你所需的所有工作,要是想讓你的響應面好看,用MATLAB也可以,三維,四維的都可以,在MATLAB區中有我寫的現成的用MATLAB語句實現第四維的表示方
15、法,很好用。另外用SARS軟件也是可以的,不過語句能比MATLAB復雜一點點。EXCEL也可以,不過做出的響應面,美觀程度差一點點。我有個想法,能不能在初始時用正交實驗確定出中心點的范圍,然后將數據用SAS中的主成份分析,得到影響最顯著的幾個因素,然后用RSM做,這樣主要影響因素有了,中心點也有了。做起來也好做,不會PB等軟件的戰友也可以輕松操作。不知這樣可不可行?希望大家討論討論PB實驗設計的數據處理我使用SAS進行試驗設計的,11個因素+4個dummy variables,做16次實驗。PB實驗設計的數據已經出來了,但是怎么分析不了。用AnalysistStatisticsRegressi
16、onLinear分析出來的結果像圖里面這樣,怎么回事呢?后面幾列的Standard Error, t value 以及p值都沒有。我給試驗設計的表也列出來吧,請各位高手分析一下,到底是哪方面原因導致的。表中X2,X4,X8,X15這4列是dummy variables,沒有賦值,其余11個是考查的因素。y是考查指標(轉化率%)上面是圖片,順便給表格放在word里面,以附件傳上來,請大家幫分析分析。想知道的幾個問題:1.試驗設計有沒有問題?2.就按照表中設計的試驗做了16次實驗,沒有將每次重復3遍取平均值,是不是可以?3.這些數據該怎么處理,怎么用SAS處理會出現上面的情況,沒有標準
17、誤差,t值以及p值?謝謝了先附件: Coded Design.rar (7 K) 下載次數:5很想問一下,那個虛擬變量如何設置啊 一般多少個還有最重要的是 實驗過程中到底如何進行啊 小妹真的沒有概念虛擬變量好像一般設個三個左右實驗次數都為四的的倍數,如果你要測定8個因素,實驗次數仍為12,那么就可以設三個虛擬變量。8311<12記住k個因素和實驗次數之間的關系是 K小于或等于n1具體實驗過程中,我個人覺得就是高低水平都為,就是什么都不加,只是增加了實驗次數,控制誤差的作用。實驗過程中控制誤差可以通過重復試驗達到。而實驗誤差的計算可以通過增加中心點次數實現。如果不能
18、進行誤差分析,那么就談不上數據分析了。我也是剛剛起步,幸虧有發酵人,大家可以一起交流!一般來說,試驗設計的時候k次實驗的話,(考查因素+虛擬變量)=k1。比如,次實驗,考查個因素,那么剩下的個變量就可以不賦值,仍為。不過這種dummy variables選擇國內期刊和國外期刊有所不同:國內的:如版友們所說,隨機選擇的比較多。外文期刊:1.沒有標出dummy variables,比如12次實驗,設計表就列出了8個考查因素,而3個dummy variables沒有標出; 2.標出了,但是給dummy variables都列在一塊,比
19、如就放最后幾列。 3.也看到就根本沒有設 dummy variables的,比如12次實驗就考查11個因素的。初學求教:什么是PB實驗和爬坡實驗啊什么是PB實驗和爬坡實驗啊剛開始做實驗,什么都不知道,萬望各位賜教!pb是plackett-Burman的縮寫,是一種篩選試驗。就是從眾多影響因素中篩選出具有主效應的因子。至于最陡爬坡我也不太清楚。我也想知道。額要點名了,細履平沙斑竹,指點一下吧。謝謝了!斑竹,給大家講解一下吧,我也特別想知道什么是最陡爬坡,我看過你的帖子,知道你是試驗設計的行家。望斑竹不吝賜教。最陡爬坡實驗它能最快逼近最大響應面區域,確定中心組合實驗的中心
20、點,能保證響應面分析結果的準確有效性.我只知道這么一點吧.還望樓下的人能補充細化一下呢.一般都會作,但是如果實驗結果由方差分析發現選取的水平已接近最大響應區域,那么就可以不再進行最陡爬坡實驗,最后用中心復合設計及響應面分析來確定主要影響因子的最佳濃度。你可以看看有關資料.一般是先作部分因素實驗(FFD),再做最陡爬坡實驗.再利用中心組合實驗確定中心點,如果采用PB實驗,一般不作最陡爬坡實驗,直接用中心組合實驗確定中心點.具體原理我不記不清了.明天我上傳一個這個方面的資料吧.上傳一篇文章.可能對你有幫助. 此貼被細履平沙在2008-06-08 15:02重新編輯 附件: 生物過程的優化.pdf
21、(358 K) 下載次數:63 需要經驗值:30 怎么又方差分析看所選水平是否已經接近最大響應區域呢?謝謝!PB試驗可以用來篩選培養基中不同成分對試驗結果的影響,通過PB試驗得到影響較大的試驗因素;爬坡試驗就是從PB試驗的中心點開始,根據PB試驗的得出的每種因子的系數來確定爬坡方向以及步長,爬坡試驗主要目的是逼近主要試驗因子的最適添加水平;之后根據爬坡試驗的結果就可以做相應面了,也就可以最后確定每種重要因子的添加量了。嘿嘿,我也是初學者,希望這些能對你有幫助請教一下:響應曲面1.414到-1.414中間5個水平的步長如何設計?還需要看回歸系數嗎?設計的時候憑經驗還是有具體的公式?緊急求救0是中
22、間,1如果相當于中間偏大2.0水平,那么1.414就相當于中間偏大2.828水平.我是這么理解的,這個不能靠經驗,而是根據程序要求。關于PB設計中的t檢驗和P檢驗請問各位大俠,PB設計中的t 檢驗和P檢驗的功能是否是一樣的?如何通過t 檢驗來認定顯著因素?另外,某因子的顯著性大于90%或80%等是如何判斷的?感謝賜教P的意思是概率,不是P檢驗,是根據T值查到的概率和F值查到的概率。樓主可能沒有學習過數理統計。進行實驗設計,一些數學基本知識還是要具備的。關于最陡爬坡(最速上升)的問題我下了發酵人上的“Path of steepest ascent /descent”。在學習中有些地方不明白,希望
23、大蝦能給予幫助。在設計中需要編寫一個“最速上升宏”命令,請問這個“最速上升宏”在Minitab15這個版本中有沒有,如果有在哪里?(本人愚鈍,如果翻譯錯誤望大蝦指出以便更正)還有我點擊“編輯器(D)啟動命令(E)”然后按照minitab技術支持文件上所給出的方法在會話窗口里輸入以下命令:ascent y x.1-x.n;sore u.1-u.j;step s;base b;descent;runs r.然后回車出現“* 錯誤* 未知 Minitab 命令: ASCEMTB > ”我不知道這個命令應該在哪里輸入。望高手指點啊!最陡爬坡必須要輸入命令才能完成嗎?可不可以像pb一樣直接用min
24、itab軟件現有的程序就可以完成設計和分析?最陡爬坡實驗我覺得最陡爬坡實驗不需要軟件分析的,直接觀察數據變化的趨勢,找到極點值,附近找到因子參數范圍再做下一步的響應面實驗和分析就可以了。可以參考PB試驗設計外文資料里面dummy variables要么沒有列出來,有些就根本沒有設(比如8次試驗就做7個因素),要么所有的dummy variables就全部都列在一起,只有看到國內的文章才是將dummy variables隨機的列出來。在版上也看到說要有dummy variables,并且要隨機的選擇。那么dummy variables到底要不要,要的話是不列出來,還是所有的就放最后幾列呢?我認為
25、dummy variables的位置 不影響分析結果。但是這個參數應該有。有道理,另外,每一組試驗只做一次,還是做個重復比如同一組做3次,然后取他們的平均值呢?要是只做一次會不會誤差比較大,影響試驗結果?重復多次可以減少某些異常點引入的誤差,減少噪音,提高模型顯著性。有兩種方法,一種是在程序中設置3個重復,實驗結果都輸入實驗表,也可以在程序中設1個duplication,然后將數值平均后輸入實驗表。 從pb到最陡爬坡,如何設計步長,求救啊pb做完了,也做了重復,現在真是不會確定步長真的是很笨,希望高手指點一下求救啊細心看看以前的貼子,有詳細的介紹。一個參數(A)根據自己的經驗確定,其
26、它參數根據PB試驗公式中的系數來確定。具體找貼子吧。看下面的貼子,topmit有介紹。做了響應曲面分析,圖形不對,麻煩大家看看哪里出了問題圖片: 我是先單因素-pb-最陡爬坡-響應曲面的結果很不如意啊,想聽聽大家的意見,修改一下,繼續向前挺進呵呵大家多提意見啊hope59你好,我想請教一下你爬坡實驗怎么設計的,是用minitab設計的嗎?關于爬坡步長我看了些文獻,關于爬坡步長的說法不一。 有文獻這樣確定最陡爬坡的,步長公式=e×j ×bj, 其中bj為一次回歸的回歸系數,j為變化半徑這樣看來,回歸系數越大,步長應該越大啊。 而有的文獻又說回歸系數越大
27、,步長應該越小。我覺得這種說法也對,因為回歸系數大,說明對響應值的影響越大啊,響應值對因素變化非常靈敏,所以步長取值應該小點,以免錯過最優點。不知我的理解對不對,請大家指教。求助:可不可以用pb方法進行非培養基優化的發酵實驗啊小女子剛接觸發酵實驗,對很多東西不是太了解,最近查文獻資料發現PB方法進行實驗優化很方便,但是所查的資料都是關于培養基優化的,很想知道是不是可以用PB進行其他非培養基優化的實驗?比如說有很多因素像溫度、PH、鈣離子濃度等。如果可以用PB法優化,那在進行“確定因素水平”階段是不是也可以用“最陡爬坡實驗”進行非培養基優化的實驗呢?希望高手給予解決,小女子不勝感激沒有問題,可以
28、用。但是進行試驗之前,要考慮好試驗的目的,不能只是為了試驗而試驗,而要考慮試驗的結果是不是能夠達到某種效果和實驗條件能不能實現。優化包括:培養基優化(碳源,氮源,無機鹽等),培養條件優化(溫度、PH、轉速,裝液量等)實驗設計:根據需要,自由組合,可以同時優化眾多因素,不必拘泥于是培養基還是培養條件。響應面設計的三個階段It is possible to separate an optimization study using RSM into three stages. The first stage is the preliminary work in which the determina
29、tion of the independent parameters and their levels are carried out. The second stage is the selection of the experimental design and the prediction and verification of the model equation. The lastone is obtaining the response surface plot and contour plot of the response as a function of the indepe
30、ndent parameters and determination of optimum points. 三個階段。1,準備階段,決定獨立變量及其水平。2,實驗設計的選擇及模型的驗證3,根據響應面來確定優化條件。求救:pb試驗我做了好幾次,總是找不到影響顯著的因子我做了好幾次pb試驗,可是總也找不到影響顯著的因子,就是大于95%的兩個到三個因子,我的基本都在80%左右,很是郁悶啊備受打擊,但是郁悶完了,還是想找找問題,調整濃度繼續篩選不知道大家有沒有遇到類似的問題?都從哪里入手調節?對了,我看很多文獻上都說,高水平一般是低水平的1.25倍,這個很固定嗎我都是按照1.25倍做的,不會是這里有問
31、題吧還是要focus到上面的問題,遇到顯著性不高的問題,應該如何調整?希望高手多多指教!試試高水平是低水平的1.5倍看看生物過程存在嚴重的交互作用,而PB實驗次數少,因此在交互作用解決上有一定的問題。所以在生物領域先進行單因素考察,然后再進行組合試驗是有一定道理的。我感覺也可以先進行PB實驗多考察一些因素,然后再減少因素并進一步探索因素間的交互作用。首先:你考察的是幾個因素?如果存在交互作用,確實會存在上述情況。第二:你的響應量是什么,該數據是否可靠? 比如,我們做糖的,響應量就是胞外多糖,胞內多糖。測糖的方法是濃硫酸苯酚法。如果實驗設計者對該方法掌握不好,就算是同一個樣品,測定結
32、果差別甚大,那么,這就不是實驗設計分析本身的錯誤,而是實驗設計者的錯誤!只要大于就行了我是以生物量作為指標,用涂平板檢測的我用了七個因子,用minitab設計的12次試驗,經過分析,只有一個因子的可性度在90%以上在此之前,我做過比較全面的單因子試驗,但是由于單因子試驗用的是化合物能清楚的知道碳濃度、氮濃度等詳細的參數現在做工業發酵,用的都是豆餅粉之類的,所以在量上還是需要摸索后期要做響應面,所以pb試驗做的比較謹慎,怕后期出現更大的錯誤。我這周重復一下上次的試驗,再把倍數擴大到1.5試試看非常感謝大家這么熱心的幫助我,真是很感動哦不知道我現在的設計有沒有什么地方不合適?希望大家多多批評指正!
33、不知道樓主,為什么7個因子要用12次實驗設計呢?minitab上自動生成的啊還有就是每次生成的圖表都不一樣呢,很是奇怪版主是不是覺得我的設計有問題啊我剛準備瓶子,準備做了,呵呵,看樣子是有問題了哦我回去再看看,晚上再做吧,版主加我qq吧 43787903可能需要和您好好討論一下呢謝謝,我在線等首先:7個因子,做8次實驗足夠。不知道你設計過程中是否有哪一步沒選好。其次:低水平和高水平的倍數,一般在1.5左右,多了少了并沒太大關系。只要不是認為的胡亂加大水平值,PB篩選還是比較可靠的。再次:我實驗室是不準安裝QQ等聊天軟件的。所以,只能我回家加你了。關于爬坡實驗的疑問!爬坡試驗需要軟件設計嗎?我剛
34、做完pb試驗,篩選完重要因子,然后是不是應該以高水平為中心,上下篩選幾個濃度(一般也要七八個濃度吧),這時候步長設計有什么要求嗎?濃度個數設置有要求嗎?需要軟件設計嗎?版主快來指導一下吧!最爬坡試驗最后要達到什么要求才能進一步進行響應曲面試驗?爬坡試驗需要或者能用minitab設計嗎? 我看到的論文上好像只是將得到的數據比較產量高低呢?puzzled and help!你做完了PB從分析的數據上就可以看出每個因子的影響是正還是負!所以設計的時候一定注意不要搞錯了!步長的設置也要看你自己實驗本身,不能套用!所選擇幾個比較好,能達到你的實驗目的,就是逼近最有的響應區域!越逼近越有利于下一步的實驗!
35、回歸與相關回歸與相關-一、直線回歸分析直線回歸是用直線回歸方程表示兩個數量變量間依存關系的統計分析方法,屬雙變量分析的范疇。1. 直線回歸方程的求法 (1)回歸方程的概念:直線回歸方程的一般形式是Ý(音y hat)=a+bx,其中x為自變量,一般為資料中能精確測定和控制的量,Y為應變量,指在x規定范圍內隨機變化的量。a為截距,是回歸直線與縱軸的交點,b為斜率,意為x每改變一個單位時,Ý的變化量。(2)直線回歸方程的求法確定直線回歸方程利用的是最小二乘法原理,基本步驟為:1)先求 b,基本公式為b=lxy/lxx=SSxy/SSxx ,其中lxy為X,Y的離均差積和,lxx為
36、X的離均差平方和;2)再求a,根據回歸方程 a等于Y的均值減去x均值與b乘積的差值。(3)回歸方程的圖示:根據回歸方程,在坐標軸上任意取相距較遠的兩點,連接上述兩點就可得到回歸方程的圖示。應注意的是,連出的回歸直線不應超過x的實測值范圍.2. 回歸關系的檢驗回歸關系的檢驗又稱回歸方程的檢驗,其目的是檢驗求得的回歸方程在總體中是否成立,即是否樣本代表的總體也有直線回歸關系。方法有以下兩種:(1)方差分析 其基本思想是將總變異分解為SS回歸和SS剩余,然后利用F檢驗來判斷回歸方程是否成立。(2)t檢驗其基本思想是利用樣本回歸系數b與總體均數回歸系數ß進行比較來判斷回歸方程是否成立,實際應
37、用中因為回歸系數b的檢驗過程較為復雜,而相關系數r的檢驗過程簡單并與之等價,故一般用相關系數r的檢驗來代替回歸系數b的檢驗。3. 直線回歸方程的應用(1)描述兩變量之間的依存關系; 利用直線回歸方程即可定量描述兩個變量間依存的數量關系(2)利用回歸方程進行預測; 把預報因子(即自變量x)代入回歸方程對預報量(即因變量Y)進行估計,即可得到個體Y值的容許區間。(3)利用回歸方程進行統計控制 規定Y值的變化,通過控制x的范圍來實現統計控制的目標。如已經得到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過控制汽車流量來控制空氣中NO2的濃度。4. 應用直線回歸的注意事項(1)做回歸分析要有實際意
38、義;(2)回歸分析前,最好先作出散點圖;(3)回歸直線不要外延。二、直線相關分析1. 直線相關的概念直線相關分析是描述兩變量間是否有直線關系以及直線關系的方向和密切程度的分析方法。用以描述兩變量間相關關系的指標是相關系數(常用r表示),兩變量間相關關系的種類有正相關(0<r<1)、負相關(-1<r<0)、零相關(r=0)、完全相關(|r|=1)等。相關分析對資料的要求是兩變量(x,y)均是符合正態分布的隨機變量。2. 相關系數的計算相關系數是x,Y的離均差積和lxy除以X的離均差平方和lxx與Y的離均差平方和lyy之積的算術平方根的商。故此相關系數又被稱為積差相關系數。
39、3.相關系數的假設檢驗相關系數檢驗的目的是判斷兩變量的總體是否有相關關系,方法有t檢驗和查表法,t檢驗法是樣本與總體的比較,查表法是直接查相關系數界值表得到相應的概率p。三、直線相關與回歸的區別與聯系區別:1. 相關說明相關關系,回歸說明依存關系; 2. r與b有區別; 3. 資料要求不同。聯系:1. r與b值可相互換算; 2. r與b正負號一致; 3. r與b的假設檢驗等價;4. 回歸可解釋相關。相關系數的平方r2(又稱決定系數)是回歸平方和與總的離均差平方和之比,故回歸平方和是引入相關變量后總平方和減少的部分。四、等級相關分析等級相關分析
40、適用于資料不是正態雙變量或總體分布未知,數據一端或兩端有不確定值的資料或等級資料。常用的Spearman等級相關系數rs是利用x,Y的秩次來進行直線相關分析的。因此當x,Y的相同秩次較多時,計算出的rs需矯正。同樣的,等級相關系數rs也需要進行假設檢驗。五、相關分析應用中的注意事項1. 相關分析要有實際意義;2. 相關關系不一定都是“因果”關系;3. 相關系數r假設檢驗中p的大小不能說明相關的密切程度;4. 直線相關和等級相關有各自不同的適用條件方差分析一、方差分析的基本思想1. 方差分析的概念 方差分析(ANOVA)又稱變異數分析或F檢驗,其目的是推斷兩組或多組資料的總體均數是否
41、相同,檢驗兩個或多個樣本均數的差異是否有統計學意義。我們要學習的主要內容包括單因素方差分析即完全隨機設計或成組設計的方差分析和兩因素方差分析即配伍組設計的方差分析。2. 方差分析的基本思想 下面我們用一個簡單的例子來說明方差分析的基本思想: 如某克山病區測得11例克山病患者和13名健康人的血磷值(mmol/L)如下,患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
42、0; 問該地克山病患者與健康人的血磷值是否不同? 從以上資料可以看出,24個患者與健康人的血磷值各不相同,如果用離均差平方和(SS)描述其圍繞總均數的變異情況,則總變異有以下兩個來源:(1)組內變異,即由于隨機誤差的原因使得各組內部的血磷值各不相等;(2)組間變異,即由于克山病的影響使得患者與健康人組的血磷值均數大小不等。 而且:SS總=SS組間+SS組內 v總=v組間+v組內 如果用均方(即自由度v去除離均差平方和的商)代替離均差平方和以消除各組樣本數不同的影響,則方差分析就是用組內均方去除組間均方的商(即F值)與1相比較,若F值接近1,則說明各組均數間的
43、差異沒有統計學意義,若F值遠大于1,則說明各組均數間的差異有統計學意義。實際應用中檢驗假設成立條件下F值大于特定值的概率可通過查閱F界值表(方差分析用)獲得。3. 方差分析的應用條件應用方差分析對資料進行統計推斷之前應注意其使用條件,包括:(1)可比性,若資料中各組均數本身不具可比性則不適用方差分析。(2)正態性,即偏態分布資料不適用方差分析。對偏態分布的資料應考慮用對數變換、平方根變換、倒數變換、平方根反正弦變換等變量變換方法變為正態或接近正態后再進行方差分析。(3)方差齊性,即若組間方差不齊則不適用方差分析。多個方差的齊性檢驗可用Bartlett法,它用卡方值作為檢驗統計量,結果判斷需查閱
44、卡方界值表。二、方差分析的主要內容根據資料設計類型的不同,有以下兩種方差分析的方法:1. 對成組設計的多個樣本均數比較,應采用完全隨機設計的方差分析,即單因素方差分析。2. 對隨機區組設計的多個樣本均數比較,應采用配伍組設計的方差分析,即兩因素方差分析。兩類方差分析的基本步驟相同,只是變異的分解方式不同,對成組設計的資料,總變異分解為組內變異和組間變異(隨機誤差),即:SS總=SS組間+SS組內,而對配伍組設計的資料,總變異除了分解為處理組變異和隨機誤差外還包括配伍組變異,即:SS總=SS處理+SS配伍+SS誤差。整個方差分析的基本步驟如下:(1) 建立檢驗假設; H
45、0:多個樣本總體均數相等。 H1:多個樣本總體均數不相等或不全等。 檢驗水準為0.05。(2) 計算檢驗統計量F值;(3) 確定P值并作出推斷結果。三、多個樣本均數的兩兩比較 經過方差分析若拒絕了檢驗假設,只能說明多個樣本總體均數不相等或不全相等。若要得到各組均數間更詳細的信息,應在方差分析的基礎上進行多個樣本均數的兩兩比較。1. 多個樣本均數間兩兩比較 多個樣本均數間兩兩比較常用q檢驗的方法,即 Newman-kueuls法,其基本步驟為: 建立檢驗假設->樣本均數排序->計算q值->查
46、q界值表判斷結果。2. 多個實驗組與一個對照組均數間兩兩比較 多個實驗組與一個對照組均數間兩兩比較,若目的是減小第II類錯誤,最好選用最小顯著差法(LSD法);若目的是減小第I類錯誤,最好選用新復極差法,前者查t界值表,后者查q界值表。t檢驗和u檢驗簡而言之,t檢驗和u檢驗就是統計量為t,u的假設檢驗,兩者均是常見的假設檢驗方法。當樣本含量n較大時,樣本均數符合正態分布,故可用u檢驗進行分析。當樣本含量n小時,若觀察值x符合正態分布,則用t檢驗(因此時樣本均數符合t分布),當x為未知分布時應采用秩和檢驗。一、樣本均數與總體均數比較的t檢驗樣本均數與總體均數比較的t檢驗實際上是推斷該
47、樣本來自的總體均數µ與已知的某一總體均數µ0(常為理論值或標準值) 有無差別。如根據大量調查,已知健康成年男性的脈搏均數為72次/分,某醫生在一山區隨即抽查了25名健康男性,求得其脈搏均數為74.2次/分,標準差為6.0次/分,問是否能據此認為該山區成年男性的脈搏均數高于一般成年男性。上述兩個均數不等既可能是抽樣誤差所致,也有可能真是環境差異的影響,為此,可用t檢驗進行判斷,檢驗過程如下:1. 建立假設H0:µ=µ0=72次/分,H0:µ>µ0,檢驗水準為單側0.05。2. 計算統計量進行樣本均數與總體均數比較的t檢驗時t值為樣
48、本均數與總體均數差值的絕對值除以標準誤的商,其中標準誤為標準差除以樣本含量算術平方根的商。3. 確定概率,作出判斷以自由度v(樣本含量n減1)查t界值表,0.025<P<0.05,拒絕H0,接受H1,可認為該山區成年男性的脈搏均數高于一般成年男性。應注意的是,當樣本含量n較大時,可用u檢驗代替t檢驗。二、配對設計的t檢驗配對設計是一種比較特殊的設計方式,能夠很好地控制非實驗因素對結果的影響,有自身配對和非自身配對之分。配對設計資料的t檢驗實際上是用配對差值與總體均數“0”進行比較,即推斷差數的總體均數是否為“0”。故其檢驗過程與樣本均數與總體均數比較的t檢驗類似,即:1. 建立假設
49、H0:µd=0,即差值的總體均數為“0”,H1:µd>0或µd<0,即差值的總體均數不為“0”,檢驗水準為0.05。2. 計算統計量進行配對設計t檢驗時 t值為差值均數與0之差的絕對值除以差值標準誤的商,其中差值標準誤為差值標準差除以樣本含量算術平方根的商。3. 確定概率,作出判斷以自由度v(對子數減1)查t界值表,若P<0.05,則拒絕H0,接受H1,若P>=0.05,則還不能拒絕H0。三、成組設計兩樣本均數比較的t檢驗成組設計兩樣本均數比較的t檢驗又稱成組比較或完全隨機設計的t檢驗,其目的是推斷兩個樣本分別代表的總體均數是否相等。其檢驗
50、過程與上述兩種t檢驗也沒有大的差別,只是假設的表達和t值的計算公式不同。兩樣本均數比較的t檢驗,其假設一般為:H0:µ1=µ2,即兩樣本來自的總體均數相等,H1:µ1>µ2或µ1<µ2,即兩樣本來自的總體均數不相等,檢驗水準為0.05。計算t統計量時是用兩樣本均數差值的絕對值除以兩樣本均數差值的標準誤。應注意的是當樣本含量n較大時(如大于100時)可用u檢驗代替t檢驗,此時u值的計算公式較t值的計算公式要簡單的多。四、t檢驗的應用條件和注意事項兩個小樣本均數比較的t檢驗有以下應用條件:(1)兩樣本來自的總體均符合正態分布,
51、(2)兩樣本來自的總體方差齊。故在進行兩小樣本均數比較的t檢驗之前,要用方差齊性檢驗來推斷兩樣本代表的總體方差是否相等,方差齊性檢驗的方法使用F檢驗,其原理是看較大樣本方差與較小樣本方差的商是否接近“1”。若接近“1”,則可認為兩樣本代表的總體方差齊。判斷兩樣本來自的總體是否符合正態分布,可用正態性檢驗的方法。若兩樣本來自的總體方差不齊,也不符合正態分布,對符合對數正態分布的資料可用其幾何均數進行t檢驗,對其他資料可用t檢驗或秩和檢驗進行分析。實驗設計基本概念一、實驗設計的概念、特點和分類1.實驗設計的概念 將一組隨機抽取的實驗對象隨機分配到兩種或多種處理組,觀察比較不同處理的效應
52、,這種研究稱為“實驗研究”. “實驗設計”是為實驗研究做的周密計劃。2.實驗研究的特點(1)能有效地控制誤差,節省人、財、物力,提高效率。(2)研究者能人為地設置處理因素。(3)受試對象接受何種處理及處理因素的水平是隨機分配的。3.實驗研究的分類(1)動物實驗:在動物身上進行的實驗研究。 (2)臨床實驗:在臨床患病人群中進行的試驗研究。(3)社區干預實驗:在某地區所有人群中進行的試驗研究。二、實驗設計的基本要素1.處理因素 又稱研究因素,一般是外部施加的因素,確定處理因素時應注意:(1)抓住實(試)驗中的主要因素。(2)確定和控制非處理因素。(3)處理因素要標準化。2.受試對象
53、160; 即研究的對象,一般有人和動物兩類。 人的選擇:要注意病人和正常人的正確區分,診斷要明確,受試對象依從性要好等。 動物選擇:注意所選動物的種類、品系、年齡、性別、窩別、體重等。3.實驗效應 即處理因素的效果,應注意:(1)正確選用觀察指標來反映實驗效應。所選指標要靈敏、精確、客觀,最好選用定量指標。(2)指標觀察時應避免偏性,可采用盲法。三、實驗設計的基本原則 1.對照原則:即實(試)驗要設立對照,使得除實驗因素外,對照組與實驗組其余因素保持一致,常用的對照有:空白對照、安慰劑對照、標準對照、實驗對照、自身對照和歷史對照等。 2.重復原則
54、:即研究對象要有一定的數量,或者說樣本含量應足夠。根據每個具體研究,可有不同的方法來進行樣本含量估計。 3.隨機化原則:即應保證每個實驗對象都有同等機會進入實驗或接受某種處理。常用方法有查隨機數字表和隨機排列表等。隨機化是保證均衡性的重要手段。 4.均衡原則:即各處理組非實驗因素的條件基本一致,以消除其影響。四、常用的實驗設計方法1.完全隨機設計將實驗對象隨機分配至兩個或多個處理組去進行實驗觀察,又稱單因素設計、成組設計。 優點:操作簡單、應用廣泛。 缺點:效率低,只能分析單因素的效應。 資料處理方法:t,u檢驗,方差分析、秩和檢驗、卡方檢驗等。 2.配對(
55、伍)設計 將受試對象配成對子或配伍組,以消除非實驗因素的影響。配伍設計又稱隨機區組設計。配對有自身配對和不同個體配對,配伍實際上是配對的推廣。優點:所需樣本數和效率均高于成組設計,而且很好地控制了混雜因素的作用。缺點:配對條件不宜滿足。資料處理方法:配對t, u檢驗,秩和檢驗、配伍組方差分析、配對四格表卡方檢驗等。 3.其它實驗設計方法:(1)交叉設計:在配對設計基礎上再加入時間因素,可分析不同階段的效應。(2)析因設計、拉丁方設計和正交設計等。實驗設計的意義、原則與基本內容 一、實驗設計的意義 實驗設計是科學研究計劃內關于研究方法與步驟的一項內容。在醫學科研工作中,無論實驗室研究
56、、臨床療效觀察或現場調查,在制訂研究計劃時,都應根據實驗的目的和條例,結合統計學的要求,針對實驗的全過程,認真考慮實驗設計問題。一個周密而完善的實驗設計,能合理地安排各種實驗因素,嚴格地控制實驗誤差,從而用較少的人力、物力和時間,最大限度地獲得豐富而可靠的資料。反之,如果實驗設計存在著缺點,就可能造成不應有的浪費,且足以減損研究結果的價值。總之,實驗設計是實驗過程的依據,是實驗數據處理的前提,也是提高科研成果質量的一個重要保證。二、實驗設計的原則實驗設計有屬于專業方面的,有屬于統計方面的。從統計方面說,主要應當考慮對照、重復、隨機化等問題,這就是所謂實驗設計的三原則。其具體內容我們將在第二、三
57、、四節介紹。三、實驗設計的基本內容(一)擬定相互比較的處理所謂處理,指的是在實驗研究中欲施加給受試對象的某些因素。如營養實驗的各種飼料,治療某病的幾種療法或藥物,藥理研究中某藥的各種劑量等。在實驗的全過程中,處理因素要始終如一保持不變,按一個標準進行實驗。如果實驗的處理因素是藥物,那么藥物的成份、含量、出廠批號等必須保持不變。如果實驗的處理因素是手術,那么就不能開始時不熟練,而應該在實驗之前使熟練程度穩定一致。(二)確定實驗對象及數量這里指的是實驗所用的動物或活體組織標本等。在實驗設計中,要根據實驗觀察的目的與內容,明確規定采用什么樣的實驗對象,實驗對象中的每個實驗單位必須具備的條件與要求,以保證受試對象的一致性。實驗對象需要有一定的數量,例數不能太少,也不宜過多。如何估計例數,詳見第四節。(三)確定將各實驗單位分配到各種處理中去的原則這主要是隨機分配或隨機化問題。第三節將介紹幾種常用的隨機分組方法。(四)擬定觀察項目和登記表要根據研究目的和任務,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025福建晉園發展集團有限責任公司權屬子公司招聘7人筆試備考題庫及答案詳解(易錯題)
- 2025年河北省定州市輔警招聘考試試題題庫含答案詳解(基礎題)
- 2025年K12輔導行業品牌建設策略:雙減政策下的轉型路徑分析報告
- 初中生物八年級下冊統編教案
- 腎結石成分與代謝評估研究2025
- 2025屆高考物理大一輪復習課件 第七章 第35課時 專題強化:碰撞模型及拓展
- 建設工程履約擔保制度研究
- 項目投資筆試題及答案
- 江蘇省高品質高中2025屆高三下學期5月調研測試生物試卷(有答案)
- 安徽省黃山市2023-2024學年高二下學期期末質量檢測英語試卷(不含音頻答案不全) - 原卷
- 虛擬現實技術在應急指揮決策中的輔助作用-洞察闡釋
- 企業自主評價委托協議書
- T/CIQA 30-2022出入境生物安全消毒服務人員能力等級劃分及相關要求
- 2025-2030中國核桃乳市場消費需求規模及營銷戰略規劃研究報告
- 2025銀行面試題目及答案柜員
- 軟裝搭配與色彩運用考核試卷
- 2025年中國冶金錳礦石市場調查研究報告
- 2025年國際貿易實務課程考試題及答案
- 2025屆廣西欽州市東場中學七下數學期末復習檢測試題含解析
- 地方政府治理中的典型案例試題及答案
- 2025甘肅省農墾集團有限責任公司招聘生產技術人員145人筆試參考題庫附帶答案詳解
評論
0/150
提交評論