




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、摘要葡萄擁有很高的營養價值,本文通過對葡萄酒的評價,以及釀酒葡萄和葡萄酒的理化指標之間的關系進行討論分析,對不同的釀酒葡萄進行了分類,并更深入討論兩者的理化指標是否影響葡萄酒質量。針對問題一,我們首先分別計算每類葡萄酒樣品在兩組組評酒師評價下的綜合得分,以此作為每組評酒師的最終評價結果。再運用統計學中的T檢驗進行假設與檢驗,得出兩組評價結果具有顯著性差異。最后通過計算各組評價員的評價結果的標準差,以此推算穩定性指標值P,P值較大的可信度較高,得出p紅1p.12與吊1吊2,進而得出第二組的評價結果更加可信。針對問題二,我們分別對兩組葡萄進行分類。在這里我們采用聚類分析法和主成分分析法,在matl
2、ab中實現對釀酒葡萄的分類。針對問題三,根據Z-對附件2中的數據進行標準化處理,排除單位不同的影響。以釀酒葡萄的30個一級理化指標作為自變量X,葡萄酒9個一級的理化指標作為因變量y,建立多元線性回歸模型yX,得出釀酒葡萄的理化指標與葡萄酒的理化指標之間的聯系即回歸系數矩陣。針對問題四,用灰色關聯度分析對兩者的關系進行度量,求得理化指標對樣品酒的的關聯系數。然后根據葡萄酒綜合得分及指標的相關系數得出樣品酒的綜合指標,通過MATLAB軟件對綜合指標與第二問中葡萄酒的分數進行指數擬合,擬合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指標來評價葡萄酒的質量,只能根據圖像大致猜測綜合指標與葡萄酒的質量負
3、相關。關鍵詞:T檢驗聚類分析法主成分分析法Z分數多元線性回歸一、問題重述確定葡萄酒質量時一般是通過聘請一批有資質的評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質量。釀酒葡萄的好壞與所釀葡萄酒的質量有直接的關系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄7S和葡萄的質量。附件1給出了某一年份一些葡萄酒的評價結果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數據。請嘗試建立數學模型討論下列問題:1 .分析附件1中兩組評酒員的評價結果有無顯著性差異,哪一組結果更可信?2 .根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡
4、萄進行分級。3 .分析釀酒葡萄與葡萄酒的理化指標之間的聯系。4.分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量?二、問題分析葡萄酒的評價是一個復雜的過程,需要綜合考慮不同評價員的評分,而且葡萄酒和葡萄的組成成分非常復雜,它們也要影響葡萄酒的質量,對如此繁多的數據,我們就必須依靠計算機工具,運用數學統計學知識對它們進行處理,并找出各個含量之間的關系,聯系生活實際,對葡萄酒作出有理有據的評價。對于問題一:要想得到兩組評價員的評價結果有無顯著差異,并對它們的可靠性作出判斷,我們首先就應該將兩組評價員的對27組紅葡萄酒和28組白葡萄酒的評價結果整
5、理出來,求得葡萄酒的綜合得分,再運用統計學中的T檢驗進行假設與檢驗,判斷兩組是否存在顯著性差異,再通過計算各組評價員的評價結果的標準差和穩定性指標,進而判斷誰的結果更加可信。對于問題二:需要對葡萄進行分級,由于葡萄酒的質量與釀酒葡萄的好壞有直接關系,所以我們可以根據葡萄酒的質量對釀酒葡萄做一個簡單的分級,之后,我們用主成分分析法算出每一組樣本葡萄的哪些指標該葡萄的主成分,然后通過數據分析判斷出這些成分哪些對葡萄酒的質量作出了貢獻,篩選出主要成分后,對不同葡萄的成分做加權求和,以此作為葡萄分級的另一個依據。對于問題三:要想得到葡萄與葡萄酒的指標間的聯系,即得到它們之間的函數關系表達式,必須求出兩
6、者指標之間的相關系數。但是,由于它們各自的指標太多,此處僅以一級指標作為相關因素進行分析。令釀酒葡萄的30個一級指標作為自變量,葡萄酒的9個一級指標作為因變量,建立線性回歸模型,通過最小二乘法計算出回歸系數,即釀酒葡萄的指標與葡萄酒的指標間的相關性。對于問題四:題中想要求出理化指標對質量的影響,即各理化指標與質量的線性或非線性關系,但是,由于理化指標太多,并且并非沒個理化指標都會對葡萄酒的質量造成影響,所以首先必須進行數據的篩選,這里我們使用spss軟件進行典型相關性分析,找出哪些指標與質量有較大的關系,然后將這些指標設為自變量,將質量設為因變量,對它們進行多元線性擬合,最后得到一個多元表達式
7、以后,我們就可以通過這個方程來對葡萄酒的質量進行驗證,如果驗證的結果與評價員打分的結果基本吻合的話,就說明可以用葡萄與葡萄酒的理化指標來對葡萄酒的質量進行評價。三、基本假設1、假設評酒員對每種葡萄酒的評價結果是大致符合正態分布的;2、假設釀酒葡萄與葡萄酒中的芳香物質主要成分是:低醇、酯類、苯等,其余成份忽略;3、假設釀酒葡萄與葡萄酒的理化指標中一級指標為主要影響。4、假設釀酒葡萄中存在的而葡萄酒中不存在的理化指標也會影響葡萄酒的理化指標及質量;5、假設不考慮多種葡萄可制成一種酒,只考慮一種葡萄制成一種酒;6、假設只考慮紅葡萄制成紅葡萄酒,白葡萄制成白葡萄酒,忽略去皮紅葡萄可釀制白葡萄酒;7、假
8、設質量高的葡萄酒一定由質量好的釀酒葡萄制成,但是質量好的釀酒葡萄不一定能釀制成質量高的葡萄酒;8、Aj表示第i瓶酒的第j個指標無量綱化后的值9、Bj表示第i種釀酒葡萄的第j個指標無量綱化后的值10、Mi表示第i瓶酒的綜合指標四符號說明T:統計量Takhij:第k組序號為h的樣品第i個指標第j個品酒師的給分akhi:序號為h的樣品中第i個指標第k組10位品酒師給分的平均值Qhi:第k組序號為h的樣品第i個指標10位品酒師評分的標準差:第k組第i個指標所占權重4h;第k組序號為h的樣品的穩定性指標pik:第k組紅葡萄酒的評分總平均穩定性指標Rk:第k組白葡萄酒的評分總平均穩定性指標Xj:為第i個樣
9、品的第j個指標s:第i個葡萄樣品的總得分i:第i個樣品葡萄理化指標得分為其中:第一個指標指澄清度,第二個指標指色調,第三個指標指香氣純正度,第四個指標指香氣濃度,第五個指標指香氣質量,第六個指標指口感純正度,第七個指標指口感濃度,第八個指標指持久性,第九個指標指口感質量,第十個指標指平衡/整體評價。五模型建立與求解5.1問題一:葡萄酒評價結果的顯著性差異及可信度分析5.1.1葡萄酒評價結果數據預處理對附件1中數據通過Excel篩選觀察時可發現某些數據錯誤,如:第一組紅葡萄酒品嘗評分中酒樣品20號下4號品酒員對于外觀分析的色調評價數據缺失;第一組白葡萄酒品嘗評分中酒樣品3號下7號品酒員對于口感分
10、析的持久性評價數據為77,明顯超過該項上限8;第一組白葡萄酒品嘗評分中酒樣品8號下9號品酒員對于口感分析的持久性評價數據為16,明顯超過該項上限8等。對這些異常數據為減少其對于總體評價結果的影響,采取預處理:取該酒樣對應誤差項目其余品酒員評價結果平均值替代該異常數據。經過數據預處理可得出每一種類葡萄酒的綜合得分,建立表1與表2。表1紅葡萄酒總得分平均值紅酒n12345678910第一組第二組746611121314151617181920第一組73第二組21222324252627第一組7873第二組72根據表1,用excel作出兩組評酒師對每一類葡相酒的評分折線圖圖1表2紅葡錮酒總得分平均值
11、0白酒n12345678910第一組8271第二組11121314151617181920第一組7274第二組2122232425262728第一組71第二組77根據表2,用excel作出兩組評酒師對每一類葡相酒的評分折線圖。圖2根據圖1、圖2可初步簡單看出兩組評酒師的評價結果存在肩顯著性差異。5.1.2葡萄酒評價結果差異性分析與可信度分析模型建立與求解(1)t檢驗模型建立首先假定兩個總體平均數間沒有顯著差異,即H。:12查T值表,比較計算得到的T值與理論T值,推斷發生日航率(一般為95%。兩個止態總體的均值檢驗模型,一、一一,、,一2一,、,一2假設X1,X2,.,Xn是來自總體N1,1的樣
12、本Y,Y2,.,Yn是來自總體N2,2的樣本,且兩樣本獨立。設1,2和12,2均未知,其檢驗問題為H0:12-XY(12)tnin22.S3,.:-一nin2當H。為真時,統計量T的計算公式tnin22.TXY53. 11,nin2式中,S3ni1Si2n21S2n1n22查T值表,比較計算得到的T值與理論T值,推斷發生卞S率(一般為95%,其中為顯著性水平,1-951000.05因此當T0.05則認為H。不成立,兩組評酒員對紅葡萄酒的評價結果有顯著性差異。(2)兩組評酒員對紅葡萄酒的評價結果比較:分別計算出n127,X73.0556,S17.3426T0.02100.05,說明該兩組評酒員對
13、紅葡萄酒的評價結果有顯著性差異。(3)兩組評酒員對白葡萄酒的評價結果比較:分別計算出n128,X73.9786,S14.8266T0.01290.05,說明該兩組評酒員對白葡萄酒的評價結果有顯著性差異。5.1.3可信度分析模型建立與求解:第k組序號為h的樣品第i個指標10位品酒師給分的平均值第k組序號為h的樣品第i個指標10位品酒師的標準差算出第k組序號為h的樣品的穩定性指標第k組紅,白葡萄酒的評分總平均穩定性指標計算求得:比較紅葡萄酒的兩組總平均穩定性指標,因為p紅1p紅2,所以第二組品酒師的評價結果更可信。同樣,比較白葡萄酒的總平均穩定性指標,因為P白1%2,所以第二組品酒師的評價結果可信
14、度更(Mlo問題二:根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級。問題二求根據釀酒葡萄的理化指標和葡萄酒的質量對釀酒葡萄進行分級,葡萄酒由釀酒葡萄釀制而成,則釀酒葡萄的質量與葡萄酒的質量有著直接的關系,則可以根據葡萄酒的質量對釀酒葡萄做一個簡單的分級,在根據主成分分析從葡萄的理化指標中篩選出對葡萄質量產生影響的主要因素,根據所得各主要因素的貢獻率給個因素加權作為系數,求出葡萄中主成分的含量,并進行排名,之后將此排名與之前根據葡萄酒質量所得出的排名綜合,進而得出較準確的對釀酒葡萄的分級。K均值法聚類分析模型k均值法的基本步驟:(1)選才¥k個葡萄酒樣品作為初始凝聚點,或者
15、將所有葡萄酒樣品分成k個初始類,然后將這k個類的重心(均值)作為初始凝聚點。(2)對除凝聚點之外的所有葡萄酒樣品逐個歸類,將每個葡萄酒樣品歸入凝聚點離它最近的那個類(通常采用歐氏距離),該類的凝聚點更新為這一類目前的均值,直至所有葡萄酒樣品都歸了類。(3)重復步驟(2),直至所有的葡萄酒樣品都不能再分配為止。最終的聚類結果在一定程度上依賴于初始凝聚點或初始分類的選擇。經驗表明,聚類過程中的絕大多數重要變化均發生在第一次再分配中。也就是:先算各類的均值再算各類中樣本到本類及其他類的均值的絕對值距離(歐氏距離)將葡萄酒樣本重新歸類到歐氏距離較小的類中(重新歸類就得算均值)首先,根據第一問得出的結果
16、,我們采用第二組評酒員的結果作為判斷葡萄酒質量的依據,根據各葡萄酒的分數,我們得出了紅葡萄酒和白葡萄酒的排名,雖然是葡萄酒質量的排名,但由于葡萄酒的質量由釀酒葡萄的質量決定,所以上表可以看作是葡萄質量的排名,以上表中葡萄酒的分數作為釀酒葡萄質量的分數,可以對釀酒葡萄作出初步的分級,針對葡萄酒的成績,我們用聚類分析的方法,得出了葡萄的初步分級,運行的得到的圖樣如下:圖3圖4根據上述結果,得出紅、白葡萄酒的等級分類,建立表3,表4.表3紅葡萄酒等級分類等級酒樣品號1,10,12,13,16,254,5,14,19,21,22,24,26,276,7,8,11,15,182,3,9,17,20,23
17、表4白葡萄酒等級分類酒樣品號5,9,10,15,17,21,22,25,281,2,3,4,6,14,18,19,20,23,24,277,8,11,12,13,2616主成分一權值分級模型雖然釀酒葡萄所對應葡萄酒的質量能在一定程度上反映釀酒葡萄的質量,但葡萄的質量還應以葡萄本身的成分來區分其級別,為了得到更準確的分級,我們又對附件中所給釀酒葡萄中的理化指標做了一些分析。為了綜合考慮釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級,將附件3中芳香物質含量總和作為一個一級理化指標,設第i個樣品葡萄理化指標得分為葡萄酒的質量總分為j,則第i個葡萄樣品的總得分0可以表示為選取一個使得樣品趨于較
18、穩定值的,此時的可作為釀酒葡萄的分級權值。(1)首先對各理化指標進行歸一化處理,釀酒葡萄一級理化指標中樣本有n個,指標有m個,分別設為X1,X2,.Xm,令Xj為第i個樣品的第j個指標。做變換得到標準化的數據矩陣N(Nj)nm,其中(2)在標準化數據矩陣N的基礎上計算個原始指標相關性系數矩陣其中r1ijn(Xki,)(XkjXj)k112(3)求相關性系數矩陣R的特征值并排序,再求出R的特征值的相應的正交單位化特征向量lj(*,l2i,.mi)T,則第i個主成分可表示為各指標Xk的線性組m合乙IkiXk。i1m計算綜合得分。首先計算得到第i個樣本中第k個主成分的得分為Fik%Xj,再j1m以個
19、主成分的方差貢獻率為權重,求得第i個樣品的綜合得分工Fikk(i1,2,.n)。i1模型求解:表5紅葡萄樣品主成份及其排序主成份序列1234567主成份花色甘繳氨酸干物質含量順式白藜產醇甘PH值多酚氧化酶活力果梗比主成份序列89主成份酪氨酸百粒質量表6紅葡萄樣品綜合得分荷樣品號綜合得分分數排序對應樣品號樣品分差值192233204225361276818911013111112213814261521165171018171927201621192224234242525142615277對綜合得分相鄰樣品分差值進行分析,當其值達到及以上,認為兩釀酒葡萄的品質差異較大,不能分在同一級,按照此方
20、法,紅葡萄可分成六級,一級到六級表示葡萄品質逐漸降低,具體情況如下表:表7紅葡萄分級結果級數紅葡萄樣品號一級923二級28111326四級521五級4710151617192425六級27本模型中主要以紅葡萄樣品的相關數據進行分級,按照同樣的方法將白葡萄的相關數據代入,求得白葡萄分級如下:表8白葡萄分級結果級數白葡圖樣品號一級27二級14101518222328三級5612131720四級231416212425五級78911195.3問題三:分析釀酒葡萄與葡萄酒的理化指標之間的聯系數據預處理標準化及綜合理化指標在處理附件2中數據時可以發現某些存在異常的數據值,如:葡
21、萄理化指標中白葡萄百粒質量的第三次檢測值為2226.1g,明顯超過其它兩次的檢測值。為避免異常數據值對分級結果的影響,取其它兩次值的平均值替代該異常值。同時對數據進行標準化處理,取其z分數:Z-:其中,x為變量值,為平均數,為標準差。Z分數表示的是此變量大于或小于平均數幾個標準差。由于z分數分母的單位與分子的單位相同,故z分數沒有單位,因而可以用Z分數來比較兩個從不同單位總體中抽出的變量值。同時將原始數據直接轉化為z分數時,常會出現負數和帶小數點的值。5.3.2多元線性回歸模型(1)模型建立觀察所給附件中的數據易知,影響釀酒葡萄與葡萄酒理化指標的因素往往不止一個,所以建立多元線性回歸模型求解釀
22、酒葡萄與葡萄酒兩者理化指標之間的聯系。設變量Y與變量Xi,X2,,Xp間有線性關系Yo1X12X2,.,PXP.式中,N0,2,o,i,.,p和2是未知參數,P20設31,為2,.,%5)-1,2,.,n是Xi,X2,.,Xp,Y的n次獨立觀測值,則多元線性模型可表小為Yi1xi12xi2,.,PxiP1,2,.,n式中,iN0,2,且獨立同分布。可用矩陣形式表示,令則多元線性模型可表示為yXo式中E0,Var21n.(2)模型求解類似于一元線性回歸,求參數的估計值,就是求最小二乘函數QyXTyX.達到最小的值,可以證明的最小二乘估計XTX1XTy.從而可得經驗回歸方程為Yo1X12X2,.,
23、pXp.將釀酒葡萄看做自變量,葡萄酒看做因變量。注意,計算時用的是經過處理后的Z分數表C我們用Xi1i30表示釀酒葡萄的30個一級指標,作為自變量X;用Yj1j9表示葡萄酒的9個一級指標,作為因變量y。其中,理化指標的編號順序依照所給附件中的大小順序。例如,紅葡萄酒中理化指標順序依次為花色甘、單寧、總酚、酒總黃酮、白藜產醇、DPP學抑制體積、L、a、b經過MATLAB回歸系數的最小二乘估計計算,得出回歸系數0,1,.,30,即自變量與因變量之間的聯系,見附表。根據回歸系數表得出兩者之間的正負相關性,其中數字為釀酒葡萄理化指標編號。表9釀酒紅葡萄與紅葡萄酒正相關回歸系數正相關花色昔單寧總酚酒總黃
24、酮白藜蘆醇DPP”抑制體積L*a*b*101017171317221317171716122210262714122044231211681616121611163054821141814209118201281420142518567105272121313442082542419167147134829812131310162815271424182419115127282824331320338328215112419599283019212977125231919131323924表10釀酒紅葡萄與紅葡萄酒負相關回歸系數負相關花色昔單寧總酚酒總黃酮白藜蘆醇DPPH抑制體積L*a*b*9
25、15196818232619292329202829271425182928730231282015925231827164242525921515617231512529251923293061115173010201527163062612721261815271511325261111301126225229223027261673028132622241429627221242110261013922221810816172411表11釀酒白葡萄與白葡萄酒正相關回歸系數正相關單寧總酚酒總黃酮白藜蘆醇DPPH抑制體積L*a*b*301830920242142216122111183023
26、32943181412152412151823179276111221620272921232313102415122151024308161628927226629112627717221410235519291152674262575912102822195142642818208510176137314262325表12釀酒白葡萄與白葡萄酒負相關回歸系數負相關單寧總酚酒總黃酮白藜蘆醇DPP年抑制體積L*a*b*125261311422728131254642321978109728716221525272622813289122911827282458152561581923312101
27、342561215161325111414271392224918202919301919522181121181710192301171430241716283329172127620162317202120201432121218245.4問題4灰色關聯度分析模型5.4.1模型的建立若要分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響,則應該先求出它們的相關性。本題應用灰色關聯度分析對系統兩者的關系進行度量。灰色綜合分析用以下模型RYW.R為M個被評價對象的綜合評價結果向量:W為N個評價指標的權重向量:E為評判矩陣。i(k)為第i個被評價對象的第k個指標與第k個最優指標的關聯系數。根據R的
28、數值,進行排序。設Fji,j2,jn,此最優序列的每個指標值可以是各個評價對象的最優值。式中jk為第i個葡萄樣品第k個指標的原始數值由于評價指標間有不同的量綱和數量級,故不能直接進行比較,因此需要對原始指標進行規范處理。則可以用下式將原始數值變成無量綱值Ck(0,1);iii.Cki=1,2,.m;k=1,2,.n.jk2jk根據灰色系統理論將C*Ci*,C;,.C:.作為參考數列將CC;,C2,.Cn作為比較數列,則用關聯分析法分別求得第i個被評價對象的第k個指標與第k個指標最優指標的關聯系數,、即:minminCKCkminminCKC:ikIkii_*._*_i.CKCkminminCK
29、CkIki上式中:(0,1),一股取0.5.這樣綜合評價的結果為:如果關聯度r最大,說明C與最優指標C最接近,據此可排出被評價對象的優劣次序。選取五種理化指標和六種葡萄酒進行研究,具體數據見表:部分理化指標數據指標葡萄樣葡萄樣葡萄樣葡萄樣葡萄樣葡萄樣品14品18品24品品4品812乙醛乙醇1-己醇1-辛醇苯乙醇13,.617minminCikKckminminX0(k)Xi(k)kiIXo(k)Xi(k)minminX°(k)Xi(k)|ki0,067_4.0617Xo(K)Xi(k)4.0617設分辨系數為將值帶人i(k)3nmax中,運用matlab求得max1 =2 =3=04
30、=0,767205=0計算關聯度R(X0,Xi),由公式110Rii(k).ni1分別計算出乙醛,乙醇,1-己醇,1-辛醇,苯乙醇的關聯度R10.9980,R24.3142,R33.7854,R43.6344,R53.2244.得出2論R2R3R4R5Ri.同理可得:白葡萄酒的關聯度大小關系為:R4R3旦R,R5.由以上說明醇類物質等理化指標對葡萄酒的質量有重要影響,然而影響葡萄及質量的因素不止這些。比如:葡萄果實中糖的成分的多少,是制約發酵后葡萄酒的酒精度的要素。因此我們建立了綜合指標評價模型來論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量。綜合指標評價模型:模型建立:綜合指標計算公式:
31、每一瓶酒對應一個綜合指標紅葡萄酒有27個綜合指標Mi(1i27)白葡萄酒有28個綜合指標Mi(1i28)模型求解:利用計算機編程求解出每瓶葡萄酒的綜合指標Mi(程序見附錄)見下表:紅葡錮酒編號分數綜合指標白葡萄酒編號分數綜合指標135115126225594333378144709245775181532614896117254077308608735913296301068810229112131150512209581230134898132841491463981587141521169516131764173761845532187723198819746720765327620152
32、11621343221322266231572320241272418425140122529261596262257279782710212812利用matlab擬合綜合指標的值與第二問中葡萄酒的分數得到下圖:紅葡萄酒:去除一個奇點后用指數函數擬合得下圖:擬合結果:f(x)=a*exp(b*x)a=+011+013,+013)b=,R-square:白葡萄酒:用指數函數擬合后如下圖:擬合結果:f(x)=a*exp(b*x)a=1215+004,+004)b=,R-square:由R-square值可以看出兩組曲線擬合的結果不好,變換擬合函數嘗試數次后所得擬合結果均不理想,因此我們認為不能定量
33、的用葡萄和葡萄酒的理化指標來評價葡萄酒的質量,只能根據圖像大致猜測綜合指標與葡萄酒的質量負相關六模型評價優點:1 .本文在建模過程中,使用了建模與軟件分析相結合的方法,提高了計算結果的準確性;2 .本文在求解是對同一問題使用兩種不同方法,使模型得出的結果更加可靠;3 .本文在建模過程中使用的方法簡單有效,在原模型的基礎上又有一定的創新。缺點:通過經驗設定綜合指標進行求解,簡化了相應的數學模型,只是缺少對綜合指標設立的檢驗,依據性不強。七參考文獻1陳光亭裘哲勇數學建模高等教育出版社2010年2月2王宏洲數學建模優秀論文清華大學出版社2011年9月3姜啟源、謝金星、葉俊,數學模型(第四版),北京:
34、高等教育出版社,2011年。4白鳳山、么煥民等,數學建模(上冊),哈爾濱:哈爾濱工業大學出版社,2003年。附錄釀酒紅葡萄與紅葡萄酒理化指標的回歸系數釀酒白葡萄與白葡萄酒理化指標的回歸系數X(j)Y(i)123456789120000000003456789101112131415161718192021222324252627282930X(j)Y(i)12345678123456789101112131415161718192021222324252627282930代碼T檢驗functionH,P,CI=ttest(X,Y)%K示在顯著性水平為下,H=1時能拒絕原假設,驗的零假設HCfe
35、兩總體均值之間不存在顯著差異%p<拒絕H0t顯著性差異%C的值小的置信區間不跨越0時說明有顯著性差異Muhat,sigmahat,muci,sigmaci=normfit(X)%Muha妁均值muci為均值置信區間%sigmahat為標準差sigmaci標準差置信區問a=Muhat;b=sigmahat;Cx=b/a%X勺變異系數Muhat,sigmahat,muci,sigmaci=normfit(Y)%Muha妁均值muci為均值置信區間%sigmahat為標準差sigmaci標準差置信區問a=Muhat;b=sigmahat;Cy=b/a%Y勺變異系數如果Cx<Cy,則說明x
36、比y更可靠ifCx<Cydisp('x比y變異系數小,更穩定,結果更可靠)elsedisp('y比x變異系數小,更穩定,結果更可靠)endend聚類分析程序:x=746672'opts=statset('Display','final');%顯示每次聚類的最終結果%將原始的5個點聚為3類,距離采用絕對值距離,重復聚類5次,顯示每次聚類的最終結果idx=kmeans(x,4,'Distance','city','Replicates',27,'Options',opts)
37、%*繪制聚類輪廓圖*x=746672'%例中的觀測數據%將原始的5個點聚為3類,距離采用絕對值距離,重復聚類5次idx=kmeans(x,4,'Distance','city','Replicates',27);S,H=silhouette(x,idx)%繪制輪廓圖,并返回輪廓值向量用口圖形句柄H%例中的觀測數據opts=statset('Display','final');%顯示每次聚類的最終結果%將原始的5個點聚為3類,距離采用絕對值距離,重復聚類5次,顯示每次聚類的最終結果idx=kmeans(x,4
38、,'Distance','city','Replicates',27,'Options',opts)%*繪制聚類輪廓圖*x=746672'%例中的觀測數據%將原始的5個點聚為3類,距離采用絕對值距離,重復聚類5次idx=kmeans(x,4,'Distance','city','Replicates',27);S,H=silhouette(x,idx)%繪制輪廓圖,并返回輪廓值向量S?口圖形句柄Htitle('聚類分析(紅葡萄酒K勻值聚類),)%為X軸加標簽主成分分析程序:PHO=;%代入數據%*調用pcacov函數根據相關系數矩陣作主成分分析*%返回主成分表達式的系數矩陣COEFF返回相關系數矩P$的特征值向量latent和主成分貢獻率向量explainedCOEFF,latent,explained=pcacov(PHO)%為了更加直觀,以元胞數組形式顯示結果result1(1,:)=特征值,差值,貢獻率,累積貢獻率;result1(2:7,1)=num2cell(latent);result1(2:6,2)=num2cell(-diff(latent);result1(2:7,3:4)=num2cell(explained,cums
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新疆烏魯木齊市高新區(新市區)2025年下學期初三期末化學試題含解析
- 新鄉醫學院《普通生物學動物部分》2023-2024學年第二學期期末試卷
- 2025至2031年中國移動式清倉鉸龍行業投資前景及策略咨詢研究報告
- 興海縣2025年數學五年級第二學期期末檢測試題含答案
- 2024屆山東省臨沭縣青云鎮中心中學中考聯考數學試題含解析
- 廣東惠州市惠陽區達標名校2024年中考數學考前最后一卷含解析
- 2024-2025項目安全培訓考試試題及完整答案1套
- 2025年新員工崗前安全培訓考試試題【名校卷】
- 2025車間安全培訓考試試題帶解析答案
- 2025年廠里職工安全培訓考試試題及答案一套
- 國開(內蒙古)2024年《經濟學與生活》形考1-3答案
- 新疆維吾爾自治區2025屆高考壓軸卷生物試卷含解析
- 《全面推進依法治國的總目標與原則》參考課件
- DL∕T 592-2010 火力發電廠鍋爐給水泵的檢測與控制技術條件
- 創業投資管理智慧樹知到期末考試答案章節答案2024年武漢科技大學
- 2024屆浙江省杭州市英特外國語學校八年級英語第二學期期末復習檢測試題含答案
- 意識與計算的理論模型
- 工程倫理案例與分析
- (附答案)2024公需課《百縣千鎮萬村高質量發展工程與城鄉區域協調發展》試題廣東公需科
- MOOC 英語暢談中國-湖北大學 中國大學慕課答案
- 2024年江蘇省常州市新北區常州外國語學校中考一模英語試題(無答案)
評論
0/150
提交評論