




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、葡萄酒的評價摘要葡萄擁有很高的營養價值,本文通過對葡萄酒的評價,以及釀酒葡萄和葡萄酒的理化指標之間的關系進行討論分析,對不同的釀酒葡萄進行了分類,并更深入討論兩者的理化指標是否影響葡萄酒質量。針對問題一,我們首先分別計算每類葡萄酒樣品在兩組組評酒師評價下的綜合得分,以此作為每組評酒師的最終評價結果。再運用統計學中的T檢驗進行假設與檢驗,得出兩組評價結果具有顯著性差異。最后通過計算各組評價員的評價結果的標準差,以此推算穩定性指標值P,P值較大的可信度較高,得出P小與PP,進而得出第二組的評價結果更加可信。紅1紅2白1白2針對問題二,我們分別對兩組葡萄進行分類。在這里我們采用聚類分析法和主成分分析
2、法,在matlab中實現對釀酒葡萄的分類。針對問題三,根據Z=口對附件2中的數據進行標準化處理,排除單位不同的影響。以釀o酒葡萄的30個一級理化指標作為自變量X,葡萄酒9個一級的理化指標作為因變量y,建立多元線性回歸模型y二XP+8,得出釀酒葡萄的理化指標與葡萄酒的理化指標之間的聯系即回歸系數矩陣0。針對問題四,用灰色關聯度分析對兩者的關系進行度量,求得理化指標對樣品酒的的關聯系數。然后根據葡萄酒綜合得分及指標的相關系數得出樣品酒的綜合指標,通過MATLAB軟件對綜合指標與第二問中葡萄酒的分數進行指數擬合,擬合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指標來評價葡萄酒的質量,只能根據圖像大致
3、猜測綜合指標與葡萄酒的質量負相關。關鍵詞:T檢驗聚類分析法主成分分析法Z分數多元線性回歸一、問題重述確定葡萄酒質量時一般是通過聘請一批有資質的評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質量。釀酒葡萄的好壞與所釀葡萄酒的質量有直接的關系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質量。附件1給出了某一年份一些葡萄酒的評價結果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數據。請嘗試建立數學模型討論下列問題:分析附件1中兩組評酒員的評價結果有無顯著性差異,哪一組結果更可信根據釀酒葡萄的理化指標和葡萄酒的質量
4、對這些釀酒葡萄進行分級。分析釀酒葡萄與葡萄酒的理化指標之間的聯系。分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量二、問題分析葡萄酒的評價是一個復雜的過程,需要綜合考慮不同評價員的評分,而且葡萄酒和葡萄的組成成分非常復雜,它們也要影響葡萄酒的質量,對如此繁多的數據,我們就必須依靠計算機工具,運用數學統計學知識對它們進行處理,并找出各個含量之間的關系,聯系生活實際,對葡萄酒作出有理有據的評價。對于問題一:要想得到兩組評價員的評價結果有無顯著差異,并對它們的可靠性作出判斷,我們首先就應該將兩組評價員的對27組紅葡萄酒和28組白葡萄酒的評價結果整
5、理出來,求得葡萄酒的綜合得分,再運用統計學中的T檢驗進行假設與檢驗,判斷兩組是否存在顯著性差異,再通過計算各組評價員的評價結果的標準差和穩定性指標,進而判斷誰的結果更加可信。對于問題二:需要對葡萄進行分級,由于葡萄酒的質量與釀酒葡萄的好壞有直接關系,所以我們可以根據葡萄酒的質量對釀酒葡萄做一個簡單的分級,之后,我們用主成分分析法算出每一組樣本葡萄的哪些指標該葡萄的主成分,然后通過數據分析判斷出這些成分哪些對葡萄酒的質量作出了貢獻,篩選出主要成分后,對不同葡萄的成分做加權求和,以此作為葡萄分級的另一個依據。對于問題三:要想得到葡萄與葡萄酒的指標間的聯系,即得到它們之間的函數關系表達式,必須求出兩
6、者指標之間的相關系數。但是,由于它們各自的指標太多,此處僅以一級指標作為相關因素進行分析。令釀酒葡萄的30個一級指標作為自變量,葡萄酒的9個一級指標作為因變量,建立線性回歸模型,通過最小二乘法計算出回歸系數,即釀酒葡萄的指標與葡萄酒的指標間的相關性。對于問題四:題中想要求出理化指標對質量的影響,即各理化指標與質量的線性或非線性關系,但是,由于理化指標太多,并且并非沒個理化指標都會對葡萄酒的質量造成影響,所以首先必須進行數據的篩選,這里我們使用SPSS軟件進行典型相關性分析,找出哪些指標與質量有較大的關系,然后將這些指標設為自變量,將質量設為因變量,對它們進行多元線性擬合,最后得到一個多元表達式
7、以后,我們就可以通過這個方程來對葡萄酒的質量進行驗證,如果驗證的結果與評價員打分的結果基本吻合的話,就說明可以用葡萄與葡萄酒的理化指標來對葡萄酒的質量進行評價。三、基本假設1、假設評酒員對每種葡萄酒的評價結果是大致符合正態分布的;2、假設釀酒葡萄與葡萄酒中的芳香物質主要成分是:低醇、酯類、苯等,其余成份忽略;3、假設釀酒葡萄與葡萄酒的理化指標中一級指標為主要影響。4、假設釀酒葡萄中存在的而葡萄酒中不存在的理化指標也會影響葡萄酒的理化指標及質量;5、假設不考慮多種葡萄可制成一種酒,只考慮一種葡萄制成一種酒;6、假設只考慮紅葡萄制成紅葡萄酒,白葡萄制成白葡萄酒,忽略去皮紅葡萄可釀制白葡萄酒;7、假
8、設質量高的葡萄酒一定由質量好的釀酒葡萄制成,但是質量好的釀酒葡萄不一定能釀制成質量高的葡萄酒;8、A表示第i瓶酒的第j個指標無量綱化后的值ij9、B表示第i種釀酒葡萄的第j個指標無量綱化后的值ij10、M表示第i瓶酒的綜合指標i四符號說明T:統計量Ta:khj第k組序號為h的樣品第i個指標第j個品酒師的給分a:序號為h的樣品中第i個指標第k組10位品酒師給分的平均值khi第k組第i個指標所占權重Skhi:第k組序號為h的樣品第i個指標10位品酒師評分的標準差bkix:kh第k組序號為h的樣品的穩定性指標p:紅kP:白k第k組紅葡萄酒的評分總平均穩定性指標第k組白葡萄酒的評分總平均穩定性指標Xi
9、j:為第i個樣品的第j個指標:第i個葡萄樣品的總得分第i個樣品葡萄理化指標得分為i其中:第一個指標指澄清度,第二個指標指色調,第三個指標指香氣純正度,第四個指標指香氣濃度,第五個指標指香氣質量,第六個指標指口感純正度,第七個指標指口感濃度,第八個指標指持久性,第九個指標指口感質量,第十個指標指平衡/整體評價。五模型建立與求解1問題一:葡萄酒評價結果的顯著性差異及可信度分析5.1.1葡萄酒評價結果數據預處理對附件1中數據通過Excel篩選觀察時可發現某些數據錯誤,如:第一組紅葡萄酒品嘗評分中酒樣品20號下4號品酒員對于外觀分析的色調評價數據缺失;第一組白葡萄酒品嘗評分中酒樣品3號下7號品酒員對于
10、口感分析的持久性評價數據為77,明顯超過該項上限8;第一組白葡萄酒品嘗評分中酒樣品8號下9號品酒員對于口感分析的持久性評價數據為16,明顯超過該項上限8等。對這些異常數據為減少其對于總體評價結果的影響,采取預處理:取該酒樣對應誤差項目其余品酒員評價結果平均值替代該異常數據。經過數據預處理可得出每一種類葡萄酒的綜合得分,建立表1與表2。表1紅葡萄酒總得分平均值紅酒n12345678910第一組第二組746611121314151617181920第一組73第二組21222324252627第一組7873第二組72根據表1,用excel作出兩組評酒師對每一類葡萄酒的評分折線圖。圖1表2紅葡萄酒總得
11、分平均值白酒n12345678910第一組8271第二組11121314151617181920第一組7274第二組2122232425262728第一組71第二組77根據表2,用excel作出兩組評酒師對每一類葡萄酒的評分折線圖。圖2根據圖1、圖2可初步簡單看出兩組評酒師的評價結果存在有顯著性差異512葡萄酒評價結果差異性分析與可信度分析模型建立與求解t檢驗模型建立首先假定兩個總體平均數間沒有顯著差異,即H:卩二卩012查T值表,比較計算得到的T值與理論T值,推斷發生概率(一般為95%)。兩個正態總體的均值檢驗模型是來自總體N(卩Q222的樣本,假設X,X,,X是來自總體N(Q2)的樣本Y,
12、Y,,Y且兩樣本獨立。設卩,卩和Q2Q2均未知,其檢驗問題為212 HYPERLINK l bookmark6 o Current Document 且x_Y:(片-巴)Gi1112S+-3nnY12tCn+n-2).12當H為真時,統計量T的計算公式0o11S+-3nn12t(n+n-1212n1112n式中,c,i,(n-1)S2+(n-1)S2S=112缶.3n+n-2112查T值表,比較計算得到的T值與理論T值,推斷發生概率(一般為95%),其中a為顯著性水平,a二1-95100二0.05因此當|T|0.05則認為H不成立,兩組評酒員對紅葡萄酒的評價結果有顯著性差異。(2)兩組評酒員對
13、紅葡萄酒的評價結果比較:分別計算出n二27,X二73.0556,S二7.342611T=0.02100.05,說明該兩組評酒員對紅葡萄酒的評價結果有顯著性差異。(3)兩組評酒員對白葡萄酒的評價結果比較:分別計算出n二2&X二73.9786,S二4.826611T=0.01291.1,再求出R的特征值的相應的正交單位化特征向量1=(i,1,1)T,則第i個主成分可表示為各指標X的線性組合z=IX。kii1i2imikiki=1計算綜合得分。首先計算得到第i個樣本中第k個主成分的得分為FIX,ikkijj=1再以申個主成分的方差貢獻率為權重,求得第i個樣品的綜合得分f=F九(i=l,2,.n)。i
14、ikki=1模型求解:主成份序列1234567主成份花色苷纈氨酸干物質含量順式白藜蘆醇苷PH值多酚氧化酶活力果梗比主成份序列89主成份酪氨酸百粒質量表5紅葡萄樣品主成份及其排序表6葡萄樣綜合得紅品分葡萄樣品號綜合得分分數排序對應樣品號樣品分差值1922332042253612768189110131111122138142615211651710181719272016211922242342425不能分在同一級,按照此方法,紅葡萄可分成六級,一級到六級表示葡萄品質逐漸降低,具體情況如下表:表7紅葡萄分級結果級數紅葡萄樣品號一級923二級28111326四級521五級
15、4710151617192425六級27本模型中主要以紅葡萄樣品的相關數據進行分級,按照同樣的方法將白葡萄的相關數據代入,求得白葡萄分級如下:表8白葡萄分級結果級數白葡萄樣品號一級27二級14101518222328三級5612131720四級231416212425五級78911195.3問題三:分析釀酒葡萄與葡萄酒的理化指標之間的聯系數據預處理標準化及綜合理化指標在處理附件2中數據時可以發現某些存在異常的數據值,如:葡萄理化指標中白葡萄百粒質量X|LXa的第三次檢測值為2226.lg,明顯超過其它兩次的檢測值。為避免異常數據值對分級結果的影響,取其它兩次值的平均值替代該異常值。同時對數據進
16、行標準化處理,取其z分數:Z=其中,X為變量值,卩為平均數,a為標準差。Z分數表示的是此變量大于或小于平均數幾個標準差。由于z分數分母的單位與分子的單位相同,故z分數沒有單位,因而可以用Z分數來比較兩個從不同單位總體中抽出的變量值。同時將原始數據直接轉化為z分數時,常會出現負數和帶小數點的值。5.3.2多元線性回歸模型模型建立觀察所給附件中的數據易知,影響釀酒葡萄與葡萄酒理化指標的因素往往不止一個,所以建立多元線性回歸模型求解釀酒葡萄與葡萄酒兩者理化指標之間的聯系。設變量Y與變量X,X,,X間有線性關系12Py二B+Bx+px,+px+8.01122PP式中,8NCq2)B,B,,B和b2是未
17、知參數,P2。01P設(x,x,,x,y),i二1,2,.,n是(X,X,,X,Y)的n次獨立觀測值,則多元線性模型可表示i1i2ipi12P為yB+Bx+Bx,+Bx+8i=1,2,.,ni01i12i2PiPi式中,8GN2),且獨立同分布。可用矩陣形式表示,令i則多元線性模型可表示為yXB+8。式中E(8)=0,Var(8)=b2/.n模型求解類似于一元線性回歸,求參數的估計值,就是求最小二乘函數Q)-(y-XB)t(y-XB).達到最小的B值,可以證明的最小二乘估計B(XtXXty.從而可得經驗回歸方程為P-卩+卩x+卩x,.,+px.01122PP將釀酒葡萄看做自變量,葡萄酒看做因變
18、量。注意,計算時用的是經過處理后的z分數表。我們用X(1i30)表示釀酒葡萄的30個一級指標,作為自變量X;用Y.(1jRRRR.23451同理可得:白葡萄酒的關聯度大小關系為:RRRRR.43215由以上說明醇類物質等理化指標對葡萄酒的質量有重要影響,然而影響葡萄及質量的因素不止這些。比如:葡萄果實中糖的成分的多少,是制約發酵后葡萄酒的酒精度的要素。因此我們建立了綜合指標評價模型來論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量。綜合指標評價模型:模型建立:綜合指標計算公式:每一瓶酒對應一個綜合指標紅葡萄酒有27個綜合指標M(1i27)i白葡萄酒有28個綜合指標M(1i28)i模型求解:利
19、用計算機編程求解出每瓶葡萄酒的綜合指標M(程序見附錄)見下表:i紅葡萄酒編號分數綜合指標白葡萄酒編號分數綜合指標1351151262255943333781447092457751815326148961172540773086087359132963010688102291121311505122095812301348981328414914639815871415211695161317641737618455321877231988197467207653276201521162134322132226623157232024127241842514012252926159626225
20、7279782710212812利用matlab擬合綜合指標的值與第二問中葡萄酒的分數得到下圖:紅葡萄酒:去除一個奇點后用指數函數擬合得下圖擬合結果:f(x)a=b=R-square:=a*exp(b*x)+011+013,+013)白葡萄酒:用指數函數擬合后如下圖:擬合結果:f(x)=a*exp(b*x)a=1215+004,+004)b=,R-square:由R-square值可以看出兩組曲線擬合的結果不好,變換擬合函數嘗試數次后所得擬合結果均不理想,因此我們認為不能定量的用葡萄和葡萄酒的理化指標來評價葡萄酒的質量,只能根據圖像大致猜測綜合指標與葡萄酒的質量負相關六模型評價優點:1本文在建
21、模過程中,使用了建模與軟件分析相結合的方法,提高了計算結果的準確性;本文在求解是對同一問題使用兩種不同方法,使模型得出的結果更加可靠;本文在建模過程中使用的方法簡單有效,在原模型的基礎上又有一定的創新。缺點:通過經驗設定綜合指標進行求解,簡化了相應的數學模型,只是缺少對綜合指標設立的檢驗,依據性不強。七參考文獻陳光亭裘哲勇數學建模高等教育出版社2010年2月王宏洲數學建模優秀論文清華大學出版社2011年9月姜啟源、謝金星、葉俊,數學模型(第四版),北京:高等教育出版社,2011年。白鳳山、么煥民等,數學建模(上冊),哈爾濱:哈爾濱工業大學出版社,2003年。附錄6o00o00Oz9O9LQOL
22、Q寸O寸CQOCOCS1OCM1HOiHXXTCMCO寸L09006Oji11CMJicoL0ji00T6To0TCMCMCMCOCM寸CML0CM9CMZCM00CM6CMOCOL)LlXAL)LlXAsff回呂榮型芒圉薛山坷Bsmsff回呂榮snllfwBsy坷薛0代碼T檢驗functionH,P,CI=ttest(X,Y)%H表示在顯著性水平為下,H=1時能拒絕原假設,驗的零假設H0為兩總體均值之間不存在顯著差異%p拒絕HO有顯著性差異%Cl均值口的置信區間不跨越0時說明有顯著性差異Muhat,sigmahat,muci,sigmaci=normfit(X)%Muhat為均值muci為均
23、值置信區間%sigmahat為標準差sigmaci標準差置信區間a=Muhat;b=sigmahat;Cx=b/a%X的變異系數Muhat,sigmahat,muci,sigmaci=normfit(Y)%Muhat為均值muci為均值置信區間%sigmahat為標準差sigmaci標準差置信區間a=Muhat;b=sigmahat;Cy=b/a%Y的變異系數如果CxCy,則說明x比y更可靠ifCxCydisp(x比y變異系數小,更穩定,結果更可靠)elsedisp(y比x變異系數小,更穩定,結果更可靠)endend聚類分析程序:x=746672;opts=statset(Display,fi
24、nal);%顯示每次聚類的最終結果%將原始的5個點聚為3類,距離采用絕對值距離,重復聚類5次,顯示每次聚類的最終結果idx=kmeans(x,4,Distance,city,Replicates,27,Options,opts)%*繪制聚類輪廓圖*x=746672;%例中的觀測數據%將原始的5個點聚為3類,距離采用絕對值距離,重復聚類5次idx=kmeans(x,4,Distance,city,Replicates,27);S,H=silhouette(x,idx)%繪制輪廓圖,并返回輪廓值向量S和圖形句柄H%例中的觀測數據opts=statset(Display,final);%顯示每次聚類
25、的最終結果%將原始的5個點聚為3類,距離采用絕對值距離,重復聚類5次,顯示每次聚類的最終結果idx=kmeans(x,4,Distance,city,Replicates,27,Options,opts)%*繪制聚類輪廓圖*x=746672;%例中的觀測數據%將原始的5個點聚為3類,距離采用絕對值距離,重復聚類5次idx=kmeans(x,4,Distance,city,Replicates,27);S,H=silhouette(x,idx)%繪制輪廓圖,并返回輪廓值向量S和圖形句柄Htitle(聚類分析(紅葡萄酒K均值聚類)%為X軸加標簽主成分分析程序:PHO=;%代入數據%*調用pcaco
26、v函數根據相關系數矩陣作主成分分析*%返回主成分表達式的系數矩陣COEFF,返回相關系數矩陣的特征值向量latent和主成分貢獻率向量explainedCOEFF,latent,explained=pcacov(PHO)%為了更加直觀,以元胞數組形式顯示結果result1(1,:)=特征值,差值,貢獻率,累積貢獻率;result1(2:7,1)=num2cell(latent);result1(2:6,2)=num2cell(-diff(latent);result1(2:7,3:4)=num2cell(explained,cumsum(explained)%以元胞數組形式顯示主成分表達式s=;x1:;x2:;x3:;x4:;x5:;x6:,x7:,x8:;result2(1,2:4)=Prin1,Prin2,Prin3;result2(2:7,2:4)=num2cell(COEFF(:,1:3)回歸系數求解functionbeta_hat,Y_hat,sta
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年法律專業入學考試試題及答案
- 2025年初中歷史知識點復習考試卷及答案
- 2025年電氣工程技術專業考試試題及答案
- 2025年中國冷滴塔行業市場全景分析及前景機遇研判報告
- 2024年度浙江省二級注冊建筑師之法律法規經濟與施工通關題庫(附答案)
- DB43-T 2859-2023 洪桉樟扦插育苗和栽培技術規程
- 統編版二年級下冊語文期末學情調查卷 (含答案)
- 愛眼日教育活動
- 兒科肺炎健康宣教
- 鋼軌打磨車的工作總結
- 2025年福建省中考道德與法治試卷真題(含標準答案)
- 工程中機電設備安裝與調試技術
- 2025年萬家寨水務控股集團及所屬企業招聘筆試參考題庫含答案解析
- 懸挑式鋼管腳手架專項施工方案
- 2025年湖北襄陽市檢察機關-襄陽市城郊地區檢察院招聘67人歷年真題
- 2025年勞動合同樣本(電子版)
- 《一級學科下屬專業證明模板》
- Stein-膀胱癌淋巴清掃資料課件
- 小柳樹和小棗樹(1)
- 市場營銷學期末復習題知識分享
- 大客戶銷售實戰技巧PPT
評論
0/150
提交評論