版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、<p><b> 模</b></p><p><b> 式</b></p><p><b> 識</b></p><p><b> 別</b></p><p><b> 結</b></p><p
2、><b> 業(yè)</b></p><p><b> 論</b></p><p><b> 文</b></p><p> ?。ú捎镁垲惙治龅姆椒▽煞N葡萄進行分類)</p><p> 學院:計算機與信息工程學院</p><p> 班級:201
3、1級通信工程班</p><p> 采用聚類分析的方法對兩種葡萄進行分類</p><p><b> 摘要</b></p><p> 根據(jù)釀酒葡萄的理化指標和葡萄酒的質(zhì)量對這些釀酒葡萄進行分級,建立聚類分析模型。首先因為樣品酒的60個指標之間具有較強的相關性,所以對變量指標進行R型聚類分析,降低變量個數(shù);然后采用Q型聚類分析對樣本進行分類。把
4、兩組樣品葡萄分為5類。紅葡萄分類結果:第一類:樣品8(反式白藜蘆醇苷指標為5.283,而其他樣品都小于1);第二類:樣品3(氨基酸指標為8397.28遠大于該指標均值2385.31)第三類:樣品10(VC含量10.25,遠大于均值0.477);第四類:樣品1、2、4、5、6、7、9、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27;第五類:酒樣品11(花色苷指標為104.92,遠大于均值7.
5、787);</p><p> 關鍵詞: R型聚類 Q型聚類 </p><p><b> 1問題分析</b></p><p> 要根據(jù)釀酒葡萄和葡萄酒的質(zhì)量的這兩種葡萄進行分級,首先對原始釀酒葡萄的理化指標數(shù)據(jù)進行整理,并把葡萄酒的平均質(zhì)量指標作為葡萄的變量指標進行考慮。由于白葡萄和紅葡萄的分析方法相同,所以我們以紅葡萄為例來進行
6、分析。</p><p> 首先定性考察反映紅葡萄指標狀況的60個方面,可以看出某些指標之間可能存在較強的相關性。比如氨基酸的總量與天門冬氨酸、蘇氨酸、絲氨酸、谷氨酸、脯氨酸、甘氨酸、丙氨酸、胱氨酸、纈氨酸、蛋氨酸、異亮氨酸、酪氨酸、苯丙氨酸、賴氨酸、組氨酸、精氨酸之間可能存在較強的相關性,白藜蘆醇與反式白藜蘆醇苷、順勢白藜蘆醇苷、反式白藜蘆醇、順勢白藜蘆醇之間可能存在較強的相關性,還原糖與果糖和葡萄糖之間存在較
7、強的相關性,為了驗證這種想法,運用MATLAB軟件計算60個指標的相關系數(shù)矩陣.</p><p> 其次由相關性矩陣可以判斷某些指標之間確實存在很強的相關性,因此可以考慮從這些指標中選取幾個有代表性的指標進行聚類分析。為此,把60個指標根據(jù)其相關性進行R型聚類,聚成20類,再從每個類中選取代表性的指標。首先對每個變量的數(shù)據(jù)分別進行標準化處理。變量間相近性度量采用相關系數(shù),類間相近性度量的計算選用類平均法,編寫M
8、ATLAB程序,從而求出聚類樹形圖。</p><p> 最后根據(jù)這20個變量指標對27中紅葡萄進行聚類分析。首先對每個變量的數(shù)據(jù)分別進行標準化處理,樣本間相似性采用歐氏距離度量,類間距離的計算選用類平均法,編寫MATLAB程序,從而得到葡萄聚類樹形圖。</p><p><b> 2模型的建立與求解</b></p><p> 根據(jù)求得的相關
9、系數(shù)矩陣,采用R型分析和Q型分析的方法對葡萄進行分類,具體的數(shù)學模型如下:</p><p> ?。?)首先對葡萄的指標進行標準化處理,然后通過下面的模型可以求出葡萄變量指標的相關系數(shù)矩陣;</p><p> (2)然后采用最短距離法求出相關系數(shù)矩陣中兩個類中最近兩點間的距離,再采用dendrogram函數(shù),即可畫出葡萄變量指標的聚類樹形圖;</p><p> 最
10、后對每個變量指標的數(shù)據(jù)分別進行標準化處理,樣本間間的相似性采用歐氏距離度量,類間距離的計算選用類平均法,然后再次使用dendrogram函數(shù)求出葡萄的聚類樹狀圖,從而得到葡萄的分類結果。</p><p><b> 3模型的結果與分析</b></p><p> 1)紅葡萄分類的結果與分析如下:</p><p> ?。?)對紅葡萄變量的聚類樹狀
11、圖:</p><p> 圖1 對紅葡萄變量的聚類樹狀圖</p><p> 由圖形和MATLAB程序可知,把葡萄的變量指標分為20類,其中還原糖,果糖,葡萄糖,可溶性物質(zhì),PH值、可滴定酸,顧酸比,干物質(zhì)含量,果穗質(zhì)量,百粒質(zhì)量,果梗比,出汁率,果皮質(zhì)量,L*,果皮顏色a+,果皮顏色b*,H,C,18個變量指標之間有較大的相關性,被聚到一起;氨基酸,脯氨酸,花色苷3個變量指標之間存在有
12、較大的相關性,被聚到一起;絲氨酸,纈氨酸,異亮氨酸,亮氨酸,賴氨酸,組氨酸,精氨酸之間存在較大的相關性,被聚成一類;白藜蘆醇和順勢白藜蘆醇苷之間存在較大的相關性,被聚成一類;黃酮醇。槲皮素,異鼠李素,總糖之間存在較大的相關性,被聚成一類;蘇氨酸,谷氨酸,丙氨酸,蘋果酸,檸檬酸,多酚氧化酶,褐變度,DPPH自由基,總酚,單寧,葡萄總黃酮之間存在較大的相關性,被聚成一類;其余各自成一類。這樣就從60個指標中選定20個分析指標,可以根據(jù)這35
13、個指標對27種紅葡萄進行聚類分析。</p><p> ?。?)27種紅葡萄聚成5類的樹狀圖</p><p> 圖2 27種紅葡萄聚成5類的樹狀圖</p><p> 由圖可知,各種紅葡萄之間存在較大的差異,可把27種葡萄分為4類,結果為:</p><p> 第一類:紅葡萄樣品8;第二類:紅葡萄樣品3;第三類:紅葡萄樣品10;第四類:紅
14、葡萄樣品1,2,4,5,6,7,9,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27;第五類:紅葡萄酒樣品11.</p><p> 從以上結果結合聚類圖中的合并距離可以看出,紅葡萄樣品8與其他樣品有非常大的不同,主要表現(xiàn)在該樣品的蘋果酸,檸檬酸,褐變度,黃酮醇,遠高于其他樣品;紅葡萄樣品3與其他樣品的情形不同,單獨聚為一類,主要表現(xiàn)在樣品3的氨基酸含量遠遠高于所有樣
15、品氨基酸含量的平均值;紅葡萄樣品10與其他樣品不同,單獨聚為一類,主要表現(xiàn)在樣品10的多酚氧化酶活力指標遠大于該指標的平均值;紅葡萄樣品11單獨聚為一類,主要在于該樣品的花色苷,白藜蘆醇,果皮顏色等偏高德緣故;其他樣品之間極為類似,所以被聚在一類。針對這種情況,廠家在購買葡萄時,應該注意挑選,以使所買葡萄包含所有的類別,以提高葡萄的市場價值。</p><p> 2、白葡萄分類結果與分析如下:</p>
16、<p> ?。?)對白葡萄變量的聚類樹狀圖:</p><p> 圖3 白葡萄變量的聚類樹狀圖</p><p> 由圖形和MATLAB程序可知,把白葡萄的變量指標分為20類,其中檸檬酸,反式白藜蘆醇苷2變量指標之間有較大的相關性,被聚到一起;白藜蘆醇,順勢白藜蘆醇苷2個變量指標之間存在有較大的相關性,被聚到一起;褐變度,順勢白藜蘆醇2個變量指標之間存在較大的相關性,被聚成一
17、類;PH值和顧酸比2個變量指標之間存在較大的相關性,被聚成一類;氨基酸總量,天門氨酸,蘇氨酸,絲氨酸,谷氨酸,脯氨酸,甘氨酸,丙氨酸,纈氨酸,蛋氨酸,異亮氨酸,亮氨酸,酪氨酸,苯丙氨酸,賴氨酸,組氨酸,精氨酸,蛋白質(zhì),酒石酸,蘋果酸,總酚,單寧,葡萄總黃酮,黃酮醇,槲皮素,山奈酚,異鼠李素,總糖,還原糖,果糖,葡萄糖,可溶性固形物,干物質(zhì)含量,L*,果皮顏色b*,H,C,這37個變量指標之間存在較大的相關性,被聚成一類。這樣就從60個指
18、標中選定20個分析指標,可以根據(jù)這20個指標對28種白葡萄進行聚類分析。</p><p> (2)28種白葡萄聚成5類的樹狀圖</p><p> 圖4 28種白葡萄聚成5類的樹狀圖</p><p> 由圖可知,各種白葡萄之間存在較大的差異,可把28種葡萄分為5類,結果為:</p><p> 第一類:白葡萄樣品21;第二類:白葡萄樣品1
19、5;第三類:白葡萄樣品11;第四類:白葡萄樣品2,3,4,5,6,7,8,9,10,11,12,13,14,16,18,19,20,22,23,24,25,26,27,28;第五類:紅葡萄酒樣品17.</p><p> 從以上結果結合結合聚類圖中的合并距離可以看出,白葡萄21與其他樣品有非常大的不同,主要表現(xiàn)在,該樣品褐變度和b*指標非常高,而葡萄總黃酮遠低于其他樣品;樣品15與其他樣品極為不同,被單獨聚為一類
20、,主要是該樣品的白藜蘆醇,果穗質(zhì)量,百粒質(zhì)量非常高的緣故;白葡萄樣品11被單獨聚為一類,主要表現(xiàn)在該樣品的固酸比,果穗質(zhì)量,L*偏高;樣品17與其他樣品不同,單獨聚為一類,主要是在該樣品的VC含量,果梗比非常高的原因;其他的樣品極為相似,被聚在一起。針對這種情況,廠家在購買葡萄時,應該注意買各種各樣的葡萄,以使所買葡萄包含所有的類別。</p><p><b> 4 模型的評價</b><
21、;/p><p> 該聚類分析模型通過R型聚類對葡萄的變量指標進行聚類,通過Q型聚類在變量指標聚類下對釀酒葡萄進行聚類,把葡萄聚成了5類,符合客觀實際。聚類前,對相關系數(shù)矩陣做了定性的分析,可看出某些變量指標之間存在存在相關性,所以首先就考慮,聚類變量,減少變量個數(shù),簡化運算,很容易得出結果。該模型還可以通過改變對葡萄的分類的大小,使分類結果更加詳細或粗略。另外,該數(shù)學模型也存在一些不足之處,例如考慮問題不太全面,模
22、型太過單一。</p><p><b> 參考文獻:</b></p><p> [1].許國根.模式識別與智能計算的MATLAB實現(xiàn)[M].北京.北京航空航天大學出版社,2012.7</p><p> [2].韓中庚.數(shù)學建模方法及其應用[M].北京.高等教育出版社,2009.6</p><p><b>
23、 程序:</b></p><p><b> ?。?)紅葡萄程序</b></p><p> function hongputao </p><p> h=xlsread('分類1紅酒') %讀入整理后的紅葡萄的數(shù)據(jù)</p><p> r=corrcoef(h)
24、 %求出讀入數(shù)據(jù)的相關系數(shù)</p><p> d=tril(r) %取出相關系數(shù)矩陣的下三角元素</p><p> for i=1:60 %對角線元素化為0</p><p><b> d(i,i)=0</b></p><p><b&
25、gt; end</b></p><p><b> d=d(:)</b></p><p> d=nonzeros(d) %取出非零元素</p><p> d=d';d=1-d;</p><p> z=linkage(d)</p><p> y=cluster
26、(z,20)</p><p> dendrogram(z,60) %畫出聚類樹狀圖</p><p> %將白葡萄的變量分為30類</p><p> dendrogram(z,60) %畫出聚類樹狀圖</p><p> ind1=find(y==20);ind1=ind1'%找出包含每一類中的來自原始數(shù)據(jù)集的對象&l
27、t;/p><p> ind2=find(y==19);ind2=ind2'</p><p> ind3=find(y==18);ind3=ind3'</p><p> ind4=find(y==17);ind4=ind4'</p><p> ind5=find(y==16);ind5=ind5'</p
28、><p> ind6=find(y==15);ind6=ind6'</p><p> ind7=find(y==14);ind7=ind7'</p><p> ind8=find(y==13);ind8=ind8'</p><p> ind9=find(y==12);ind9=ind9'</p>
29、<p> ind10=find(y==11);ind10=ind10'</p><p> ind11=find(y==10);ind11=ind11'</p><p> ind12=find(y==9);ind12=ind12'</p><p> ind13=find(y==8);ind13=ind13'<
30、/p><p> ind14=find(y==7);ind14=ind14'</p><p> ind15=find(y==6);ind15=ind15'</p><p> ind16=find(y==5);ind16=ind16'</p><p> ind17=find(y==4);ind17=ind17'
31、</p><p> ind18=find(y==3);ind18=ind18'</p><p> ind19=find(y==2);ind19=ind19'</p><p> ind20=find(y==1);ind20=ind20'</p><p> function honhputao2</p>
32、<p> h=xlsread('分類1紅酒');%輸入紅葡萄的數(shù)據(jù)</p><p> h(:,44:60)=[];%把有較大相關性的指標聚在一起</p><p> h(:,41:42)=[];</p><p> h(:,39)=[];</p><p> h(:,34)=[];</p>&l
33、t;p> h(:,24:31)=[];</p><p> h(:,22)=[];</p><p> h(:,20)=[];</p><p> h(:,17:19)=[];</p><p> h(:,14)=[];</p><p> h(:,13)=[];</p><p> h
34、(:,11)=[];</p><p> h(:,9)=[];</p><p> h(:,7)=[];</p><p> h(:,6)=[];</p><p> h=zscore(h)%對聚類后的數(shù)據(jù)進行標準化處理</p><p> y=pdist(h)</p><p> z=link
35、age(y)</p><p> y=cluster(z,5)%將紅葡萄分為5類</p><p> dendrogram(z,'average')%畫出紅葡萄的聚類樹狀圖</p><p> dendrogram(z,'average')%畫出紅葡萄的聚類樹狀圖</p><p> dendrogram(z,
36、27) %畫出紅葡萄聚類樹狀圖</p><p> ind1=find(y==5);ind1=ind1'%找出包含每一類中的來自原始數(shù)據(jù)集的對象</p><p> ind2=find(y==4);ind2=ind2'</p><p> ind3=find(y==3);ind3=ind3'</p><p>
37、ind4=find(y==2);ind4=ind4'</p><p> ind5=find(y==1);ind5=ind5'</p><p><b> ?。?)白葡萄程序</b></p><p> function baiputao1</p><p> b=xlsread('分類2白酒
38、9;) %讀入整理后的白葡萄的數(shù)據(jù)</p><p> r=corrcoef(b) %求出讀入數(shù)據(jù)的相關系數(shù)</p><p> d=tril(r) %取出相關系數(shù)矩陣的下三角元素</p><p> for i=1:60 %對角線元素化為0</p>
39、;<p><b> d(i,i)=0</b></p><p><b> end</b></p><p><b> d=d(:)</b></p><p> d=nonzeros(d) %取出非零元素</p><p> d=d';d=1-d
40、;</p><p> z=linkage(d) </p><p> y=cluster(z,20)%將白葡萄的變量分為30類</p><p> dendrogram(z,60) %畫出聚類樹狀圖</p><p> ind1=find(y==20);ind1=ind1'%找出包含每一類中的來自原始數(shù)據(jù)集的對象</p&
41、gt;<p> ind2=find(y==19);ind2=ind2'</p><p> ind3=find(y==18);ind3=ind3'</p><p> ind4=find(y==17);ind4=ind4'</p><p> ind5=find(y==16);ind5=ind5'</p>
42、<p> ind6=find(y==15);ind6=ind6'</p><p> ind7=find(y==14);ind7=ind7'</p><p> ind8=find(y==13);ind8=ind8'</p><p> ind9=find(y==12);ind9=ind9'</p><
43、;p> ind10=find(y==11);ind10=ind10'</p><p> ind11=find(y==10);ind11=ind11'</p><p> ind12=find(y==9);ind12=ind12'</p><p> ind13=find(y==8);ind13=ind13'</p>
44、;<p> ind14=find(y==7);ind14=ind14'</p><p> ind15=find(y==6);ind15=ind15'</p><p> ind16=find(y==5);ind16=ind16'</p><p> ind17=find(y==4);ind17=ind17'</
45、p><p> ind18=find(y==3);ind18=ind18'</p><p> ind19=find(y==2);ind19=ind19'</p><p> ind20=find(y==1);ind20=ind20'</p><p> function baiputao2</p><
46、p> h=xlsread('分類2白酒');%輸入白葡萄的數(shù)據(jù)</p><p> h(:,58:60)=[];%把有較大相關性的指標聚在一起</p><p> h(:,56)=[];</p><p> h(:,50)=[];</p><p> h(:,47)=[];</p><p>
47、h(:,39:46)=[];</p><p> h(:,37)=[];</p><p> h(:,32)=[];</p><p> h(:,29:31)=[];</p><p> h(:,27)=[];</p><p> h(:,25)=[];</p><p> h(:,24)=[]
48、;</p><p> h(:,11:20)=[];</p><p> h(:,2:9)=[];</p><p> h=zscore(h)%對聚類后的數(shù)據(jù)進行標準化處理</p><p> y=pdist(h)</p><p> z=linkage(y)</p><p> y=clust
49、er(z,5)%將白葡萄的變量分為30類</p><p> dendrogram(z,'average')%畫出紅葡萄的聚類樹狀圖</p><p> dendrogram(z,28) %畫出白葡萄聚類樹狀圖</p><p> ind1=find(y==5);ind1=ind1'%找出包含每一類中的來自原始數(shù)據(jù)集的對象</p&
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 關于胡克定律兩種表述的探討畢業(yè)論文
- 兩種cad軟件的優(yōu)缺點比較研究【畢業(yè)論文】
- 論文對兩種教學場景的思考
- 生物科學畢業(yè)論文兩種蝦虎魚cytb基因序列分析
- 兩種典型分類算法的改進
- 兩種不同VTO分析方法的比較分析.pdf
- 1畢業(yè)論文-柴油機燃油供給兩種控制模式對比分析
- 兩種典型分類算法的改進.pdf
- 兩種重金屬離子對斑馬魚的急性毒性研究【畢業(yè)論文】
- 兩種債券投資分析方法研究.pdf
- 23085.兩種改進的同倫分析方法
- 兩種癌癥的代謝輪廓分析方法研究.pdf
- 傳播效果的兩種研究方法
- 兩種創(chuàng)建卡包的方法
- 兩種減小ppt大小的方法
- 兩種主要的皮衣清洗方法
- 兩種cad軟件的優(yōu)缺點比較研究【開題報告+文獻綜述+畢業(yè)論文】
- 兩種新的othr轉(zhuǎn)換方法
- 利率的兩種計算方法
- 對兩種無網(wǎng)格方法的研究和評價.pdf
評論
0/150
提交評論