

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、<p> 2012高教社杯全國大學生數學建模競賽</p><p><b> 承 諾 書</b></p><p> 我們仔細閱讀了中國大學生數學建模競賽的競賽規(guī)則。</p><p> 我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網上咨詢等)與隊外的任何人(包括指導教師)研究、討論與賽題有關的問題。&
2、lt;/p><p> 我們知道,抄襲別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料(包括網上查到的資料),必須按照規(guī)定的參考文獻的表述方式在正文引用處和參考文獻中明確列出。</p><p> 我們鄭重承諾,嚴格遵守競賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為,我們將受到嚴肅處理。</p><p> 我們授權全國大學生數學建模競賽組委
3、會,可將我們的論文以任何形式進行公開展示(包括進行網上公示,在書籍、期刊和其他媒體進行正式或非正式發(fā)表等)。</p><p> 我們參賽選擇的題號是(從A/B/C/D中選擇一項填寫): A </p><p> 我們的參賽報名號為(如果賽區(qū)設置報名號的話): 3776 </p>&l
4、t;p> 所屬學校(請?zhí)顚懲暾娜?廣東商學院 </p><p> 參賽隊員 (打印并簽名) :1. </p><p> 2.
5、 </p><p> 3. </p><p> 指導教師或指導教師組負責人 (打印并簽名): </p><p> 日期: 2012 年 9 月 10
6、日</p><p> 賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):</p><p> 2012高教社杯全國大學生數學建模競賽</p><p><b> 編 號 專 用 頁</b></p><p> 賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):</p><p> 賽區(qū)評閱記錄(可供賽區(qū)評閱
7、時使用):</p><p> 全國統(tǒng)一編號(由賽區(qū)組委會送交全國前編號):</p><p> 全國評閱編號(由全國組委會評閱前進行編號):</p><p> 釀酒葡萄與葡萄酒的評價</p><p><b> 摘要</b></p><p> 對葡萄酒和釀酒葡萄的指標、質量進行評價對于發(fā)展葡
8、萄酒行業(yè)和消費者都具有重要意義,本文就葡萄酒和釀酒葡萄的指標、質量進行研究分析。</p><p> 對兩組評酒員對酒質量的評價差異以及評價結果可信度進行分析,選用t檢驗和非參數檢驗結合總-分-總的分析思路進行分析,首先對兩組數據分別對紅、白葡萄酒進行t檢驗,得到兩組總分均值評價均無顯著差異的結果,然后對每一個酒樣品的所得總分進行t檢驗和參數檢驗,發(fā)現紅葡萄酒樣品12、23號以及白葡萄酒樣品12、27的評價結果有
9、顯著差異。因此,兩組評酒員在所有酒的總體評價是沒有明顯差異的,個別酒樣品評價存在差異。最后對總體均值和方差穩(wěn)定性進行分析,可知第二組的評價結果比較穩(wěn)定,具有較高的可靠性。</p><p> 考慮根據葡萄的理化指標和葡萄酒的質量對葡萄進行分級,首先選用系統(tǒng)聚類的最短距離法、最長距離法、ward法分別對釀酒葡萄進行分類,根據組內組間區(qū)別度對三者的結果進行比較選取,進一步考慮每一類別的葡萄酒質量分數均值大小,均值越大
10、則等級越高,比較結果可知ward法的分類較優(yōu),特等的有10個,一等的有12個,二等的就有1個,三等的則有4個。</p><p> 研究葡萄酒和釀酒葡萄的理化指標聯系,選用逐步回歸模型分別建立每一個葡萄酒的理化指標和葡萄理化指標之間的線性關系,在建立線性方程的同時逐步篩選出顯著性不強的自變量,最后得到的17條線性方程分別描述了紅、白葡萄酒指標和葡萄指標的函數關系。</p><p> 分析
11、葡萄酒和葡萄的理化指標對葡萄酒質量的影響,首先利用主成分分析法簡化理化指標和芳香物質指標,進一步,利用多元線性回歸建立理化指標和芳香物質對葡萄酒的質量的一個線性方程,從各指標系數的大小分析各指標在評價中所占的權重,可以得出:理化指標對酒質有重要影響,但芳香物質的權重比較大,紅、白葡萄酒和葡萄的芳香物質權重之和分別占33.3%和28.13%,因此,不能光憑理化指標評價酒質,還需考慮芳香物質的影響。</p><p>
12、 關鍵詞:t檢驗 理化指標 聚類分析 逐步回歸 主成分分析模型 多元線性回歸 </p><p><b> 問題重述</b></p><p><b> 背景資料與條件</b></p><p> 確定葡萄酒質量時一般是通過聘請一批有資質的評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總
13、分,從而確定葡萄酒的質量。釀酒葡萄的好壞與所釀葡萄酒的質量有直接的關系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質量。</p><p><b> 需要解決的問題</b></p><p> 結合附件1給出了某一年份一些葡萄酒的評價結果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數據,建立數學模型討論下列問題:</p>
14、<p> 1. 分析附件1中兩組評酒員的評價結果有無顯著性差異,哪一組結果更可信?</p><p> 2. 根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級。</p><p> 3. 分析釀酒葡萄與葡萄酒的理化指標之間的聯系。</p><p> 4.分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響,并論證能否用葡萄和葡萄酒的理化指標來
15、評價葡萄酒的質量?</p><p><b> 問題分析</b></p><p> 對于問題一,分析兩組評酒員的評價結果有無顯著性差異,把各單項所得分數之和作為單個評價人員對葡萄酒的質量評價。采用總-分-總的模型結構對兩組人員的評分差異進行分析??紤]到本文所涉及的分析對象屬于小樣本,而小樣本的正態(tài)性檢驗尤為重要,故先在總體上把兩組紅酒樣本的評分均值選用t檢驗或者非參
16、數檢驗進行差異性分析,再進一步對紅、白葡萄酒的每種酒樣品分別選用t檢驗或非參數檢驗進行差異性分析,得出每種酒的兩組評分差異分析結果,最后對兩組評價結果在紅、白葡萄酒的變異系數與方差穩(wěn)定性關系進行分析,從而判定哪一組的結果是可信的。</p><p> 對于問題二,根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級。考慮到系統(tǒng)聚類分析就是將性質比較相近的兩類合并為一類,并不斷合并最終得到幾個比較合理的類別。
17、故本文先根據葡萄的理化指標選用聚類分析把葡萄進行分類,把多個按照不同分類原則(不同的距離計算的聚類方法以及度量標準)分類所得的結果進行比較,選取最切合實際情況的分類情況,再結合葡萄酒的質量對已分類的類別進行等級評定。</p><p> 對于問題三,分析酒和葡萄的理化指標的聯系,首先考慮的是能否建立精確的線性關系,而逐步回歸模型既能建立多變量的線性關系也能在建立過程不斷對自變量進行檢驗篩選,故選擇逐步線性回歸模型
18、分別對每一個葡萄酒的理化指標和所有的葡萄理化指標進行回歸分析,建立線性關系,在建立的同時對顯著性不大的葡萄指標進行淘汰。以上分析均對紅葡萄酒和白葡萄酒分別進行。</p><p><b> 基本假設</b></p><p> 1)假設問題一的評價分數只受評價人員和酒的差異影響;</p><p><b> 2)假定;</b&g
19、t;</p><p> 3)評酒員在對葡萄酒進行品嘗后對其分類指標打分并求和,所得的總分可視為葡萄酒的質量。</p><p><b> 符號說明</b></p><p> :第類葡萄酒第組評酒員打分的組數</p><p> ?。旱陬惼咸丫频诮M評酒員打分總評的標準差</p><p> ?。旱陬?/p>
20、葡萄酒第組評酒員打分總評的均值</p><p> ?。海旱陬惼咸丫频诮M評酒員打分總評的樣本方差</p><p> :兩樣本均值差的抽樣分布方差</p><p> ?。旱陬惼咸丫频诮M評酒員打分的變異系數</p><p><b> :最短或最長距離</b></p><p><b> ?。?/p>
21、回歸平方和</b></p><p> ?。杭尤氲趥€變量的平方和</p><p><b> :殘差</b></p><p><b> ?。嚎倶颖緮?lt;/b></p><p><b> :現有自變量數</b></p><p><b>
22、 模型的建立與求解</b></p><p><b> 5.1問題一</b></p><p> 先對紅、白葡萄酒分別進行總的差異性分析(把各個酒樣本的平均分作為個體),再局部到每一個酒樣品的兩組評價結果差異分析,最后再結合總體綜合均值和方差穩(wěn)定性來確定評分比較可靠的一組。根據這樣的總-分-總形式構造以下兩個模型對問題一求解。</p>&l
23、t;p> 5.1.1 模型一:基于t檢驗和非參數檢驗的評分差異分析模型</p><p> (一)模型建立及求解</p><p> 模型思想[1]:本文將每類葡萄酒兩組評分分成兩個總體,通過t檢驗對兩個樣本總體數據進行差異顯著性分析,前提必須滿足三個條件:①兩個樣本要滿足正態(tài)分布;②兩個樣本的方差齊性;③兩個樣本要相互獨立,即從一總體中抽取一批樣本對從另一總體中抽取一批樣本沒有任
24、何影響。從而提出原假設,構建一個t分布求得拒絕域,根據拒絕域判定原假設是否成立,得出兩組評分有無顯著性差異。</p><p><b> 1.正態(tài)性檢驗</b></p><p> 正態(tài)性檢驗:根據表1,并且,選用建立在次序統(tǒng)計量基礎上的夏皮洛-威爾克檢驗方法進行檢驗,可以選用spss軟件計算出統(tǒng)計量W的值,最后根據求得的概率值與進行比較,如果比大則符合正態(tài)性分布,否
25、則拒絕原假設。</p><p> 表1 正態(tài)性分布檢驗的方法比較</p><p><b> 2.方差齊次性檢驗</b></p><p> 提出原假設:兩總體方差相等即,并選擇Levene檢驗方法,根據最終求得的P值與進行比較,若P>0.05,則滿足方差齊次性,否則不滿足方差其次性。在不滿足方差其次性的情況下則舍棄①式選擇④式。<
26、;/p><p> 3. 兩獨立樣本t檢驗</p><p><b> (1)提出零假設</b></p><p> 兩獨立樣本T檢驗的原假設為:兩總體均值無顯著差異。表述為:</p><p> 分別為第類葡萄酒中第一組和第二組酒總評分的均值。(記第1類葡萄酒為紅葡萄酒,第2類為白葡萄酒)</p><p
27、> ?。?)選擇檢驗統(tǒng)計量</p><p> 對兩總體均值差的推斷是建立在來自兩個總體樣本均值差的基礎之上的,也就是希望利用兩組樣本均值的差去估計量總體均值的差。因此,應關注兩樣本均值的抽樣分布。當兩總體分布分別為和時,兩樣本均值差的抽樣分布仍為正態(tài)分布,該正態(tài)分布的均值為,方差為。在不同的情況下,有不同的計算方式。</p><p> 第一種情況:當兩總體方差未知且相等,即時,采
28、用合并的方差作為兩個總體方差的估計,數學定義為</p><p><b> ?、?lt;/b></p><p> 式中,,分別為第類葡萄酒中第一組和第二組酒樣本的方差;,分別為第類葡萄酒中第一組和第二組樣本的樣本數。此時兩樣本均值差的抽樣分布的方差為</p><p><b> ?、?lt;/b></p><p>
29、; 第二種情況:當兩總體方差未知且不相等,即時,分別采用各自的方差,此時兩樣本均值差的抽樣分布的方差為:</p><p> ③ </p><p> 于是,兩總體均值差檢驗的檢驗統(tǒng)計量為統(tǒng)計量,數學定義為:</p><p><b> ?、?lt;/b></p><p&
30、gt; 在第一種情況下,統(tǒng)計量服從個自由度的分布;在第二種情況下,服從修正自由度的分布,修正的自由度定義為</p><p><b> ?、?lt;/b></p><p> 由于各分類指標進行加總求均值之后消除了每種酒樣品之間以及每種酒樣品中每位評酒員評價總分之間的個體差異性可能導致兩組不存在顯著性差異。</p><p><b> 表3
31、 獨立樣本檢驗</b></p><p> 應用模型一將每類葡萄酒的每個評價員的兩組評分分成兩個總體,通過t檢驗對兩個樣本總體數據進行差異顯著性分析,前提仍必須滿足三個條件。 </p><p> 下邊以紅葡萄酒樣品1為例進行t檢驗</p><p><b> 1.T檢驗的圖片:</b></p><p>
32、對紅葡萄酒樣品1的第一組評價質量分數進行K-S正態(tài)性檢驗結果如表1-3.</p><p> 從表1可知,在紅葡萄酒1的第一組人員的評價中可以看到,在10個評價結果當中沒有一個人的評價結果缺失率是0%,即沒有人的評價結果是被排除的,就是說十個人的評價結果都是有效的。</p><p> 如果某分布的偏度和峰度均為0時,則該分布呈正態(tài),若偏度>0時,分布呈正偏態(tài),偏度<0時,分布
33、呈負偏態(tài),時,峰度>0曲線比較陡峭,峰度<0時曲線比較平坦。從表2可以看出,統(tǒng)計量的偏度>0,峰度<0,則說明分布是正偏態(tài),較平坦。</p><p><b> 表5 正態(tài)性檢驗</b></p><p> 從上表可以看出,用S-W檢驗方法進行檢驗的結果是sig的值0.636>0.05,所以可以說明該分布服從正態(tài)分布。</p>
34、<p> 通過正態(tài)性檢驗可以得到除表6不符正態(tài)性的樣本外其他樣本都符合正態(tài)性檢驗</p><p> 對表 不符正態(tài)性的樣本進行對數轉換,設為不符正態(tài)性的每種酒樣本每個評酒員的打分總評,對其進行對數轉換,即將轉換為后,對再一次進行正態(tài)性檢驗及t檢驗,正態(tài)性檢驗結果見表7 </p><p> 由表可知白2、白3、白9、白12、白21、白25的P值小于0.05,仍然不具有正態(tài)
35、性則用非參數秩和檢驗判定顯著性差異,見圖1;通過判定可用t檢驗之后要進行方差齊次性檢驗,從而確定兩組之間有無顯著性差異。詳細流程見圖2。</p><p> 圖1 非參數秩和檢驗判定</p><p> 圖2 T檢驗詳細流程</p><p> 5.1.2模型二:基于均值和方差的評價結果可靠性分析模型</p><p><b> ?。?/p>
36、一)模型建立</b></p><p> 先對紅葡萄酒中所有酒樣品的10個評酒員總評求得第一組均值、標準差分別為、及第二組均值、標準差分別為、,這里引入變異系數即標準差與均值的比值(見式子),反映單位均值上的離散程度,即可通過比較紅葡萄酒兩組評酒員總評的變異系數,根據變異系數越小,則該組越穩(wěn)定,進而表明其可信度越高原則,判定這兩組的可信度;同理可解得白葡萄酒第一二組均值、標準差以及各組的變異系數并判斷
37、白葡萄酒兩組中哪一組更可信。</p><p><b> ?、?lt;/b></p><p><b> ?。ǘ┠P颓蠼?lt;/b></p><p> 通過Excel軟件處理數據,得紅白葡萄酒各種酒樣品的均值、標準差以及變異系數【附錄3】,進而解得紅白葡萄酒的變異系數,見表 ,從表中可以知道且,即不管是紅葡萄酒還是白葡萄酒,第一組的
38、變異系數明顯大于第二組的,也就是說第二組明顯比較穩(wěn)定,可信度比較高。</p><p> 表8 紅白葡萄酒的變異系數</p><p><b> 5.3問題三</b></p><p> 5.3.1 基于逐步回歸對指標間聯系進行分析的模型</p><p> 模型思想:白葡萄酒和紅葡萄酒的分析方法是一樣的,所以以下建立的
39、模型只是針對紅葡萄酒而言的,白葡萄酒可以用一樣的方法代進相應的數據進行分析。把附件2的數據分成兩部分,一部分用來做逐步線性回歸,一部分用于對求得的線性方程進行檢驗。用逐步回歸模型建立起酒的理化指標和葡萄的理化指標線性關系,利用附件2的指標數據,選用逐步法進行如下循環(huán):引進對因變量(酒的理化指標)影響最大的自變量(葡萄的理化指標),對變量進行檢驗,最小的則被移除。進行這個循環(huán)直至不能引入和移除變量為止。根據逐步回歸建立起來的方程用附件2的
40、數據進行檢驗,確定模型的可用性。</p><p> 引入第k個葡萄酒的理化指標作為因變量,進而進入自變量,其中對第k個因變量當引入第j個自變量時,需要進行選擇決策,選擇依據為:</p><p><b> k=1,2,…8</b></p><p> 對尚未入選成為自變量的變量計算,若滿足>,則改變量可以進入線性方程的計算,成為自變量。
41、</p><p> 在一個自變量入選后對線性方程里原有的自變量進行淘汰決策,選擇依據和入選的過程相反,但檢驗過程一樣。即選擇依據為:</p><p><b> k=1,2,…8</b></p><p> 對在第j個自變量入選之前的自變量計算,若當中的其中一個自變量滿足>,則淘汰,此變量不再具有自變量(對于改因變量而言)的資格。<
42、;/p><p> 在對自變量進行篩選后進行線性回歸分析,選用最小二乘法進行系數求解。求解出具有以下形式的8個紅葡萄酒理化指標與葡萄理化指標線性方程:</p><p> k=1,2,…8⑦</p><p> 對⑦式,如果在循環(huán)過程中被淘汰,則對應的系數為0。</p><p> 5.3.2 模型的求解</p><p
43、> 先對數據進行預處理,把測試多次的數據進行均值處理,因為一級指標就把二級指標的特性概括了,所以二級指標不給予考慮,只考慮紅葡萄酒和葡萄的一級指標的關系。對數據進行預處理后各符號代表的意義如表9和表10:其中x(i)表示,y(i)表示</p><p> 表9 預處理后的葡萄的指標</p><p> 表10 預處理后的紅葡萄酒的指標</p><p> 根
44、據逐步回歸的原理,利用表9和表10的數據用matlab選用逐步回歸的求解函數Stepwise(x,y,n,a)函數對逐步回歸模型的線性方程進行求解,其中取置信水平為a=0.05,求解詳細程序見【附錄3】。</p><p> 初步求解的紅酒花色苷指標對應葡萄的花色苷、蘋果酸、國花質量指標的關系結果如下:</p><p><b> ?。?)</b></p>
45、<p> 對于(2)式,在求解的過程中的F值是遞增的,即說明在逐步回歸過程中是逐步優(yōu)化的,而不會出現因為引入了新變量或是剔除變量導致線性方程和實際有很大的出入。</p><p> 由于Stepwise函數并不給出常數項,可以通過數據估計求解。求解公式為:</p><p> 很據上述求解公式用excel進行數值統(tǒng)計求解,把求解所得的常量代回方程得最終紅葡萄酒指標和葡萄指標線
46、性關系見表11:</p><p> 表11 紅葡萄酒指標和葡萄指標線性關系表</p><p> 結果分析:紅葡萄酒的指標和葡萄指標之間的各個線性方程可以看出,葡萄指標并不是所有指標都是對紅葡萄酒的指標起作用的,所以建立起來的線性方程主要反映出葡萄理化指標里對葡萄酒理化指標影響比較顯著的關系,關系不顯著的指標,一部分被隱含在顯著性強的指標里,一部分對葡萄酒指標幾乎沒影響的就被剔除了。&l
47、t;/p><p> 對白葡萄酒和白葡萄的分析過程是類似的,分析結果見【附錄4】</p><p><b> 5.3問題三</b></p><p> 5.3.1基于聚類分析的葡萄等級劃分模型</p><p> 模型思想:結合題目附件2的葡萄理化指標數據,先選用不同分類原則的聚類分析對葡萄進行分類,其中分類原則考慮了聚類的
48、方法和度量標準兩個的影響而選取了6個分類原則的組合進行求解,把分類結果和實際情況進行按照定義的標準進行對比,得出一個比較符合實際情況的分類,再結合問題一的求解結果,把各個類別的葡萄品種對應的葡萄質量均值進行對比,根據數值大小進行等級劃分。</p><p> 聚類分析對葡萄進行分類</p><p> 先對相似度量的方法(距離的類型)以及度量的標準進行選擇。如果只是選用一個距離和度量的標準
49、,則難以進行結果比較檢驗。本文選用了最常用的操作簡單的最短距離法,最長距離法,以及分類效果比較好的ward法(離差平方和法)對葡萄進行分類,并根據三個聚類分析法的求解結果進行比較,最后選取一個比較合理的分類方案。而聚類分析的度量準則則選取比較有代表性和權威性的Euclidean距離和平方Euclidean距離。</p><p> 最短距離法聚類步驟如下:</p><p> 1,規(guī)定紅葡
50、萄酒的27個樣本間的距離,計算樣本兩兩之間的距離,得到對稱矩開始每個葡萄酒樣品自成一類。</p><p> 2,選擇對稱矩陣中的最小非零元素。將兩個樣品之間最小距離記為:</p><p><b> 其中p≠i≠j</b></p><p> 3,將這兩個樣品歸并成為一類,記為,計算與其他樣品距離。重復以上過程直到所有樣品合并為一類。<
51、/p><p> 最長距離法聚類分析和ward法聚類分析和最短距離法聚類分析的過程相差無幾,只是對應的距離有所改變:</p><p> 最長距離法: 其中p≠i≠j</p><p> Ward距離相對最短距離和最長距離的計算會比較復雜:</p><p><b> 如果,則距離改為:</b></p>&
52、lt;p> 求得葡萄的各個分類方案之后,結果之間進行比較,因為組內距離小,組間距離大這樣的特征就是好的分類所必須有的。所以定義一個指標,作為方案選擇的評價指標:</p><p> 組內組間區(qū)別度=組內最小距離/組間最大距離</p><p> 距離指標越大則說明分類效果越好,反之則說明分類不是很好。</p><p> 通過題目附件1的數據和問題一的結論求
53、解出比較具有可信度的紅、白葡萄酒質量(以分數衡量)。按照葡萄的分類,分別把每個類別的葡萄樣品所對應的葡萄酒樣品的分數求均值,并以此作為分級的指標,均值越大者的級別越高。</p><p> 5.3.2 模型的求解</p><p> 對附件1數據結合問題一的結論對葡萄酒質量進行預處理,預處理結果如表1。</p><p><b> 表12 質量分析<
54、;/b></p><p> 用聚類分析原理對葡萄分類,可以用SPSS軟件結合聚類分析的原理按照以下操作求解:導入數據——>分析——>分類——>系統(tǒng)聚類——>方法——>區(qū)間分別選擇平方Euclidean距離和Euclidean進行操作,比較結果。用SPSS求解出來的所有結果圖2。</p><p><b> 圖3 聚類樹狀圖</b>
55、</p><p> 針對這三個聚類分析方法和度量標準的組合形成的五個結果進行比較,比較結果如表13,從表1可知,因為ward平方Euclidean距離方法的組內組間區(qū)別度明顯比其他五個結果的要少,則說明ward平方Euclidean距離方法做出來的結果組內距離比較少,組間距離比較大,所以最終選擇ward平方Euclidean距離方法的結果。</p><p> 根據ward平方Eucli
56、dean距離方法所得的結果進行等級劃分,結果如表2,從表2可知,紅葡萄的等級劃分結果中,三等的只有4號葡萄樣品,而特等的則有1,2,3等共計10個樣品,一等則有12個樣品,二等則有4個樣品,從這些信息可以反映出大多數的釀酒葡萄的等級是比較高的,和第一問的葡萄酒的質量評定結果相吻合。</p><p><b> 5.4問題四</b></p><p> 5.4.1主成分
57、分析模型</p><p> 模型思想:主成分分析(principal components analysis, PCA)是一種簡化數據集的技術,也被稱為主分量分析,是揭示大樣本、多變量數據或樣本之間內在關系的一種方法,本文就是利用主成分分析降維的思想,把多指標轉化為少數幾個綜合指標,降低觀測空間的維數,以獲取最主要的信息。</p><p> 主成分分析法代數模型[4]</p>
58、;<p> 假設用p個變量來描述研究對象,分別用X1,X2…Xp來表示,這p個變量構成的p維隨機向量為X=(X1,X2…Xp)t。設隨機向量X的均值為μ,協方差矩陣為Σ。對X進行線性變化,考慮原始變量的線性組合:</p><p> Z1=μ11X1+μ12X2+…μ1pXp</p><p> Z2=μ21X1+μ22X2+…μ2pXp</p><p&
59、gt;<b> …… …… ……</b></p><p> Zp=μp1X1+μp2X2+…μppXp</p><p> 主成分是不相關的線性組合Z1,Z2……Zp,并且Z1是X1,X2…Xp的線性組合中方差最大者,Z2是與Z1不相關的線性組合中方差最大者,…,Zp是與Z1,Z2 ……Zp-1都不相關的線性組合中方差最大者。</p><p&g
60、t;<b> 模型的求解:</b></p><p> 在SPSS19.0軟件中可以方便地實現主成分分析的方法。具體操作如下:</p><p> 以紅葡萄的理化指標為展示,可以得到如表一的成份矩陣:</p><p> 表13 紅葡萄理化指標的成份矩陣</p><p> 5.4.2多元線性回歸模型</p>
61、;<p> 模型思想:考慮葡萄酒質量的影響因素中,葡萄酒的質量不止受到一個變量的影響。例如,葡萄酒和釀酒葡萄的理化指標、葡萄酒和釀酒葡萄的感官指標等都會影響葡萄酒的質量。用多元線性回歸模型恰能體現出各指標與葡萄酒質量的關系。</p><p><b> 模型的建立:</b></p><p> 按照題意,設置4個自變量:、、、分別代表標準化后的(紅/白
62、)各酒樣本對應釀酒葡萄理化指標的主成分均值、標準化后的(紅/白)各酒樣本對應葡萄酒理化指標的主成分均值、標準化后的(紅/白)各酒樣本對應釀酒葡萄芳香物質的主成分均值、標準化后的(紅/白)各酒樣本對應葡萄酒芳香物質的主成分均值。因變量為Y,含義是對問題一求解出的(紅/白)各酒樣本的可靠性分數進行標準化后的向量。、、、分別是、、、的系數。常數項設為B。數學表達式為:</p><p> Y=*+*+*+*+B<
63、/p><p><b> 模型二的求解:</b></p><p> 首先,要求出模型中的、、、向量。同樣以紅葡萄理化指標為例,不妨設表13中的數據為矩陣A,A反應了各主成分與指標(氨基酸總量、蛋白質、VC含量……)之間的關系;數據處理后的矩陣設為B,則B反應了指標與各種酒樣本的關系。因此B*A的轉換體現出各主成分與各酒樣品的關系。對B*A矩陣的酒樣品求主成分均值,再對所
64、得列向量進行標準化,即可得到紅葡萄理化指標的向量。</p><p> 同理,(紅/白)葡萄的向量、、、皆可求出。具體計算結果可參照表3:</p><p> 表14:多元線性回歸模型求得的樣本值表</p><p> 運用matlab軟件中的regress函數求解出多元線性回歸模型的表達式。代碼為:</p><p> B = regres
65、s(Y,[ones(size(Y)),X1,X2,X3,X4])</p><p><b> 所求系數為:</b></p><p> 為了更好地對各系數進行比較和分析,對所求的系數取絕對值后再歸一化,得到表3:</p><p> 表3:絕對值、歸一化處理后系數值表</p><p> 從表3可以看出,由于、、、、Y都
66、是經過標準化處理的,他們之間的關系屬于無量綱化。因此,Y的值和系數K關系很大。X的值稍微變化,K值越大,Y的變化就會越大??傻茫禂礙的值可以反映出、、、對Y的影響。經過分析可以得出以下結論:</p><p> ?。?)由于歸一化后各所占的比例都落入到[0.2,0.4]區(qū)間范圍內,差異不大,所以釀酒葡萄的理化指標、葡萄酒的理化指標、釀酒葡萄的芳香物質(感官指標)、葡萄酒的芳香物質(感官指標)對葡萄酒的質量影響相當
67、。</p><p> ?。?)由于釀紅酒葡萄的理化指標比例+紅葡萄酒的理化指標比例=71.87%,釀白酒葡萄的理化指標比例+白葡萄酒的理化指標比例=60.67%.這反應了葡萄酒和釀酒葡萄的理化指標對葡萄酒的質量起著主要的影響。但是,不能僅僅依靠葡萄酒和釀酒葡萄的理化指標來評價葡萄酒的質量,這樣會產生比較大的誤差。如需更準確地判別葡萄酒的質量,還需要把芳香物質考慮進去。</p><p>
68、(3)由于對于白葡萄酒和紅葡萄酒來說,常數項B都等于O,所以也驗證了葡萄酒的質量是由理化指標和感官指標決定的。</p><p><b> 模型的評價及優(yōu)化</b></p><p><b> 模型的優(yōu)點</b></p><p> 對于第一問的模型從總體到局部細致分析再從總體的均值和方差分析穩(wěn)定性,考慮的很周全。第二問的
69、聚類分析進行多個方法對比得出的結果比較這一步做得很合理,第三問的逐步回歸建立起來的線性方程既考慮到自變量的顯著性,考慮得比較全面,第四問選用多元線性回歸模型求解出來的結果具有精確性,減少了主觀性帶來的誤差。</p><p><b> 模型的缺點</b></p><p> 第二問的僅僅用組內組間區(qū)別度作為方法的判別,不夠周全。</p><p>
70、;<b> 參考文獻:</b></p><p> [1]茆詩松,程依明.概率論與數理統(tǒng)計教程[M].北京:高等教育出版社,2004.7; </p><p> [2] 湖北省大學學生教學建模競賽專家組織.數學建模[M].武漢:華中科技大學出版社,2006.2; </p><p> [3] 朱星宇,陳勇強.SPSS多元統(tǒng)計分析方法及應用[M
71、].北京:清華大學出版社,2011; </p><p> [4] 李桂成.計算方法[M].北京:電子工業(yè)出版社,2005.10;</p><p> [5] 陳杰等.MATLAB寶典[M](第3版).北京:電子工業(yè)出版社,2011;</p><p> [6] 姜啟源,謝金星,葉俊.數學建模[M].北京:高等教育出版社,2011.1;</p><
72、;p> [7] 母麗華,周永芳.數學建模[M].北京:科學出版社,2011。</p><p><b> 附件</b></p><p><b> 附錄1</b></p><p><b> 紅葡萄的變異系數</b></p><p><b> 白葡萄變異系數
73、</b></p><p><b> 附錄4</b></p><p> 白葡萄酒的理化指標和白葡萄理化指標之間的線性關系</p><p><b> 附錄5</b></p><p><b> 逐步回歸法程序:</b></p><p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 天山北麓釀酒葡萄產區(qū)葡萄與葡萄酒品質研究.pdf
- 葡萄酒的評價建模論文
- 葡萄酒與葡萄酒文化論文-淺談葡萄酒的歷史,文化及現狀
- 葡萄酒論文
- 葡萄酒論文-葡萄酒的分析及等級劃分
- 葡萄酒的評價數學建模論文
- 葡萄酒的評價優(yōu)秀論文
- 葡萄酒的評價-數學建模論文
- 鮮食葡萄釀酒特性及葡萄酒品質的研究.pdf
- 瑞引釀酒葡萄Granoir果實與葡萄酒品質研究.pdf
- 葡萄酒的評價數學建模論文
- 論文—自制葡萄酒
- 白葡萄酒與白葡萄蒸餾酒
- 葡萄酒的評價—數學畢業(yè)論文
- 關于葡萄酒評價的數學建模論文
- 數學建模-葡萄酒評價
- 基于理化指標分析的葡萄與葡萄酒的評價
- 基于理化指標分析的葡萄與葡萄酒的評價
- 葡萄酒畢業(yè)論文
- 釀葡萄酒的葡萄品種
評論
0/150
提交評論