簡介:1,MATLAB統(tǒng)計工具箱,一統(tǒng)計工具箱簡介二概率分布三參數(shù)估計四描述性統(tǒng)計五假設(shè)檢驗六統(tǒng)計繪圖,2,一MATLAB統(tǒng)計工具箱STATISTICSTOOLBOX簡介,統(tǒng)計學(xué)是處理數(shù)據(jù)的藝術(shù)和科學(xué),通過收集,分析,解釋和表達數(shù)據(jù)來探索事物中蘊含的規(guī)律隨著科技水平的迅猛發(fā)展,知識經(jīng)濟的時代來臨,海量的數(shù)據(jù)需要人們處理MATLAB統(tǒng)計工具箱為人們提供了一個強有力的統(tǒng)計分析工具統(tǒng)計工具箱基于MATLAB數(shù)值計算環(huán)境,支持范圍廣泛的統(tǒng)計計算任務(wù)它包括200多個處理函數(shù)M文件主要應(yīng)用于以下幾方面,3,11統(tǒng)計工具箱的幾大功能,概率分布參數(shù)估計描述性統(tǒng)計假設(shè)檢驗統(tǒng)計繪圖,4,,統(tǒng)計工具箱提供了20種概率分布類型,其中包括離散型分布如BINOMIAL二項分布,即N次貝努里試驗中出現(xiàn)K次成功的概率POISSON分布,和分布等,,111概率分布離散型,5,112概率分布連續(xù)型,連續(xù)型分布如正態(tài)分布FXBETA分布,UNIFORM平均分布等每種分布提供5類函數(shù)1概率密度2累積分布函數(shù)3逆累積分布函數(shù)4隨機數(shù)產(chǎn)生器5均值和方差函數(shù),6,113另外4大功能,參數(shù)估計依據(jù)原始數(shù)據(jù)計算參數(shù)估計值置信區(qū)域描述性統(tǒng)計方差,期望等數(shù)字特征假設(shè)檢驗提供最通用的假設(shè)檢驗函數(shù)T檢驗,Z檢驗統(tǒng)計繪圖BOX圖函數(shù),正態(tài)概率圖函數(shù)等注意統(tǒng)計工具箱中的說有函數(shù)都可用TYPEFUNCTION_NAME語句查看其代碼,也可進行修改,從而變?yōu)榧河?加入到工具箱中,7,二概率分布,隨機變量的統(tǒng)計行為取決于其概率分布,而分布函數(shù)常用連續(xù)和離散型分布。統(tǒng)計工具箱提供20種分布。每種分布有五類函數(shù)。1概率密度PDF2累積分布函數(shù)CDF3逆累積分布函數(shù)ICDF4隨機數(shù)產(chǎn)生器5均值和方差函數(shù);一離散型概率密度函數(shù)為觀察到的特定值的概率。連續(xù)型概率密度函數(shù)定義為如存在非負(fù)函數(shù)PX≥0,使對任意B≥A,X在A,B上取值概率為P{A0,X’’I0,如果有不等式約束,則對含≤的約束,在左邊加上一個非負(fù)變量使其成為等式約束;對含≥的約束,在左邊減去一個非負(fù)變量使其成為等式約束。,432LP函數(shù)LP功能求解線性規(guī)劃問題格式XLPC,A,BXLPC,A,B,VLBXLPC,A,B,VLB,VUB設(shè)置解向量的上下界XLPC,A,B,VLB,VUB,X0設(shè)置初始解向量X0XLPC,A,B,VLB,VUB,X0,NEQCSTR設(shè)置在約束中的等式約束的個數(shù)X,LAMBDA,HOWLPC,A,B,同時返回拉格朗日乘子,51,例子求下面線性規(guī)劃問題目標(biāo)函數(shù)FX–5X1–4X2–6X3約束方程X1X2X3≤203X12X24X3≤423X12X2≤300≤X1,0≤X2,0≤X3,第一步輸入系數(shù)C4,5,6A1–11324320B204230第二步求解X,LAMBDALPC,A,B,ZEROS3,1解為X01500003000LAMBDA015000050001000000,A為約束方程系數(shù)矩陣C為目標(biāo)方程系數(shù)B為約束方程系數(shù)向量,52,例子求無約束非線性問題FX100X2–X1221–X12初始解向量X121第一步編寫M文件FUNCTIONFFUNXF100X2–X1221–X12第二步求解X12,1XFMINU‘FUN’,XX1000010000FUNX88348E11,44非線性規(guī)劃441無約束規(guī)劃FMINU,FMINS功能求解無約束非線性最優(yōu)化問題格式XFMINU‘FUN’,X0求函數(shù)FUN的最小值,并設(shè)置初始值向量為X0XFMINU‘FUN’,X0,OPTIONS可選參數(shù)在OPTIONS向量中設(shè)置XFMINU‘FUN’,X0,OPTIONS,‘GRAD’XFMINU‘FUN’,X0,OPTIONS,‘GRAD’,P1,P2,X,OPTIONSFMINU‘FUN’,X0,FMINS‘FUN’,X0,OPTIONS2控制X的精度OPTIONS3控制目標(biāo)函數(shù)F的精度,,53,FMINS線性搜索算法的控制缺省OPTIONS70,使用一種二次和三次多項式插值的混合算法OPTIONS71時,使用三次多項式插值算法。目標(biāo)函數(shù)大于2階,一般用FMINU函數(shù);但對于非常不連續(xù)的函數(shù)則用FMUNS函數(shù),442二次規(guī)劃443有約束規(guī)劃FMIN函數(shù)標(biāo)量最優(yōu)求解標(biāo)量最優(yōu)問題的一般描述目標(biāo)函數(shù)MINAFA區(qū)域約束單變量問題目標(biāo)函數(shù)MINAFA約束條件A1AA2,,FMINU函數(shù)優(yōu)化算法的控制缺省OPTIONS60時,用擬牛頓方法OPTIONS61時,用DFP公式來逼近HESSIAN矩陣OPTIONS62時,用最速下降法,54,例子求下面標(biāo)量函數(shù)在0,5區(qū)間的最小值目標(biāo)函數(shù)FA32–1第一步編寫M函數(shù)FUNCTIONFFUNAFA32–1第二步求解AFMIN‘FUN’,0,5A3THEVALUEATTHEMINIMUMISYFAY1,FMIN功能求解區(qū)域約束單變量問題。格式AFMIN‘FUN’,A1,A2AFMIN‘FUN’,A1,A2,OPTIONSAFMIN‘FUN’,A1,A2,OPTIONS,P1,P2,A,OPTIONSFMIN‘FUNCTION’,A1,A2,說明OPTIONS2控制X的精度OPTIONS14控制函數(shù)的計算次數(shù),55,CONSTR功能多變量非線性約束最優(yōu)問題求解格式XCONSTR‘FUN’,X0求解非線性約束最優(yōu)化問題,初始向量為X0XCONSTR‘FUN’,X0,OPTIONSXCONSTR‘FUN’,X0,OPTIONS,VLB,VUB,‘GRAD’,設(shè)置解向量上下界XCONSTR‘FUN’,X0,OPTIONS,VLB,VUB,‘GRAD’,P1,P2,X,OPTIONSCONSTR‘FUN’X0,X,OPTIONS,LAMBDACONSTR‘FUN’,X0,X,OPTIONS,LAMBDA,HESSCONSTR‘FUN’,X0,OPTIONS4控制對約束的越限程度,,3CONSTR函數(shù)多變量非線性約束最優(yōu)化問題的一般描述目標(biāo)函數(shù)MINXFX約束條件GX≤0,56,目標(biāo)函數(shù)FXX1X2X3約束條件X1–2X2–2X3≤0X12X22X3≤72初始解向量X101010第一步編寫M文件FUNCTIONF,GFUNXFX1X2X3G1X1–2X2–2X3G2X12X22X3–72第二步求解X010,10,10XCONSTR‘FUN’,X0經(jīng)過49次運算后,結(jié)果為X240000120000120000F,GFUNXF34560E03G720,例子,57,45最小最大(MINMAX問題一般描述目標(biāo)函數(shù)約束條件GX≤0,MINIMAX功能求解最小最大問題格式XMINIMAX‘FUN’,X0求解最小最大問題,初始解向量為X0XMINIMAX‘FUN’,X0,OPTIONSXMINIMAX‘FUN’,X0,OPTIONS,VLB,VUB,’GRAD’XMINIMAX‘FUN’,X0,OPTIONS,VLB,VUB,‘GRAD’,P1,P2,X,OPTIONSMINIMAX‘FUN’,X0,,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 69
大?。?0.2(MB)
子文件數(shù):
簡介:現(xiàn)實生活中的許多數(shù)據(jù)都是隨機產(chǎn)生的,如考試分?jǐn)?shù)、月降雨量、燈泡壽命等。,從數(shù)理統(tǒng)計角度來看,這些數(shù)據(jù)其實都是符合某種分布的,這種規(guī)律就是統(tǒng)計規(guī)律。,本實驗主要通過對概率密度函數(shù)曲線的直觀認(rèn)識和數(shù)據(jù)分布的形態(tài)猜測,以及密度函數(shù)的參數(shù)估計,進行簡單的正態(tài)假設(shè)檢驗,揭示日常生活中隨機數(shù)據(jù)的一些統(tǒng)計規(guī)律。,問題背景和實驗?zāi)康?MATLAB相關(guān)命令介紹,PDF概率密度函數(shù),YPDFNAME,X,A,YPDFNAME,X,A,B或YPDFNAME,X,A,B,C,返回由NAME指定的單參數(shù)分布的概率密度,X為樣本數(shù)據(jù),NAME用來指定分布類型,其取值可以是BETA、BINO、CHI2、EXP、EV、F、GAM、GEV、GP、GEO、HYGE、LOGN、NBIN、NCF、NCT、NCX2、NORM、POISS、RAYL、T、UNIF、UNID、WBL。,返回由NAME指定的雙參數(shù)或三參數(shù)分布的概率密度,MATLAB相關(guān)命令介紹,例,X8018YPDFNORM,X,0,1Y1PDFNORM,X,1,2PLOTX,Y,X,Y1,,注,YPDFNORM,X,0,1,YNORMPDFX,0,1,,相類似地,,YPDFBETA,X,A,B,YBETAPDFX,A,B,,YPDFBINO,X,N,P,YBINOPDFX,N,P,,,MATLAB相關(guān)命令介紹,NORMFIT正態(tài)分布中的參數(shù)估計,MUHAT,SIGMAHAT,MUCI,SIGMACINORMFITX,ALPHA,對樣本數(shù)據(jù)X進行參數(shù)估計,并計算置信度為1ALPHA的置信區(qū)間ALPHA可以省略,缺省值為005,即置信度為95,LOAD從MATLAB數(shù)據(jù)文件中載入數(shù)據(jù),SLOAD數(shù)據(jù)文件名,HIST繪制給定數(shù)據(jù)的直方圖,HISTX,M,MATLAB相關(guān)命令介紹,TABLETABULATEX,繪制頻數(shù)表,返回值TABLE中,第一列為X的值,第二列為該值出現(xiàn)的次數(shù),最后一列包含每個值的百分比。,TTESTX,M,ALPHA,假設(shè)檢驗函數(shù)。此函數(shù)對樣本數(shù)據(jù)X進行顯著性水平為ALPHA的T假設(shè)檢驗,以檢驗正態(tài)分布樣本X(標(biāo)準(zhǔn)差未知)的均值是否為M。,MATLAB相關(guān)命令介紹,NORMPLOTX,統(tǒng)計繪圖函數(shù),進行正態(tài)分布檢驗。研究表明如果數(shù)據(jù)是來自一個正態(tài)分布,則該線為一直線形態(tài);如果它是來自其他分布,則為曲線形態(tài)。,WBLPLOTX,統(tǒng)計繪圖函數(shù),進行WEIBULL分布檢驗。,MATLAB相關(guān)命令介紹,其它函數(shù),CDF系列函數(shù)累積分布函數(shù)INV系列函數(shù)逆累積分布函數(shù)RND系列函數(shù)隨機數(shù)發(fā)生函數(shù)STAT系列函數(shù)均值與方差函數(shù),例,PNORMCDF22,0,1,XNORMINV00250975,0,1,NNORMRND0,1,15,N15M,VNORMSTATNN,NN,常見的概率分布,連續(xù)分布正態(tài)分布,正態(tài)分布(連續(xù)分布),如果隨機變量X的密度函數(shù)為,則稱X服從正態(tài)分布。記做,標(biāo)準(zhǔn)正態(tài)分布N0,1,正態(tài)分布也稱高斯分布,是概率論中最重要的一個分布。,如果一個變量是大量微小、獨立的隨機因素的疊加,那么它一定滿足正態(tài)分布。如測量誤差、產(chǎn)品質(zhì)量、月降雨量等,正態(tài)分布舉例,X8018YNORMPDFX,0,1Y1NORMPDFX,1,2PLOTX,Y,X,Y1,,例標(biāo)準(zhǔn)正態(tài)分布和非標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)圖形,連續(xù)分布均勻分布,均勻分布(連續(xù)分布),如果隨機變量X的密度函數(shù)為,則稱X服從均勻分布。記做,均勻分布在實際中經(jīng)常使用,譬如一個半徑為R的汽車輪胎,因為輪胎上的任一點接觸地面的可能性是相同的,所以輪胎圓周接觸地面的位置X是服從0,2?R上的均勻分布。,均勻分布舉例,X1000110R1YUNIFPDFX,0,2PIRPLOTX,Y,連續(xù)分布指數(shù)分布,指數(shù)分布(連續(xù)分布),如果隨機變量X的密度函數(shù)為,則稱X服從參數(shù)為?的指數(shù)分布。記做,在實際應(yīng)用問題中,等待某特定事物發(fā)生所需要的時間往往服從指數(shù)分布。如某些元件的壽命;隨機服務(wù)系統(tǒng)中的服務(wù)時間;動物的壽命等都常常假定服從指數(shù)分布。,指數(shù)分布具有無記憶性,指數(shù)分布舉例,X00130YEXPPDFX,4PLOTX,Y,例?4時的指數(shù)分布密度函數(shù)圖,離散分布幾何分布,幾何分布是一種常見的離散分布,在貝努里實驗中,每次試驗成功的概率為P,設(shè)試驗進行到第?次才出現(xiàn)成功,則?的分布滿足,其右端項是幾何級數(shù)的一般項,于是人們稱它為幾何分布。,X030YGEOPDFX,05PLOTX,Y,例P05時的幾何分布密度函數(shù)圖,離散分布二項式分布,二項式分布屬于離散分布,如果隨機變量X的分布列為,則稱這種分布為二項式分布。記做,X050YBINOPDFX,500,005PLOTX,Y,例N500,P005時的二項式分布密度函數(shù)圖,離散分布POISSON分布,泊松分布也屬于離散分布,是1837年由發(fā)個數(shù)學(xué)家POISSON首次提出,其概率分布列為,記做,泊松分布是一種常用的離散分布,它與單位時間(或單位面積、單位產(chǎn)品等)上的計數(shù)過程相聯(lián)系。如單位時間內(nèi),電話總機接到用戶呼喚次數(shù);1平方米內(nèi),玻璃上的氣泡數(shù)等。,POISSON分布舉例,X050YPOISSPDFX,25PLOTX,Y,例?25時的泊松分布密度函數(shù)圖,離散分布均勻分布,如果隨機變量X的分布列為,則稱這種分布為離散均勻分布。記做,N20X1NYUNIDPDFX,NPLOTX,Y,O,例N20時的離散均勻分布密度函數(shù)圖,抽樣分布?2分布,設(shè)隨機變量X1,X2,,XN相互獨立,且同服從正態(tài)分布N0,1,則稱隨機變量?N2X12X22XN2服從自由度為N的?2分布,記作,亦稱隨機變量?N2為?2變量。,X00120YCHI2PDFX,4PLOTX,Y,例N4和N10時的?2分布密度函數(shù)圖,X00120YCHI2PDFX,10PLOTX,Y,抽樣分布F分布,設(shè)隨機變量,且X與Y相互獨立,則稱隨機變量,X00101801YFPDFX,4,10PLOTX,Y,例F4,10的分布密度函數(shù)圖,為服從自由度M,N的F分布。記做,抽樣分布T分布,設(shè)隨機變量,且X與Y相互獨立,則稱隨機變量,X60016YTPDFX,4PLOTX,Y,例T4的分布密度函數(shù)圖,為服從自由度N的T分布。記做,頻數(shù)直方圖或頻數(shù)表,對于給定的數(shù)據(jù)集,假設(shè)它們滿足以上十種分布之一,如何確定屬于哪種分布,XLOADDATA1TXTXXHISTX,例1某次筆試的分?jǐn)?shù)見DATA1TXT,試畫出頻數(shù)直方圖,繪制頻數(shù)直方圖,或列出頻數(shù)表,從圖形上看,筆試成績較為接近正態(tài)分布,頻數(shù)直方圖或頻數(shù)表,XLOADDATA2TXTXXHISTX,例2某次上機考試的分?jǐn)?shù)見DATA2TXT,試畫出頻數(shù)直方圖,從圖形上看,上機考試成績較為接近離散均勻分布,XLOADDATA3TXTXXHISTX,例3上海1998年來的月降雨量的數(shù)據(jù)見DATA3TXT,試畫出頻數(shù)直方圖,從圖形上看,月降雨量較為接近?2分布,頻數(shù)直方圖或頻數(shù)表,在重復(fù)數(shù)據(jù)較多的情況下,我們也可以利用MATLAB自帶的TABULATE函數(shù)生成頻數(shù)表,并以頻數(shù)表的形式來發(fā)掘數(shù)據(jù)分布的規(guī)律。,XLOADDATA4TXTXXTABULATEXHISTX,例4給出數(shù)據(jù)DATA4TXT,試畫出其直方圖,并生成頻數(shù)表,頻數(shù)直方圖或頻數(shù)表,XLOADDATA5TXTXXHISTXFIUGREHISTFITX加入較接近的正態(tài)分布密度曲線,例5現(xiàn)累積有100次刀具故障記錄,當(dāng)故障出現(xiàn)時該批刀具完成的零件數(shù)見DATA5TXT,試畫出其直方圖。,從圖形上看,較為接近正態(tài)分布,參數(shù)估計,當(dāng)我們可以基本確定數(shù)據(jù)集X符合某種分布后,我們還需要確定這個分布的參數(shù)。,由于正態(tài)分布情況發(fā)生的比較多,故我們主要考慮正態(tài)分布的情形。,對于未知參數(shù)的估計,可分兩種情況,點估計區(qū)間估計,參數(shù)估計點估計,構(gòu)造樣本X與某個統(tǒng)計量有關(guān)的一個函數(shù),作為該統(tǒng)計量的一個估計,稱為點估計。,MATLAB統(tǒng)計工具箱中,一般采用最大似然估計法給出參數(shù)的點估計。,泊松分布P?的?最大似然估計是,指數(shù)分布EXP?的?最大似然估計是,點估計舉例,正態(tài)分布N?,?2中,?最大似然估計是,?2的最大似然估計是,XLOADDATA1TXTXXMU,SIGMANORMFITX,例6已知例1中的數(shù)據(jù)服從正態(tài)分布N?,?2,試求其參數(shù)?和?的值。,使用NORMFIT函數(shù),參數(shù)估計區(qū)間估計,構(gòu)造樣本X與某個統(tǒng)計量有關(guān)的兩個函數(shù),作為該統(tǒng)計量的下限估計與上限估計,下限與上限構(gòu)成一個區(qū)間,這個區(qū)間作為該統(tǒng)計量的估計,稱為區(qū)間估計。,MATLAB統(tǒng)計工具箱中,一般也采用最大似然估計法給出參數(shù)的區(qū)間估計。,區(qū)間估計舉例,XLOADDATA1TXTXXMU,SIGMA,MUCI,SIGMACINORMFITX,例7已知例1中的數(shù)據(jù)服從正態(tài)分布N?,?2,試求出?和?2的置信度為95的區(qū)間估計。,XLOADDATA6TXTXXMU,SIGMA,MUCI,SIGMACINORMFITX,001,例8從自動機床加工的同類零件中抽取16件,測得長度值見DATA6TXT,已知零件長度服從正態(tài)分布N?,?2,試求零件長度均值?和標(biāo)準(zhǔn)差?的置信度為99的置信區(qū)間。,假設(shè)檢驗,對總體的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀察值,運用數(shù)理統(tǒng)計的分析方法,檢驗這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè),這就是假設(shè)檢驗問題。,以正態(tài)假設(shè)檢驗為例,來說明假設(shè)檢驗的基本過程。,正態(tài)假設(shè)檢驗,正態(tài)假設(shè)檢驗的一般過程,假設(shè)檢驗利用MATLAB統(tǒng)計工具箱給出的常用的假設(shè)檢驗方法的函數(shù)TTEST,進行顯著性水平為ALPHA的T假設(shè)檢驗,以檢驗正態(tài)分布樣本X(標(biāo)準(zhǔn)差未知)的均值是否為M。運行結(jié)果中,當(dāng)H1時,表示拒絕零假設(shè);當(dāng)H0時,表示不能拒絕零假設(shè)。,對比正態(tài)分布的概率密度函數(shù)分布圖,判斷某統(tǒng)計量的分布可能服從正態(tài)分布,利用統(tǒng)計繪圖函數(shù)NORMPLOT或WBLPLOT進行正態(tài)分布檢驗,正態(tài)假設(shè)檢驗舉例,XLOADDATA5TXTXXNORMPLOTX,例9試說明例5中的刀具使用壽命服從正態(tài)分布,并且說明在方差未知的情況下其均值M取為597是否合理。,1對比刀具使用壽命分布圖與正態(tài)分布的概率密度分布函數(shù)圖,得初步結(jié)論該批刀具的使用壽命可能服從正態(tài)分布。,解,2利用統(tǒng)計繪圖函數(shù)NORMPLOT進行分布的正態(tài)性檢驗,結(jié)果顯示這100個離散點非??拷鼉A斜直線段,即圖形為線性的,因此可得結(jié)論該批刀具的使用壽命近似服從正態(tài)分布。,正態(tài)假設(shè)檢驗舉例,XLOADDATA5TXTXXHTTESTX,597,005,3利用函數(shù)TTEST進行顯著性水平為ALPHA的T假設(shè)檢驗,檢驗結(jié)果H0。表示不拒絕零假設(shè),說明所提出的假設(shè)“壽命均值為597”是合理的,
下載積分: 6 賞幣
上傳時間:2024-01-06
頁數(shù): 35
大?。?0.28(MB)
子文件數(shù):