sas軟件介紹 - 數(shù)學建模學習資源站_第1頁
已閱讀1頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、SAS軟件介紹,湖北工業(yè)大學理學院,一、概述,SAS系統(tǒng)全稱為Statistics Analysis System,最早由北卡羅來納大學的兩位生物統(tǒng)計學研究生編制,并于1976年成立了SAS軟件研究所,正式推出了SAS軟件。SAS是用于決策支持的大型集成信息系統(tǒng),但該軟件系統(tǒng)最早的功能限于統(tǒng)計分析,至今,統(tǒng)計分析功能也仍是它的重要組成部分和核心功能。SAS現(xiàn)在的版本為9.0版,大小約為1G。經(jīng)過多年的發(fā)展,SAS已被全世界120多個國家

2、和地區(qū)的近,,三萬家機構(gòu)所采用,直接用戶則超過三百萬人,遍及金融、醫(yī)藥衛(wèi)生、生產(chǎn)、運輸、通訊、政府和教育科研等領(lǐng)域。在英美等國,能熟練使用SAS進行統(tǒng)計分析是許多公司和科研機構(gòu)選材的條件之一。在數(shù)據(jù)處理和統(tǒng)計分析領(lǐng)域,SAS系統(tǒng)被譽為國際上的標準軟件系統(tǒng),并在96~97年度被評選為建立數(shù)據(jù)庫的首選產(chǎn)品??胺Q統(tǒng)計軟件界的巨無霸。在此僅舉一例如下:在以苛刻嚴格著稱于世的美國FDA新藥審批程序中,新藥試驗結(jié)果的統(tǒng)計分析規(guī)定只能用SAS進行,其

3、他軟件的計算結(jié)果一律無效!哪怕只是簡單的均數(shù)和標準差也不行!由此可見SAS的權(quán)威地位。,,SAS系統(tǒng)是一個組合軟件系統(tǒng),它由多個功能模塊組合而成,其基本部分是BASE SAS模塊。BASE SAS模塊是SAS系統(tǒng)的核心,承擔著主要的數(shù)據(jù)管理任務(wù),并管理用戶使用環(huán)境,進行用戶語言的處理,調(diào)用其他SAS模塊和產(chǎn)品。也就是說,SAS系統(tǒng)的運行,首先必須啟動BASE SAS模塊,它除了本身所具有數(shù)據(jù)管理、程序設(shè)計及描述統(tǒng)計計算功能以外,還是SA

4、S系統(tǒng)的中央調(diào)度室。它除可單獨存在外,也可與其他產(chǎn)品或模塊共同構(gòu)成一個完整的系統(tǒng)。各模塊的安裝及更新都可通過其安裝程序非常方便地進行。,,SAS系統(tǒng)具有靈活的功能擴展接口和強大的功能模塊,在BASE SAS的基礎(chǔ)上,還可以增加如下不同的模塊而增加不同的功能:SAS/STAT(統(tǒng)計分析模塊)、SAS/GRAPH(繪圖模塊)、SAS/QC(質(zhì)量控制模塊)、SAS/ETS(經(jīng)濟計量學和時間序列分析模塊)、SAS/OR(運籌學模塊)、SAS/I

5、ML(交互式矩陣程序設(shè)計語言模塊)、SAS/FSP(快速數(shù)據(jù)處理的交互式菜單系統(tǒng)模塊)、SAS/AF(交互式全屏幕軟件應(yīng)用系統(tǒng)模塊)等等。SAS有一個智能型繪圖系統(tǒng),不僅能繪各種統(tǒng)計圖,還能繪出地圖。SAS提供多個統(tǒng)計過程,每個過程均含有極豐富的任選項。用戶還可以通過對數(shù)據(jù)集的一連串加工,實現(xiàn)更為復(fù)雜的統(tǒng)計分析。此外,SAS還提供了各類概率分析函數(shù)、分位數(shù)函數(shù)、樣本統(tǒng)計函數(shù)和隨機數(shù)生成函數(shù),使用戶能方便地實現(xiàn)特殊統(tǒng)計要求。,二、初識SA

6、S,安裝SAS哪位要是連軟件的安裝和打開都要我啰嗦的話,我勸您還是買一套洪恩的《開天辟地》好好熱熱身吧。不過,安裝SAS時,應(yīng)首先將系統(tǒng)時間改到2002年以前,安裝完以后,再crack,然后將時間修改還原,切記!,,啟動SAS,,啟動后,出現(xiàn)如圖 的SAS運行界面,術(shù)語稱為"SAS工作空間(SAS Application WorkSpace)"。它象其它Windows應(yīng)用程序一樣,在一個主窗口內(nèi),包含若干個子窗口

7、,并有菜單條、工具欄、狀態(tài)欄等。 SAS有三個最重要的子窗口:程序窗口(PROGRAM EDITOR)、運行記錄窗口(LOG)、輸出窗口(OUTPUT)。 Program Editor的窗口(窗口標簽為Editor)就是用來輸入SAS語句的,編程操作的所有內(nèi)容都是在該窗口內(nèi)完成的,各位還是要跟它先多熟悉一下。,,簡單運行樣例 假設(shè)我們有一個班學生的數(shù)學成績和語文成績,數(shù)學滿分為100,語文滿分為120,希望計算學生的平均分數(shù)(按百

8、分制)并按此排名,可以在程序窗口輸入此程序:,,title '0401班學生成績排名'; data c0401; input name $ 1-10 sex $ math chinese; avg = math*0.5 + chinese/120*100*0.5; cards; 李明 男 92 98 張紅藝 女 89 106 王思明 男 86 90 張聰 男 98

9、 109 劉潁 女 80 110 ; run; proc print;run; proc sort data=c0401; by descending avg; run; proc print;run;,,實際上,上述程序是文本,完全可以在任何文本編輯工具中輸入,比如Windows中的記事本,甚至Word也可用來輸入這樣包含中文的程序。輸入后使用復(fù)制復(fù)制、粘貼命令將輸入的程序粘貼到SAS系統(tǒng)程序窗口。(即在

10、記事本中復(fù)制輸入的程序,然后在SAS系統(tǒng)程序窗口中使用粘貼命令,把程序復(fù)制到SAS中)。 要運行此程序,只要用鼠標單擊工具欄的提交(Submit)圖標 ,或用Run菜單下的Submit命令,或者直接按下F8鍵,就可運行程序。如果選中某一段程序,然后進行調(diào)用,則系統(tǒng)只執(zhí)行被選中的部分。,,運行后,輸出窗口出現(xiàn)如下結(jié)果: 0401班學生成績排名1

11、 11:40 Saturday, November 10, 2004 Obs name sex math chinese avg 1 李明 男 92 98 86.8333 2 張紅藝 女 89 106 88.6667

12、 3 王思明 男 86 90 80.5000 4 張聰 男 98 109 94.4167 5 劉潁 女 80 110 85.8333運行記錄窗口則記錄每段程序的運行情況、所用時間、生成數(shù)據(jù)保存情況。如果有錯誤還會用紅色指示錯誤。,三、SAS程序的使用常識,

13、從上面的例子程序可以看出SAS程序的一些特點。SAS程序的基本結(jié)構(gòu)   SAS程序由語句組成,語句用分號結(jié)束。語句一般由特定的關(guān)鍵詞開始,語句中可包含變量名、運算符等,它們以空格分隔。SAS對語句所占的行數(shù)無限制,一個語句可占多行,同樣,多個語句也可占一行。,,SAS程序的程序組成   SAS程序可以非常復(fù)雜,但其基本結(jié)構(gòu)一般由數(shù)個完成單個動作的程序步和環(huán)境設(shè)置語句構(gòu)成。而程序步分為兩種,一種叫數(shù)據(jù)步(data step),一種叫

14、過程步(proc step),分別以DATA語句和PROC語句開始。數(shù)據(jù)步和過程步由若干個語句組成,一般以RUN語句結(jié)束。前者用來創(chuàng)建和修改用于統(tǒng)計分析的數(shù)據(jù)集,后者則利用已創(chuàng)建的數(shù)據(jù)集完成特定的統(tǒng)計分析任務(wù)。比如下面的例子:,,libname a 'd:\sysdata\';data a.aaaa; input x @@; cards; 1 2 3 4 5; proc print; var

15、x;run; quit;第1句就是一個環(huán)境設(shè)置語句,其作用是設(shè)定一個邏輯庫,邏輯庫名稱為a,第2~6句構(gòu)成數(shù)據(jù)步,其功能是新建一個數(shù)據(jù)集,數(shù)據(jù)集名稱為aaaa,并且輸入數(shù)據(jù),第7~9句構(gòu)成過程步,其功能是將數(shù)據(jù)集aaaa中變量x的數(shù)值在output窗口中輸出。,,SAS程序的書寫規(guī)則與程序注釋   前面已經(jīng)提到,SAS對程序的書寫格式比較靈活,大小寫一般不區(qū)分(字符串中要區(qū)分大小寫),但我們?nèi)蕴岢玈AS程序與其它編程語言相似

16、,采用縮進格式,使得源程序結(jié)構(gòu)清楚,容易讀懂?!  AS程序的程序注釋有以下兩種格式:   注釋語句:以星號“*”開始,可占多行,以分號“;”結(jié)束。~   注釋段落:用“/*”和“*/”包括起來的任何字符,可占多行?!  ⊥瑯樱覀兲岢诔绦蛑幸羞m當?shù)淖⑨?,使程序的可讀性強。,四、SAS程序的數(shù)據(jù)步,數(shù)據(jù)集(dataset)和庫     SAS數(shù)據(jù)集(SAS Datasets)可以看作由若干行

17、和若干列組成的表格,類似于一個矩陣,但各列可以取不同的類型值,比如整數(shù)值、浮點值、時間值、字符串、貨幣值等等。比如,前面的例子生成了一個名為C0401的數(shù)據(jù)集,它的邏輯形式如下表:,,表1 數(shù)據(jù)集的邏輯形式,,數(shù)據(jù)集的每一行叫做一個觀測(Observation),每列叫做一個變量(Variable)。SAS數(shù)據(jù)集等價于關(guān)系數(shù)據(jù)庫系統(tǒng)中的一個表,實際上一個SAS數(shù)據(jù)集有時也稱作一個表。在數(shù)據(jù)庫術(shù)語中一個觀測稱作一個記錄,一個變量稱作一個域

18、。在C0401數(shù)據(jù)集中有5個觀測,分別代表5個學生的情況,而每個學生有5個數(shù)據(jù),分別為姓名、性別、數(shù)學成績、語文成績、平均分,所以此數(shù)據(jù)集有5個變量,變量名依次為NAME、SEX、MATH、CHINESE和AVG。,,從上面看出,數(shù)據(jù)集要有名字,變量要有名字,所以SAS中對名字(數(shù)據(jù)集名、變量名、數(shù)據(jù)庫名,等等)有約定:SAS名字由英文字母、數(shù)字、下劃線組成,第一個字符必須是字母或下劃線,名字最多用8個字符,大寫字母和小寫字母不區(qū)分。比

19、如,name,abc,aBC,x1,year12,_NULL_等是合法的名字,且abc和aBC是同一個名字,而class-1(不能有減號)、a bit(不能有空格)、serial#(不能有特殊字符)、Documents (超長)等不是合法的名字。,,邏輯庫   SAS系統(tǒng)將所使用的文件以庫的形式組織起來,而數(shù)據(jù)集則存放在一個庫中,這個庫就稱為邏輯庫。前面見到過的libname命令就用于指定庫標記。其一般格式為:    Libname

20、 庫名稱 ‘文件夾位置’ 選項;例如libname a 'd:\sysdata\';data a.aaaa; input x @@; cards; 1 2 3 4 5; proc print; var x;run; quit;第一行就指定d:\sysdata\為邏輯庫位置,其名稱為a.,,引用在邏輯庫中數(shù)據(jù)集時要使用兩級名稱來指定,第一級為庫名稱,第二級為數(shù)據(jù)集名,中間用句點“.”隔

21、開。即用   庫名稱.數(shù)據(jù)集名的格式來引用該數(shù)據(jù)集?!  ∪匀皇巧厦娴睦樱?~6句新建一個數(shù)據(jù)集,數(shù)據(jù)集名稱為aaaa,就可用a.aaaa來引用該數(shù)據(jù)集。,,數(shù)據(jù)步的基本結(jié)構(gòu)   數(shù)據(jù)步均以DATA語句開始,用于創(chuàng)建和處理數(shù)據(jù)集。數(shù)據(jù)步中常用的語句如下表:      表2 數(shù)據(jù)步的常用語句,,,下面是幾個例子。Data語句:Data abc; data work.abc data sasuser.abc; d

22、ata a.abc;INPUT語句:Input x y z; /*輸入變量x,y,z*/Input x1-x10; /*輸入10個變量x1到x10*/Input x$y@@; /*輸入變量x,y,符號$指明x為字符變量,@@表示數(shù)據(jù)是連續(xù)讀入*/,,完整例子:libname a 'd:\sysdata\';/*設(shè)定邏輯庫,庫名為a*/data a.aaaa; /*建立數(shù)據(jù)集,其名為aaaa*

23、/ input x @@; /*輸入變量x, @@表示數(shù)據(jù)是連續(xù)讀入*/ cards; /*準備輸入數(shù)據(jù)*/ 1 2 3 . 5; /*輸入數(shù)據(jù),注意有缺失值(缺失值用單獨的小數(shù)點代表)*/,五、SAS程序的過程步,通俗地說,SAS程序的過程步就是用于實現(xiàn)各種統(tǒng)計分析功能的SAS命令,我們只需要按照其格式調(diào)用它們。過程步總是以一個proc語句開始,后面緊跟著過程步名。下表列出一些常用的過程步名及功能。,,,過程步的基本結(jié)構(gòu)

24、SAS過程步的一般形式為:PROC 過程名 DATA=輸入數(shù)據(jù)集 選項;過程語句 / 選項;過程語句 / 選項;……RUN;    其中PROC語句的選項是可選的,用來規(guī)定過程運行的一些設(shè)置,如果有多個選項用空格分開。DATA=輸入數(shù)據(jù)集也是可選的,如果缺省的話使用最近生成的數(shù)據(jù)集。過程步一般以RUN 語句結(jié)束。通常情況下,過程語句與數(shù)據(jù)步中的語句不同,數(shù)據(jù)步中的語句不能用在過程步中

25、。過程步語句一般以某一個關(guān)鍵字開頭,比如VAR、BY、TABLES、WEIGHT等,語句中有一些有關(guān)說明,如果有選擇項的話要寫在斜杠后。,,SAS過程步常用語句 本小節(jié)簡單介紹幾個在SAS過程步中常見的語句,更具體的用法可以在以后實際用到時再仔細體會。 1.DATA選項 用于指明所需要處理的數(shù)據(jù)集,如果缺省的話使用最近生成的數(shù)據(jù)集。2.VAR語句 VAR語句在很多過程中用來指定分析變量。在VAR后面給出變量列表:V

26、AR 變量名1 變量名2 … 變量名n; 變量名列表可以使用省略的形式,如X1-X3, MATH--CHINESE等。例如:Proc print; var math chinese;run;,,3.MODEL語句 MODEL語句在一些統(tǒng)計建模過程中用來指定模型的形式。其一般形式為 MODEL 因變量 = 自變量表 / 選項; 比如,將下列語句放在某一過程步中 model math

27、=chinese;則用語文成績預(yù)測數(shù)學成績。4.BY語句和CLASS語句5.OUTPUT語句 6.FREQ語句和WEIGHT語句7.ID語句8.WHERE語句9.LABEL語句和FORMAT語句,六、SAS語言入門,SAS是一種專用的數(shù)據(jù)處理、統(tǒng)計計算語言,但是它也包含一般的高級語言編程能力并擴充了許多數(shù)學、統(tǒng)計等方面的函數(shù)。由于SAS的數(shù)據(jù)處理功能非常強大,我們并不提倡用它來編復(fù)雜的程序,因此,我們只介紹SAS語言用來進

28、行一般編程計算的功能。SAS語言的編程計算能力主要由SAS數(shù)據(jù)步提供(另外SAS還提供了一個SAS/IML模塊可以進行向量、矩陣運算,讀者有興趣可以自己學習)。所以,下面給出的例子如果沒有寫DATA語句實際應(yīng)該在例子前面加上DATA語句,在后面加上RUN語句才能運行。注意DATA語句總是以關(guān)鍵字DATA 開頭,后面給出一個數(shù)據(jù)集名,就是本數(shù)據(jù)步要生成的數(shù)據(jù)集的名字,例如:data tmp1;也可以省略數(shù)據(jù)集名,這時SAS自動生成一

29、個臨時數(shù)據(jù)集名。,,1.賦值語句在SAS中用賦值語句計算一個值并存放到變量中。格式為   變量名 = 表達式; 例如: avg = (math + chinese/120*100)/2;/* 計算平均分數(shù),賦值給變量avg*/isfem = (sex='女'); /*先生成一個取值為0或1的值,性別為女時為1,否則為0*,然后賦值給變量isffem*/newv = .; /*將變量賦了缺失值*/ 注意想試驗上

30、述語句要把它們放入數(shù)據(jù)步中,并且等號右邊的表達式中的各變量應(yīng)該是存在的,否則會得到缺失值結(jié)果。,,2.輸出語句SAS數(shù)據(jù)步的輸出一般是數(shù)據(jù)集,用賦值語句計算的結(jié)果會自動寫入數(shù)據(jù)集。SAS也提供了一個PUT語句,可以象其它語言程序的PRINT、WRITE(*,*)、printf等語句一樣立即打印輸出結(jié)果。PUT的基本語法很多,只舉幾例:,,data; x=0.5; y=sin(x); put 'Sine funct

31、ion value of ' x 'is ' y;run;結(jié)果將在運行記錄窗口顯示一行 Sine function value of 0.5 is 0.4794255386,,在PUT語句中使用“變量名=”來指定輸出項可以顯示帶有變量名的輸出結(jié)果,比如把上程序中的PUT語句改為 put x= y=;則結(jié)果在LOG窗口顯示為 X=0.5 Y=0.4794255386,,分支結(jié)構(gòu)如果需要在

32、某條件滿足時執(zhí)行某一操作,可以用IF 條件 THEN 程序塊 ELSE 程序塊的結(jié)構(gòu),其中Else語句及其后的程序塊可以省略。需要注意的是,如果程序塊只有一句,則可直接寫出,否則應(yīng)以DO開始,以END結(jié)束。,,比如, if max(a)0 THEN DO; PUT ' X為正數(shù)'; x = 2*x; PUT x=; END;注意SAS的分

33、支結(jié)構(gòu)的寫法與其它語言有些不同,它不用ENDIF結(jié)束。,,循環(huán)結(jié)構(gòu) SAS數(shù)據(jù)步可以使用循環(huán)結(jié)構(gòu),主要的是兩種:計數(shù)DO循環(huán)和當型、直到型循環(huán)。 計數(shù)DO循環(huán)的寫法是:  DO 計數(shù)變量 = 起始值 TO 結(jié)束值 BY 步長;循環(huán)體語句……END; 在循環(huán)體中可以用LEAVE語句跳出循環(huán),相當于C語言的break語句;用CONTINUE語句可以立即結(jié)束本輪循環(huán)并轉(zhuǎn)入下一輪循環(huán)的判斷與執(zhí)行 .,,當型循環(huán)

34、的語法是:DO WHILE(循環(huán)繼續(xù)條件); 循環(huán)體語句……END; 程序先判斷循環(huán)繼續(xù)條件是否成立,成立時執(zhí)行循環(huán)體語句,再判斷循環(huán)繼續(xù)條件,如此重復(fù),直到循環(huán)繼續(xù)條件不再成立。直到型循環(huán)的寫法是: DO UNTIL (循環(huán)退出條件);循環(huán)體語句……END; 程序先執(zhí)行循環(huán)體,然后判斷循環(huán)退出條件是否成立,成立則結(jié)束循環(huán),否則繼續(xù)。注意每輪循環(huán)都是先執(zhí)行循環(huán)體再判斷是否退出。,

35、,如:data; DO i = 1 TO 20 BY 2; j = i**3; put i 3. j 5.; END;run;可以輸出一個1,3,5,7,…,19的立方表。,七、SAS的基本統(tǒng)計分析功能,前面我們已經(jīng)對SAS系統(tǒng)進行了簡要的介紹,下面我們講如何用SAS進行基本的統(tǒng)計檢驗、線性回歸、方差分析等基本統(tǒng)計分析。我們既使用SAS語言編程,也使用SAS的菜單界面。統(tǒng)計中常用的是對總

36、體作正態(tài)性檢驗、均值檢驗、方差檢驗。下面我們就專門介紹這幾個檢驗。,,1. 正態(tài)性檢驗  在PROC UNIVARIATE語句中加上NORMAL選項就可以進行正態(tài)性檢驗。例1 我們有兩個班學生的考試成績的數(shù)據(jù),分數(shù)如下:31 67 73 45 75 41 99 64 95 71 97 74 77 28 95 74 63 52

37、 79 40 84 86 63 69 21 4 45 86 52 18 44 74 74 64 91 63   4 31 85 21 60 35 25 31 58 82 70 64 10 75 78 88 96 51

38、 86 74 50 64 15 88 27 37 80 69 25 74 97 44 47 88 79 63 3 50 67 75問這次考試的分數(shù)是否服從正態(tài)分布?,,要檢驗這些數(shù)據(jù)是否服從正態(tài)分布,只要用如下UNIVARIATE過程:data stuscore; /*首先輸入數(shù)據(jù)*/ input

39、score@@; cards; 31 67 73 45 75 41 99 64 95 71 97 74 …… (其它數(shù)據(jù)略); PROC UNIVARIATE data=stuscore normal;/*正態(tài)分布檢驗*/ VAR score;RUN;,,結(jié)果(部分)如下: Tests for

40、Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.9477   Pr D W-Sq A-Sq 2000時用Kolmogorov D統(tǒng)計量。我們可以看到,p值很小,所以在0.05水平(或0.10水平)下應(yīng)拒絕零假設(shè),即認為數(shù)據(jù)非正

41、態(tài)。,,歸納:(1)用于檢驗正態(tài)性的命令是:PROC UNIVARIATE data=數(shù)據(jù)集 normal;/*正態(tài)分布檢驗*/ VAR 要檢驗變量名;RUN; (2)用于檢驗正態(tài)性的重要指標是:Prα(一般是0.05),則接受假設(shè)(即數(shù)據(jù)服從正態(tài)分布),否則拒絕假設(shè)(即數(shù)據(jù)不服從正態(tài)分布)。,,2. 正態(tài)總體均值的假設(shè)檢驗一、單個總體N(μ,σ2)均值μ的檢驗1.σ已知時的μ檢驗(u檢驗法)例2 某車間用一臺包裝機包裝

42、葡萄糖。包得的袋裝糖重是一個隨機變量,它服從正態(tài)分布。當機器正常時,其均值為0.5公斤,標準差為0.015公斤。某日開工后為檢驗包裝機是否正常,隨機地抽取它所包裝的糖9袋,稱得凈重為(公斤):0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512問機器是否正常?,,解 按題意需檢驗假設(shè)操作步驟:(1)首先輸入數(shù)據(jù),程序為data u_weight;

43、input weight@@; cards;0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512;run;運行上述程序。,,(2)選擇Solutions→Analysis→Analyst菜單,(3)選擇File→Open By SAS Name→Work→u_weight,(4) 選擇Statistics→Hypothesis,(5) 選擇One-

44、Sample z-test for a mean,出現(xiàn)圖2,,,圖2 u-檢驗的變量設(shè)置,,(6)在圖2的窗口中設(shè)置變量,我們選擇變量為weight,Null:Mean處是零假設(shè),填入0.5,Alternate處是備擇假設(shè),我們選^=,Tests按鈕可以選擇顯著性水平,默認是0.05,Std.Dev.處填入標準差0.015。,,(7)單擊OK,產(chǎn)生輸出結(jié)果。 One Sample Z Test for a Mean Sampl

45、e Statistics for weight N Mean Std. Dev. Std. Error ------------------------------------------------- 9 0.51 0.01 0.00 Hypothesis Test Nul

46、l hypothesis: Mean of weight = 0.5 Alternative: Mean of weight ^= 0.5 With a specified known standard deviation of 0.015 Z Statistic Prob > Z ----------

47、- -------- 2.244 0.0248,,結(jié)果分析:由上可見,平均值為0.51,標準差為0.01,z統(tǒng)計量是2.244, Prob > Z的值為0.0248<α=0.05,因此應(yīng)該拒絕H0,即認為這天包裝機不正常。,,實際上,如果是雙邊檢驗,利用ttest過程要更方便簡捷。例如對本題,在第一步輸入數(shù)據(jù)后,運行下面的程序:PROC ttest data=

48、u_weight h0=0 alpha=0.05; var weight;RUN;即得如下結(jié)果:,,The TTEST Procedure Statistics Lower CL Upper CL Lower CL Upper CL Variable N M

49、ean Mean Mean Std Dev Std Dev Std Dev Std Err Minimum Maximum weight 9 0.504 0.5112 0.5184 0.0063 0.0094 0.018 0.0031 0.497 0.524 T-Tes

50、ts Variable DF t Value Pr > |t| weight 8 163.31 |t|的值<.0001<α=0.05,因此應(yīng)該拒絕H0,即認為這天包裝機不正常。,,2.σ未知時的μ檢驗(t檢驗法)例3.某種電子元件的壽命x(以小時計)服

51、從正態(tài)分布, μ, σ2均未知.現(xiàn)測得16只元件的壽命如下:159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170問是否有理由認為元件的平均壽命大于225(小時)?,,解 按題意需檢驗假設(shè)操作步驟:(1)首先輸入數(shù)據(jù),程序為data lifetest; input life@@; cards;0.497 0

52、.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512;run;運行上述程序。,,,(2) 選擇Solutions→Analysis→Analyst菜單,(3) 選擇File→Open By SAS Name→Work→lifetest,(4) 選擇Statistics→Hypothesis,(5) 選擇One-Sample t-test for a mean,出現(xiàn)圖3,,

53、,圖3 t-檢驗的變量設(shè)置,,(6)在圖3的窗口中設(shè)置變量,我們選擇變量為life,Null:Mean處是零假設(shè),填入225,Alternate處是備擇假設(shè),我們選>=,Tests按鈕可以選擇顯著性水平,默認是0.05。,,(7)單擊OK,產(chǎn)生輸出結(jié)果。 One Sample t-test for a Mean Sample Statistics for life N

54、 Mean Std. Dev. Std. Error ------------------------------------------------- 16 241.50 98.73 24.68 Hypothesis Test Null hypothesis: Mean of life 225

55、 t Statistic Df Prob > t --------------------------------- 0.669 15 0.2570,,結(jié)果分析:由上可見,平均值為241.50,標準差為98.73,標準偏差為24.68,t統(tǒng)計量是0.669, Prob > t 的值為0.

56、2570>α=0.05,因此應(yīng)該接受H0,即認為元件的平均壽命不大于225小時。,二、兩個正態(tài)總體均值差的檢驗,例4.在平爐上進行一項試驗以確定改變操作方法的建議是否會增加鋼的得率,試驗是在同一只平爐上進行的.每煉一爐鋼時除操作方法外,其它條件盡可能做到相同.先用標準方法煉一爐,然后用建議的新方法煉一爐以后交替進行,各煉了10爐,其得率分別為:1.標準方法 78.1 72.4 76.2 74.3 77.4 78.4

57、 76.0 75.5 76.7 77.32.新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1設(shè)這兩個樣本相互獨立,且分別來自正態(tài)總體N(μ1, σ2)和N(μ2, σ2), μ1, μ2, σ2均未知.問建議的新的操作方法能否提高得率?(取α=0.05),,解 按題意需檢驗假設(shè)操作步驟:(1)首先輸入數(shù)據(jù),程序為data mydata;

58、 input olddata newdata@@; cards;0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512;run;運行上述程序。,,,(2) 選擇Solutions→Analysis→Analyst菜單,(3) 選擇File→Open By SAS Name→Work→mydata,(4) 選擇Statistics→Hypothes

59、is,(5) 選擇Two-Sample Paired t-test for a mean,出現(xiàn)圖4,,圖4 兩個樣本u-檢驗的變量設(shè)置,,(6)在圖4的窗口中設(shè)置變量,依次選擇兩個變量,零假設(shè)處填入0,Alternate處是備擇假設(shè),我們選<0,Tests按鈕可以選擇顯著性水平,默認是0.05。,,(7)單擊OK,產(chǎn)生輸出結(jié)果。Two Sample Paired t-test for the Means of olddata and

60、 newdataSample Statistics Group N Mean Std. Dev. Std. Error ---------------------------------------------------- olddata 10 76.23 1.8233 0.5766

61、 newdata 10 79.43 1.4915 0.4717 Hypothesis Test Null hypothesis: Mean of (olddata - newdata) => 0 Alternative: Mean of (olddata - newdata) t -----------

62、---------------------- -4.202 9 0.0012,,結(jié)果分析:由上可見,t統(tǒng)計量是-4.202, Prob > t 的值為0.0012<α=0.05,因此應(yīng)該拒絕H0,即認為新方法比標準方法為優(yōu)。,,如果利用ttest過程則很簡捷。例如對本題,在第一步輸入數(shù)據(jù)后,運行下面的程序:PROC ttest data=mydata h0=0 al

63、pha=0.05;    paired olddata*newdata;RUN;,,即得如下結(jié)果: The TTEST Procedure Statistics Lower CL Upper CL Lower CL

64、 Upper CLDifference N Mean Mean Mean Std Dev Std Dev Std Dev Std Errolddata - newdata 10 -4.923 -3.2 -1.477 1.6565 2.4083 4.3967 0.7616

65、 T-Tests Difference DF t Value Pr > |t| olddata - newdata 9 -4.20 0.0023由于Pr > |t|的值= 0.00

66、23<α=0.05,因此應(yīng)該拒絕H0,即認為新方法比標準方法為優(yōu)。,3. 正態(tài)總體方差的假設(shè)檢驗,由于在SAS中,單個總體與兩個總體的情況在操作上差不多,下面只舉兩個總體的情況。例5 對例4中的數(shù)據(jù)檢驗假設(shè)(取α=0.01),,,操作步驟:(1) 首先輸入數(shù)據(jù),我們就利用前面輸入的數(shù)據(jù)集mydata。(2) 選擇Solutions→Analysis→Analyst菜單,(3) 選擇File→Open By SAS Name→Wo

67、rk→mydata,(4) 選擇Statistics→Hypothesis,(5) 選擇Two-Sample Test for Variances,出現(xiàn)圖5,,圖5 兩個樣本的方差檢驗,,(6)在圖5的窗口中設(shè)置變量,選擇Two variables(兩個變量),依次選一個變量,按Group1按鈕及Group2按鈕,Alternate處是備擇假設(shè),我們選<1,Intervals按鈕可以選擇顯著性水平,默認是0.05,我們選0.01。,

68、,(7)單擊OK,產(chǎn)生輸出結(jié)果。Two Sample Test for Variances of olddata and newdata Sample Statistics Group N Mean Std. Dev. Variance --------------------------------------------------

69、 olddata 10 76.23 1.8233 3.324556 newdata 10 79.43 1.4915 2.224556 Hypothesis Test Null hypothesis: Variance 1 / Variance 2 = 1 Alternative: V

70、ariance 1 / Variance 2 ^= 1 - Degrees of Freedom - F Numer. Denom. Pr > F ---------------------------------------------- 1.49 9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論