版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、主要內(nèi)容,§1 SPSS基本概念 §2 數(shù)據(jù)錄入 §3 數(shù)據(jù)預處理 §4用頻數(shù)做數(shù)據(jù)匯總 §5多選項分析 §6交互分析 §7T檢驗的應用 §8
2、相關(guān)分析 §9 聚類分析 §10 線性回歸分析,§1 SPSS基本知識,SPSS是Statistical Package for the Social Science的簡稱目前的主要功能有:樣本數(shù)據(jù)的描述和預處理﹑描述性統(tǒng)計﹑均值比較﹑相關(guān)分析﹑回歸分析﹑聚類分析﹑假設(shè)檢驗等 。已廣泛用于社會學﹑經(jīng)濟學﹑政治學﹑心理學﹑
3、管理學﹑市場營銷等眾多領(lǐng)域的研究。,Spss基本知識Statistical Package for the Social Science,特點易用性統(tǒng)計分析解決方案結(jié)果的權(quán)威性,作用幫助人們整理大量的數(shù)據(jù)協(xié)助人們迅速的對大量數(shù)據(jù)進行統(tǒng)計分析把分析結(jié)果以便于理解的方式展現(xiàn)出來,Spss的窗口介紹,§1.1 數(shù)據(jù)編輯器窗口,,,數(shù)據(jù)視圖窗口,,數(shù)據(jù)顯示區(qū),,變量視圖窗口,,工具攔,Spss的窗口介紹,
4、67;1.2 變量視圖窗口,,變量定義功能攔,Spss的窗口介紹,結(jié)果管理窗口,§2 數(shù)據(jù)錄入—基本概念,變量名 可以輸入變量名如var1﹑var2 ﹑age ﹑sex等。變量名以字母為首,后跟A~Z﹑0~9字符(字符≤8)變量標簽 對變量名的進一步解釋說明變量值標簽 對變量取值的解釋說明,即題項的數(shù)據(jù)化,用于對問卷數(shù)據(jù)錄入時進行編碼。例如:用1表示男,2表示女,數(shù)據(jù)錄入—基本概念,變量類
5、型 常用的變量類型主要有數(shù)值型、字符型和日期型缺失值 即存在明顯錯誤、不合理數(shù)據(jù)或漏填數(shù)據(jù)。例如:年齡223歲,數(shù)據(jù)錄入—基本概念,度量標準統(tǒng)計學中,度量是指按照某種法則給現(xiàn)象、事物或事件分派一定的數(shù)字或符號,通過測度來看刻畫事物的特征或?qū)傩?。例如:可以?8公斤來度量一個人的體重、用172厘米度量他的身高等。,數(shù)據(jù)錄入—基本概念,按照度量的程度不同,spss將度量分為以下三種標準:定距數(shù)據(jù)(scale)度量
6、 不僅能夠區(qū)分出研究對象的不同類別﹑不同等級,而且能確定不同等級之間的距離,即可以做加減法。如年齡變量。定序數(shù)據(jù)(Ordinal)有序 能夠區(qū)分出研究對象的不同類別,而且可以區(qū)分出類別之間的強弱﹑大小﹑高低。例如可以將人們的態(tài)度看作一個定序變量,將態(tài)度分為:非常贊成﹑較贊成﹑一般﹑較不贊成﹑很不贊成定類數(shù)據(jù)(Nominal)名義 能區(qū)分現(xiàn)象﹑事物的不同性質(zhì),而不能從規(guī)模大小等方面進行區(qū)分。如性別﹑
7、婚姻狀況等。,數(shù)據(jù)錄入,單項選擇題處理:根據(jù)題項賦值多項選擇題的處理分類法 估計多選項問題最多可能出現(xiàn)的答案個數(shù),然后為估計的每個答案設(shè)置一個變量,變量取值為多選項問題中的可選答案二分法 一般是將題中每個選項作為一個變量處理,采取“0,1”編碼,”1”表示即選擇了這項,”0”表示沒有選擇這一項開放式問題錄入 一般根據(jù)大意精簡后直接輸入,數(shù)據(jù)類型設(shè)為字符型 問卷.xls,§ 3 數(shù)據(jù)
8、預處理,數(shù)據(jù)的合并 點擊Data → Merge File →Add cases :出現(xiàn)Read file對話框→找到問卷示例.sav →點擊”打開” →彈出對話框 Add Case From,,Read file對話框,數(shù)據(jù)預處理—數(shù)據(jù)合并,當出現(xiàn)Add case from的對話框時,我們應觀察左側(cè)對話框與右側(cè)對話框變量是否匹配,左側(cè)為不能匹配的變量,右側(cè)為可以匹配的變量。見下圖。,,Add case from的對話框,數(shù)據(jù)
9、預處理—數(shù)據(jù)排序,數(shù)據(jù)排序 點擊Data →select case 選項→打開select case 對話框,出現(xiàn)以下界面。,排序個案,數(shù)據(jù)預處理—數(shù)據(jù)排序,注意:數(shù)據(jù)排序是整行排序,而不是只對某列排序多重排序中指定排序變量的次序很關(guān)鍵,排序時先指定的變量優(yōu)先于后指定變量,按某個變量升序的同時可以按其他變量降序數(shù)據(jù)排序后,原有數(shù)據(jù)的排列順序必然被打亂,應注意備份原始數(shù)據(jù),§4 用頻數(shù)做數(shù)據(jù)匯總,§4.
10、1 如何得到一張頻次表 步驟:第一步:打開問卷示例1.sav數(shù)據(jù)界面→單擊Analyze →Descriptive Statistics(描述統(tǒng)計) →Frequencies →打開Frequencies(頻率) 對話框 第二步:點選目前職業(yè)這一變量到variable框內(nèi)→單擊OK按鈕,,Frequencies 對話框,用頻數(shù)做數(shù)據(jù)匯總,SPSS頻次分析的統(tǒng)計量選項 百分比計算 集中趨勢測量 離散趨勢
11、測量 數(shù)據(jù)分布描述,§5 多選項分析,對多選項做普通頻數(shù)分析的困難,您一般在什么情況下送禮(選擇最經(jīng)常送禮的兩個場合)(1)婚嫁 (2)生日 (3)搬遷新居 (5)探親 (4)中國傳統(tǒng)節(jié)日 (7)探病 (8)西方節(jié)日場合 (9)生子 (10)畢業(yè) (11)其他這里采用分類法分解,只能得到兩個變量,采用普通頻數(shù)分析,也只能得到兩個變量的相對重要性,不能全面了解調(diào)查者看重因素的整體情況,如下圖:,多
12、選項分析—基本操作步驟,第一步:定義選擇變量集Analyze→單擊multiple response(多重響應) →define sets(定義變量集),多選項分析—基本操作步驟,第二步:采用多選項頻數(shù)分析進行數(shù)據(jù)分析單擊Analyze →multiple response →frequencies (頻率)→打開如下對話框,§6 交互分析,§6.1 如何得到一張交互表交互分析主要用于分析多變量的聯(lián)合分布
13、特征,進而分析變量之間的相互影響和關(guān)系。例如,需要了解不同文化程度的調(diào)查對象其職業(yè)情況有什么不同,進而分析文化程度與其職業(yè)是否存在一定的關(guān)聯(lián)性。 單擊Analyze →Descriptive Statistics(描述統(tǒng)計) →Crosstabs (交互分析)→打開Crosstabs對話框。,,Crosstabs對話框,交互分析,Row (s):交互表中的行變量,一般放置因變量Column (s):交互表中的列變量,一般放置自
14、變量 例如:以問卷示例1.sav為例,要分析不同文化程度的調(diào)查者的職業(yè)情況怎么樣? 步驟:第一步:Analyze →Descriptive Statistics →Crosstabs →打開Crosstabs對話框。 第二步:點選目前職業(yè)到Row (s)框內(nèi),點選文化程度到Column (s)框內(nèi)→單擊Cells 第三步:點選Percentages下面的Row﹑ Column和total →co
15、ntinue →OK,交互分析,§6.2 兩個變量之間是否相關(guān) 例如:檢查目前職業(yè)和文化程度是否相關(guān)(定類—定類) 步驟:第一步:Analyze →Descriptive Statistics →Crosstabs →點選目前職業(yè)到Row (s)框內(nèi),點選文化程度到Column (s)框內(nèi)→單擊Statistics →打開Crosstabs: Statistics 對話框,見下圖,,Crosstabs: S
16、tatistics 對話框,交互分析,第二步:點選上圖中的Chi-square→單擊continue →單擊OK按鈕。輸出以下結(jié)果,,結(jié)論。其顯著性sig.小于.01(1-置信水平),所以,職業(yè)和文化程度之間是相關(guān)的,在置信水平中設(shè)置了為99%,§7 T檢驗的應用,§7.1 單個樣本T檢驗 主要利用來自總體的樣本數(shù)據(jù)推斷該總體的均值是否與指定的檢驗值之間存在顯著差異,它是對總體均值的假設(shè)檢驗。
17、 例如:我們要根據(jù)被調(diào)查者一次的送禮花費來推斷總體一次送禮的平均花費是否為200元。 步驟:第一步,單擊Analyze→ Compare Means(比較均值) →One -Sample T Test (單樣本T檢驗)打開One -Sample T Test 主對話框,見下圖,T檢驗的應用,第二步:點選一次送禮的花費這一變量到Test Variable(檢驗值)框→在Test Value處輸入200 →單擊OK按鈕,輸出以
18、下結(jié)果。,結(jié)果分析:顯著性檢驗的p值為0,小于0.05,因此拒絕原假設(shè),認為 一次性送禮的花費與200有顯著差異。,T檢驗的應用,獨立樣本T檢驗 主要用來檢驗來自兩個總體的獨立樣本,推斷兩個總體的均值是否存在顯著差異 例如:我們要檢驗不同性別的平均一次送禮花費是否存在差異 步驟:第一步,單擊Analyze→ Compare Means →Independent -Sample T Tes
19、t(獨立樣本T檢驗) 打開Independent -Sample T Test 主對話框,見下圖,T檢驗的應用,第二步:點選一次送禮的花費這一變量到Test Variable框→點選性別變量到Grouping Variable框→單擊Define Groups 按鈕→打開Define Groups 對話框,見下圖,,Define Groups 對話框,T檢驗的應用,第三步:在定義好以后,單擊continue→返回Independent
20、-Sample T Test 主對話框→單擊OK,輸出以下結(jié)果。,,,結(jié)果分析:F統(tǒng)計量的概率為0.079大于顯著性水平0.05,認為兩總體方差無顯著差異,因此,分析第一行方差相等下的t統(tǒng)計量,其概率為0,小于0.05,認為男女性送禮費用有顯著差別。,§8 相關(guān)分析,相關(guān)分析 主要用于揭示事物之間線性關(guān)系的強弱程度,包括簡單相關(guān)和偏相關(guān)兩種類型?;痉椒ǎ合嚓P(guān)系數(shù)r(-1<=r<=1) r絕對值大于0
21、.8,有較強的線性關(guān)系;若小于0.3,兩變量間存在較弱的線性關(guān)系。 Pearson相關(guān)系數(shù):適用定距變量 Spearman相關(guān)系數(shù):適用定序變量 Kendall相關(guān)系數(shù):采用非參數(shù)檢驗方法,度量定序變量間的線性關(guān)系,相關(guān)分析—簡單相關(guān),例如,要檢驗年齡、文化程度和收入之間是否有顯著的線性關(guān)系 單擊Analyze→ correlste(相關(guān))→ bivariate(雙變量)→打開對話框,見下圖,相關(guān)分析—簡單相關(guān),將參加計
22、算的相關(guān)系數(shù)的變量選到variables中,選擇Pearson系數(shù),并選擇雙尾p值在options按鈕中的statistics選項中選擇輸出各種方差和離差。結(jié)果如圖:,結(jié)果分析:年齡和收入的相關(guān)系數(shù)為-0.078,接近于0,其線性相關(guān)性很弱,即認為年齡和收入沒有很強的線性關(guān)系,文化程度和收入的相關(guān)系數(shù)為0.379,有較弱的線性關(guān)系,即認為文化程度越高收入越高。,相關(guān)分析—偏相關(guān),偏相關(guān)關(guān)系: 它是指在諸多相關(guān)的變量中,控制其
23、中一個或若干個變量的影響后,兩個變量間的相關(guān)關(guān)系。 例如:檢驗年齡和文化程度對收入的線性關(guān)系中,控制了年齡對收入的影響后,看文化程度對收入的影響。 步驟:,單擊Analyze→ correlste→ partial(偏相關(guān))→打開對話框→點選參與分析的文化程度和收入到variable框內(nèi)→點選年齡到controlling for(控制)框內(nèi),選擇雙尾p值,對話框如下:,相關(guān)分析—偏相關(guān),結(jié)果分析:在控制年齡因素下,文化程
24、度和收入的相關(guān)系數(shù)為0.372,即文化程度與收入有較弱的正相關(guān)關(guān)系,文化程度越高,收入也越高。,偏相關(guān)分析結(jié)果:,§9 聚類分析,“物以類聚,人以群分”。聚類分析(Cluster Analysis)是依據(jù)研究對象的個體的特征,對其進行分類的方法。如通過對一些大學的基本情況(如總體規(guī)模、聲源、研究生比例、科研成果等)的對比分析,可以把特征相近的學校歸入一個類型。聚類分析實質(zhì)是建立一種分類的方法,它能夠?qū)⒁慌鷺颖緮?shù)據(jù)(或變量
25、)按照它們在性質(zhì)上的親疏程度在沒有先驗知識的情況下自動進行分類。,聚類分析,例如:要對被調(diào)查者根據(jù)婚姻狀況進行分類,其步驟如下: 單擊Analyze→ cluster(分類) →mean cluster(K均值聚類) →打開對話框,見下圖:,聚類分析,選擇case作為分類對象,并在options中指定輸出信息。其結(jié)果如下:,結(jié)果分析:將所有樣本分為兩類,一類為已婚,一類為未婚,其中未婚個數(shù)為154,已婚個數(shù)為28.,§
26、8 方差分析,§8.1 單因素方差分析 所謂方差分析:主要用于兩個及兩個以上樣本均值差別的顯著性檢驗 單擊Analyze→ Compare Means→ One Way ANOVA→打開One Way ANOVA對話框,見下圖,方差分析,Dependent list 放置因變量,要求因變量是定距變量Factor 放置自變量,要求是定類變量Contrast 用于比較和分析均值
27、的特性,一元分析,一般不用Options 擇統(tǒng)計量和缺失值處理方式,方差分析,POST HOC 它是方差相等或不相等情況下的檢驗選項 例如:檢驗被調(diào)查者不同的文化程度,其平均年收入是否存在差異 步驟:第一步,單擊Analyze→ Compare Means→ One Way ANOVA→打開One Way ANOVA對話框→點選年收入到Dependent list框內(nèi)→點選文化程度到Factor框內(nèi)
28、 第二步:同方差性檢驗 點選Homogeneity of variance →單擊Continue按鈕,輸出以下結(jié)果。,方差分析,方差分析,從上知:方差不相等且均值存在差異 第三步:檢查差異到底存在哪? 點選Equal variance not assumed下面的Dunnett’s →單擊OK,輸出以下結(jié)果。,方差分析,結(jié)論:被調(diào)查者文化程度不同,其平均年收入有顯著差異,其中大專以上的與其他學歷的調(diào)查
29、者存在顯著差異。,§10 線性回歸分析,線性回歸分析是一種應用廣泛的數(shù)量分析方法。它用于分析事物之間的統(tǒng)計關(guān)系,側(cè)重考察變量之間的數(shù)量變化規(guī)律,反映一個事物如何隨其他事物的變化而變化。與相關(guān)分析相比,它具有更強的數(shù)量關(guān)系。線性回歸的一般步驟:1、確定回歸方程中的解釋變量和被解釋變量2、通過觀察散點圖確定回歸模型3、建立回歸方程4、對回歸方程進行各種檢驗5、利用回歸方程進行預測和控制,線性回歸分析,例:分析被調(diào)查者
30、年送禮花費與年收入之間的線性關(guān)系 單擊Analyze→ Regression(回歸) →Linear(線性回歸) →打開Linear Regression對話框,見下圖:,線性回歸分析,選擇被解釋變量進入dependent(因變量)框,多個解釋變量進入indepenDent(自變量)框,并選擇相應的統(tǒng)計量,要輸出的殘差分析圖表,其對話框為:,線性回歸分析,結(jié)果分析:調(diào)整的判定系數(shù)為0.163小于0.3,因此線性關(guān)系很弱,擬合優(yōu)度不高,
31、收入對一年送禮花費的線性影響不大。,輸出結(jié)果1,線性回歸分析,結(jié)果分析:統(tǒng)計量F的p值為0,小于顯著性水平0.05,所以被解釋變量與解釋變量有顯著的線性關(guān)系。,輸出結(jié)果2,線性回歸分析,結(jié)果分析:由殘差直方圖可以知道其總體上服從均值為0的正態(tài)分布,且由于只有一個變量,其變量間不存在多重共線性,條件索引都小于10.,輸出結(jié)果3,線性回歸分析,結(jié)果分析:其t檢驗統(tǒng)計量的p值為0,小于顯著水平,所以拒絕原假設(shè),認為收入和年送禮花費有線性關(guān)系,
32、且其回歸方程應為: 年送禮費用=1957.706+0.022*年收入,輸出結(jié)果4,總體均值和方差的點估計,例題:某工廠隨機從生產(chǎn)部門抽出8件電子元器件,測得使用壽命分別為:10,12,13,12,15,13,12,13年,試對該工廠電子元件的平均使用壽命和方差進行估計。,總體均值的區(qū)間估計,設(shè)X1、X2、X3….是來自總體的一個樣本,θ是總體未知參數(shù)。對給定的a,如能確定兩個統(tǒng)計量c1和c2,滿足P{c1<θ&
33、lt;c2}=1-a;則稱(c1,c2) 是θ的置信度為1-a的置信區(qū)間。1-a為置信度或置信概率,反映置信區(qū)間包含總體參數(shù)的可靠度,通常的值為99%,95%,90%。a 稱為顯著性水平,反映置信區(qū)間未包含總體參數(shù)的概率,通常的值為0.01,0.05,0.1。,總體均值的區(qū)間估計,樣本均值的抽樣分布定理:當總體服從正態(tài)分布X ~ N(μ,σ2 )時,來自該總體的所有容量為n 的樣本的均值X’也服從正態(tài)分布,且X’的數(shù)學期望為μ,
34、方差為σ2/n,即:X’ ~ N(μ,σ2/n);中心極限定理:從一任意總體(總體均值為μ、方差為σ2)中抽取容量為n 的樣本,當n 充分大時,樣本均值X’的抽樣分布近似服從均值為μ 、方差為σ2/n的正態(tài)分布。即: X’ ~ N(μ,σ2/n);,總體均值的區(qū)間估計,抽樣均值平均誤差:估計量的標準差即樣本均值的標準差=均值的抽樣平均誤差均值抽樣極限誤差:1-α置信水平下抽樣誤差的可能范圍,稱為抽樣極限誤差或允許誤差。,總體
35、均值的區(qū)間估計,例題:某專業(yè)大學生的體重服從標準差為5.4kg的正態(tài)分布。隨機抽取36名,測得他們的平均體重為65kg,在95%的置信度下,對總體平均體重進行估計的抽樣平均誤差和抽樣極限誤差為多少?并求其置信區(qū)間。其中,Za/2=1.96。,總體均值的區(qū)間估計,假定某商場某袋裝食品總量呈正態(tài)分布,現(xiàn)隨機抽取10袋,測得重量分別為789、780、794、762、802、813、770、785、810、806 (克) ,要求以95%的置信度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- spss統(tǒng)計繪圖ppt課件
- spss方差分析 ppt課件
- spss方差分析ppt課件
- 無菌技術(shù)改ppt課件
- 教與學的心理學之心理發(fā)展理論ppt課件
- dzj清熱劑改 ppt課件
- 踐行課改 實現(xiàn)數(shù)學教與學的華麗轉(zhuǎn)身
- 《建筑業(yè)營改增》ppt課件
- 改老年人常見健康問題與護理課件ppt課件
- spss
- 教與學短語
- 教與學論文
- 1.實習課件之spss簡介和入門
- 小學語文微課《直述句改轉(zhuǎn)述句》ppt演示課件
- 課改示范校檢查校長匯報材料ppt演示課件
- spss作業(yè)
- spss練習
- spss論文
- spss習題
- spss問卷錄入
評論
0/150
提交評論