版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、,簡明應用統(tǒng)計學(第2版),第 1 章 統(tǒng)計學緒論,1.1 引言1.2 什么是統(tǒng)計學1.3 為什么要學習統(tǒng)計學1.4 統(tǒng)計學的類型1.5 變量的類型1.6 測量的水平1.7 數(shù)據(jù)的收集1.8 統(tǒng)計軟件,學習目標,1. 理解我們?yōu)槭裁匆獙W習統(tǒng)計學。2. 什么是描述統(tǒng)計學和推斷統(tǒng)計學。3. 區(qū)別定性變量和定量變量,區(qū)別離散變量和連續(xù)變量。4. 區(qū)別變量的定類、定序、定距和定
2、比測度水平。5. 知道數(shù)據(jù)的四種收集方式。6. 知道常用的統(tǒng)計軟件。,根據(jù)最新的研究結(jié)果,消費者的行為對自然資源到底有怎樣的影響呢?你應該買使用柴油發(fā)動機的汽車,還是購買電動車,或者干脆騎自行車呢?報紙、雜志或網(wǎng)絡中的統(tǒng)計結(jié)果對于你的決定非常關(guān)鍵,這些結(jié)果建議你該有怎樣的消費觀。,1.1 引言,在金融危機發(fā)生后,各國政府對于國家經(jīng)濟的現(xiàn)狀和對未來經(jīng)濟走勢的預測十分關(guān)注,每個月都要編制CPI等各類指數(shù)以評價通貨膨脹情況。有關(guān)商
3、品銷售額、新開工的住宅、貨幣流通以及工業(yè)生產(chǎn)的信息僅僅是構(gòu)成預測基礎的成百上千類信息的一小部分。我們該如何解讀這些數(shù)據(jù)呢?知道一些統(tǒng)計知識有助于我們知道這些數(shù)據(jù)是如何與我們的生活息息相關(guān)的。假設你是市場部的新任經(jīng)理,一次廣告活動的統(tǒng)計結(jié)果擺到了你面前,聲稱某個結(jié)果是“統(tǒng)計顯著”的。你如何解釋這份報告而又不暴露你對該術(shù)語的無知呢?趕快學點統(tǒng)計,這對你和你的事業(yè)都非常有用。,1.1 引言,統(tǒng)計學是收集、分析、表述和解釋數(shù)據(jù)的科學(不列
4、顛百科全書)統(tǒng)計是一門收集、分析、解釋和提供數(shù)據(jù)的科學(韋伯斯特國際辭典第3版)統(tǒng)計指的是一組方法,用來設計實驗、獲得數(shù)據(jù),然后在這些數(shù)據(jù)的基礎上組織、概括、演示、分析、解釋和得出結(jié)論(Mario F.Triola,《初級統(tǒng)計學》) 統(tǒng)計學是數(shù)據(jù)的科學和藝術(shù),1.2 什么是統(tǒng)計學? (statistics),1. 收集數(shù)據(jù):取得數(shù)據(jù)2. 處理數(shù)據(jù):整理與圖表展示 分析數(shù)據(jù):利用統(tǒng)計方法分析數(shù)據(jù)數(shù)據(jù)解釋:結(jié)果的說明
5、得到結(jié)論:從數(shù)據(jù)分析中得出客觀結(jié)論,?收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學,1.2 什么是統(tǒng)計學? (statistics),2009年8月6日《紐約時報》發(fā)表大幅文章《當今大學畢業(yè)生的唯一關(guān)鍵詞是:統(tǒng)計學》(For Today‘s Graduate, Just One Word: Statistics).文章舉例說明統(tǒng)計對各行各業(yè)的重要性。2009年8月25日華爾街雜志刊登《有利于找工作的5個專業(yè)》文章,認為在美國
6、“工程、生命科學、統(tǒng)計學、環(huán)境研究和金融”是就業(yè)市場最受歡迎的專業(yè)。2010年6月3日第64屆聯(lián)合國大會第90次會議通過決議,每年10月20日被聯(lián)合國確定為“世界統(tǒng)計日”。體現(xiàn)出全世界對統(tǒng)計數(shù)據(jù)和統(tǒng)計空前的關(guān)注和重視。2011年2月美國《科學》雜志以數(shù)據(jù)為主題出版???,學術(shù)界對數(shù)據(jù)和數(shù)據(jù)分析高度關(guān)注。,1.3 為什么要學習統(tǒng)計學,統(tǒng)計在許多學科中得到廣泛的應用。比如說,學術(shù)研究雜志就依賴于統(tǒng)計結(jié)果。在許多學科中,一篇文章是否能夠發(fā)
7、表在主要雜志上,在很大程度上取決于該文章是否能正確地使用統(tǒng)計方法。除了學術(shù)領域,統(tǒng)計在其他領域也被人們廣泛使用。統(tǒng)計在工業(yè)中得到大量使用,尤其用于研究新產(chǎn)品、質(zhì)量控制和市場開發(fā)中;市場調(diào)查也需要統(tǒng)計。,1.3 為什么要學習統(tǒng)計學,統(tǒng)計的應用領域,經(jīng)濟學,管理學,醫(yī)學,工程學,社會學,,,,,,…,,統(tǒng)計學,統(tǒng)計的應用領域,actuarial work (精算) agriculture (農(nóng)業(yè))an
8、imal science (動物學) anthropology (人類學)archaeology (考古學) auditing (審計學)crystallography (晶體學) demography (人口統(tǒng)計學)dentistry (牙醫(yī)學) ecology (生態(tài)學)econometri
9、cs (經(jīng)濟計量學) education (教育學) election forecasting and projection (選舉預測和策劃)engineering (工程) epidemiology (流行病學)finance (金融)fisheries research (水產(chǎn)漁業(yè)研究)gambling (賭博)
10、 genetics (遺傳學)geography (地理學) geology (地質(zhì)學)historical research (歷史研究) human genetics (人類遺傳學),統(tǒng)計的應用領域,hydrology (水文學) industry (工業(yè)) linguistics (語言學)
11、 literature (文學)manpower planning (勞動力計劃)management science (管理科學)marketing (市場營銷學) medical diagnosis (醫(yī)學診斷)meteorology (氣象學) military science (軍事科學)nuclear material safeg
12、uards (核材料安全管理)ophthalmology (眼科學) pharmaceutics (制藥學)physics (物理學) political science (政治學)psychology (心理學) psychophysics (心理物理學)quality control (質(zhì)量控制)
13、 religious studies (宗教研究)sociology (社會學) survey sampling (調(diào)查抽樣)taxonomy (分類學) weather modification (氣象改善),1.3 為什么要學習統(tǒng)計學,(1)數(shù)據(jù)無處不在。 (2)統(tǒng)計學技術(shù)對于我們做出影響日常生活的許多決
14、 策都十分有用。 (3)無論你以后從事什么工作,你都會面臨與數(shù)據(jù)打 交道做出決策的問題。對統(tǒng)計學方法的了解將有 助于你更加有效的做出決策。,數(shù)據(jù)收集過程:抽樣(sampling)。比如,為了估計某一家超市所有顧客平均年齡,你只需要收集部分顧客的年齡信息,得到平均年齡的估計以后,你就可以針對這個年齡層的顧客,制定相應廣告信息。統(tǒng)計涉及兩個不同階段:(1)描述數(shù)據(jù)集和(2)根據(jù)樣本信息得出結(jié)論(估計、預測等)
15、。統(tǒng)計的應用可以被分為兩個部分:描述統(tǒng)計學和推斷統(tǒng)計學。,1.4 統(tǒng)計學的類型,1.4 統(tǒng)計學的類型,描述統(tǒng)計(descriptive statistics),研究數(shù)據(jù)收集、處理、匯總、圖表描述、概括與分析等統(tǒng)計方法 內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析 目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律,推斷統(tǒng)計 (inferential statistics),研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法內(nèi)容參數(shù)估計假
16、設檢驗目的對總體特征作出推斷,,1.5 變量 (variable),變量是說明現(xiàn)象某種特征的概念如商品銷售額、受教育程度、產(chǎn)品的質(zhì)量等級等,變量的具體表現(xiàn)稱為變量值,即數(shù)據(jù)變量的值(value)通常是對某一特定個體的度量,特定個體可能是指一個人,一個家庭,一個地區(qū),或一個國家。從表中可知,性別變量是以人為個體的觀測,孩子的數(shù)目是以家庭為個體的觀測。,變量 (variable),定性變量(qualitative vari
17、able)或?qū)傩宰兞浚╝ttribute variable)定性變量取的值稱為水平(level)或者類(class)。比如,姓名、性別、行業(yè)、出生地、國籍/地區(qū)以及汽車類型都是定性變量。定性數(shù)據(jù)通常以餅圖或者條形圖(詳見第2章)的形式表示。定量變量(quantitative variable)定量變量例子比較多,比如年齡、壽命、公司的員工人數(shù)、薪水金額等等。定量變量又可以分為連續(xù)的和離散的。離散變量(discrete va
18、riable)只能取某些特定的值,并且不同取值之間通常都存在著間距。比如具有某種特征的人口(取正整數(shù)值)、某種事故發(fā)生的次數(shù)(非負整數(shù))、足球射門次數(shù)等等。連續(xù)變量(continuous variable)的觀測值可以遍取某一區(qū)間中的任何值。身高、體重、長度等等都是連續(xù)變量的例子。,變量的類型 (variable),【例1.1】 下面是關(guān)于是否喜歡鍛煉的部分調(diào)查數(shù)據(jù)。,表1.1 是否喜歡鍛煉的部分調(diào)查數(shù)據(jù),表1.1中的姓名、是否鍛煉
19、為定性變量。出生日期、身高和體重為定量變量,出生日期是離散變量,而身高和體重為連續(xù)變量。,變量(例題分析),變量(其他分類),隨機變量和非隨機變量經(jīng)驗變量(empirical variables)和理論變量(theoretical variables)經(jīng)驗變量所描述的是我們周圍可以觀察到的事物理論變量則是由統(tǒng)計學家用數(shù)學方法所構(gòu)造出來的一些變量,比如,z 統(tǒng)計量、t 統(tǒng)計量、?2統(tǒng)計量、F 統(tǒng)計量等,,變量及其類型,數(shù)據(jù)還可以
20、按照測量水平進行分類。數(shù)據(jù)的測量水平通常制約著在數(shù)據(jù)概括和顯示時可以選用的計算方法,它還決定著應該使用何種統(tǒng)計檢驗方法。,1.6 測量的水平,通常,可以從下面幾個方面獲得數(shù)據(jù):來自于公開發(fā)表資料中的數(shù)據(jù)統(tǒng)計年鑒有關(guān)期刊有關(guān)網(wǎng)站實驗設計數(shù)據(jù)調(diào)查數(shù)據(jù)觀察數(shù)據(jù),1.7 數(shù)據(jù)收集,統(tǒng)計數(shù)據(jù)的分類,統(tǒng)計數(shù)據(jù)的分類,統(tǒng)計數(shù)據(jù)的分類 (按計量尺度分),分類數(shù)據(jù)(categorical data) 只能歸于某一類別的非數(shù)字型數(shù)據(jù)對
21、事物進行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,用文字來表述例如,人口按性別分為男、女兩類 順序數(shù)據(jù)(rank data) 只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)對事物類別順序的測度,數(shù)據(jù)表現(xiàn)為類別,用文字來表述例如,產(chǎn)品分為一等品、二等品、三等品、次品等 數(shù)值型數(shù)據(jù)(metric data) 按數(shù)字尺度測量的觀察值結(jié)果表現(xiàn)為具體的數(shù)值,對事物的精確測度例如:身高為175cm、168cm、183cm,觀測的數(shù)據(jù)(observation
22、al data) 通過調(diào)查或觀測而收集到的數(shù)據(jù)在沒有對事物人為控制的條件下而得到的有關(guān)社會經(jīng)濟現(xiàn)象的統(tǒng)計數(shù)據(jù)幾乎都是觀測數(shù)據(jù)實驗的數(shù)據(jù)(experimental data) 在實驗中控制實驗對象而收集到的數(shù)據(jù)比如,對一種新藥療效的實驗,對一種新的農(nóng)作物品種的實驗等自然科學領域的數(shù)據(jù)大多數(shù)都為實驗數(shù)據(jù),統(tǒng)計數(shù)據(jù)的分類(按收集方法分),統(tǒng)計數(shù)據(jù)的分類(按時間狀況分),截面數(shù)據(jù)(cross-sectional data)
23、在相同或近似相同的時間點上收集的數(shù)據(jù)描述現(xiàn)象在某一時刻的變化情況比如,2005年我國各地區(qū)的國內(nèi)生產(chǎn)總值數(shù)據(jù)時間序列數(shù)據(jù)(time series data) 在不同時間上收集到的數(shù)據(jù)描述現(xiàn)象隨時間變化的情況比如,2000年至2005年國內(nèi)生產(chǎn)總值數(shù)據(jù),數(shù)據(jù)收集的第一個準則是要清楚測量的是什么。換句話說,變量必須有一個明確的適合研究目的的定義。這有時是說起來容易做起來難。如果我們對問題考慮得不全面,那么就沒理由指望回答問題的
24、人(一般稱為響應者)能按照我們期望的回答問題。在我們做研究之前,對變量必須要有一個清晰、詳盡的定義。,1.7 數(shù)據(jù)收集:定義變量,假定我們在一次食品企業(yè)的市場調(diào)查中包含了這樣的問題"在您的家庭中有多少個孩子?"我們也許認為自己知道想要了解的是什么,但是,沒有理由期待響應者和我們有同樣的想法。,我們也許不加考慮地認為,"孩子"應定義為一個不滿18歲并和他(她)的親生父母一起生活的人。但如果一個家庭
25、中包含大于18歲的親生子女、前妻或前夫的孩子、養(yǎng)子或養(yǎng)女、過繼子女或者其他年輕的親戚,那該怎么辦呢?對于不和親生父母生活在一起的孩子怎么算呢?對于父母離了婚而共同撫養(yǎng)的孩子怎么算呢?這有很多種發(fā)生混淆的可能。因此,我們在調(diào)查之前首先需要明確"孩子"的定義。,1.7 數(shù)據(jù)收集:定義變量,數(shù)據(jù)表通常叫做數(shù)據(jù)陣或數(shù)據(jù)文件。下表是一個根據(jù)抽樣調(diào)查得來的數(shù)據(jù)生成的小數(shù)據(jù)陣的例子。,1.7 數(shù)據(jù)收集:數(shù)據(jù)表,在計算機分析數(shù)據(jù)時,
26、需要把數(shù)據(jù)文件中的描述性文字轉(zhuǎn)化成數(shù)字。每一個人都被分配一個身份號碼作為名字。年齡變量本來就是用數(shù)字測量的,因此不需要任何轉(zhuǎn)化。性別變量的兩個取值是“女”或“男”,因此,“女”用數(shù)字0代替,“男”用數(shù)字1代替。當然還可以使用任何兩個別的數(shù)字,比如用17代替“女”,用23代替“男”?!皯B(tài)度”這個值可以用三個等級數(shù)1、2和3表示反對、中立和贊成。,1.7 數(shù)據(jù)收集:數(shù)據(jù)表,統(tǒng)計軟件的發(fā)展,使得只要輸入你的數(shù)據(jù),選一些選項,馬上就得到
27、令人驚嘆的漂亮結(jié)果了。那么,傻瓜式統(tǒng)計軟件的使用可以代替統(tǒng)計課程了?當然不是。數(shù)據(jù)的整理和識別,方法的選用,計算機輸出結(jié)果的理解都不像使用傻瓜相機那樣簡單可靠。而且,只要數(shù)據(jù)格式無誤、選項不矛盾而且不用零作為除數(shù),統(tǒng)計軟件就一定給你結(jié)果,而且?guī)缀鯖]有任何警告。另外,統(tǒng)計軟件輸出的結(jié)果太多。即使是同樣的方法,不同軟件輸出的內(nèi)容還不一樣,甚至有時同樣的內(nèi)容名稱也不一樣。因此,應該特別留神,明白自己是在干什么,不要在得到一堆毫無意義的
28、垃圾之后還沾沾自喜。,1.8 統(tǒng)計軟件,(1)SPSS:這是一個很受歡迎的統(tǒng)計軟件,它容易操作,輸出漂亮,功能齊全,價格合理。它也有自己的程序語言,但基本上已經(jīng)“傻瓜化”。它對于非專業(yè)統(tǒng)計工作者是很好的選擇。2009年4月,SPSS公司被IBM收購后將其重新命名為PASW(Predictive Analytics Software,預測分析軟件),不過本書仍然使用SPSS名稱。(2)Excel:嚴格說來并不是統(tǒng)計軟件,但作為數(shù)據(jù)表格軟
29、件有一定統(tǒng)計計算功能。而且凡是裝有Microsoft Office的計算機,基本上都有Excel。但要注意,有時在安裝Office時沒有安裝數(shù)據(jù)分析的功能,則必須安裝該功能后才能進行數(shù)據(jù)分析。當然,畫圖功能是默認具備的。對于簡單分析,Excel還算方便,但隨著問題的深入,Excel就不那么“傻瓜”,需要使用宏命令來編程,這時就沒有相應的簡單選項了。多數(shù)專門一些的統(tǒng)計推斷問題還需要其他專門的統(tǒng)計軟件來處理。(3)R軟件:這是一個免費的,
30、由志愿者管理的軟件。其編程語言與S-plus所基于的S語言一樣,使用很方便。還有不少統(tǒng)計學家和愛好者不斷在R網(wǎng)站提供他們編寫的各種最新方法的統(tǒng)計軟件包和程序。它的所有計算過程和代碼都是公開的,不像多數(shù)“傻瓜”軟件“黑盒子”式的模塊。它的函數(shù)還可以被用戶按需要改寫,容易舉一反三。對于一般非統(tǒng)計工作者來說,主要問題是它沒有“傻瓜化”。,1.8 統(tǒng)計軟件,,統(tǒng)計中的幾個基本概念,本章小節(jié),1.統(tǒng)計及其應用領域統(tǒng)計數(shù)據(jù)的類型統(tǒng)計中的幾個基
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 衛(wèi)生統(tǒng)計學第1章-緒論第7版
- 統(tǒng)計學第1章
- 應用統(tǒng)計學第12章
- 1應用統(tǒng)計學緒論
- 統(tǒng)計學a第8章-統(tǒng)計指數(shù)
- 統(tǒng)計學第2章習題答
- 統(tǒng)計學第4章
- 第01章管理統(tǒng)計學
- 統(tǒng)計學第3章練習
- 統(tǒng)計學第1.2章--習題
- 第2章統(tǒng)計學統(tǒng)計數(shù)據(jù)收集
- 統(tǒng)計學原理第2版在線作業(yè)1
- 醫(yī)學統(tǒng)計學緒論 2
- 統(tǒng)計學【第5章概率】
- 統(tǒng)計學原理第2版 在線作業(yè)
- 統(tǒng)計學原理第2版在線作業(yè)
- 統(tǒng)計學原理 第2版在線作業(yè)
- 統(tǒng)計學a第6章-抽樣推斷
- 應用統(tǒng)計學---第9章-時間序列分析
- [學習]統(tǒng)計學第1章導論第二版
評論
0/150
提交評論