簡介:統(tǒng)計學教學課件(POWERPOINT),,制作人徐國祥馬俊玲,教育部普通高等教育“十一五”國家級規(guī)劃教材,目錄,統(tǒng)計學,第1章總論,第7章抽樣和抽樣分布,第6章概率分布,第2章統(tǒng)計資料的搜集和整理,第3章集中趨勢和離散趨勢,第4章相對指標和指數,第5章概率,第10章非參數統(tǒng)計,第8章參數估計,第9章假設檢驗,第13章統(tǒng)計決策,第11章相關分析與回歸分析,第12章時間序列分析和預測,教育部普通高等教育“十一五”國家級規(guī)劃教材,第1章,總論,返回總目錄,統(tǒng)計學的產生和發(fā)展,最早的統(tǒng)計是作為國家重要事項的記錄。從統(tǒng)計學的產生和發(fā)展過程來看,可以把統(tǒng)計學劃分為三個時期統(tǒng)計學的萌芽期、統(tǒng)計學的近代期、統(tǒng)計學的現(xiàn)代期,返回本章,返回總目錄,1統(tǒng)計學的萌芽期,統(tǒng)計學的萌芽期始于17世紀中葉至18世紀中、末葉,當時主要有國勢學派和政治算術學派。,(1)國勢學派國勢學派對統(tǒng)計學的創(chuàng)立和發(fā)展所作的貢獻為統(tǒng)計學這門學科起了一個至今仍為世界公認的名詞“統(tǒng)計學”(STATISTICS),并提出了一些仍為統(tǒng)計學者采用的術語如“顯著事項”等。國勢學派在研究各國的顯著事項時,主要是系統(tǒng)運用對比的方法來研究各國實力和強弱,實際上是“對比”思想的形象化的產物。,返回本章,返回總目錄,(2)政治算術學派,政治算術學派在統(tǒng)計發(fā)展史上的作用在數量統(tǒng)計資料的基礎上進行全面系統(tǒng)的總結,并從中提煉出理論原則。同時,政治算術學派第一次有意識地運用可度量的方法,力求把自己的論證建筑在具體的、有說服力的數字上面,依靠數量的觀察來解釋與說明社會經濟生活。,主要的代表人物威廉配第(WPETTY)、約翰格朗特(JGRAUNT),政治算術學派在很大程度上畢竟還處于統(tǒng)計核算的初創(chuàng)階段,它只能從簡單的、粗略的算術方法來對社會經濟現(xiàn)象進行計量和比較。,返回本章,返回總目錄,2統(tǒng)計學的近代期,統(tǒng)計學的近代期始于18世紀末至19世紀末,在這時期的統(tǒng)計學主要有數理統(tǒng)計學派和社會統(tǒng)計學派。,(1)數理統(tǒng)計學派主要代表人拉普拉斯(PSLAPLACE)凱特勒(AQUETELET)統(tǒng)計學之父,他把統(tǒng)計學發(fā)展中的三個主要源泉,即德國的國勢學派、英國的政治算術派和意大利、法國的古典概率派加以統(tǒng)一、改造并融合成具有近代意義的統(tǒng)計學,促使統(tǒng)計學向新的境界發(fā)展。,返回本章,返回總目錄,(2)社會統(tǒng)計學派,社會統(tǒng)計學派由德國大學教授尼斯(KGAKNIES)首創(chuàng),主要代表人物為恩格爾(CKEENGEL)和梅爾(GVMAYR),他們認為,統(tǒng)計學的研究對象是社會現(xiàn)象,目的在于明確社會現(xiàn)象內部的聯(lián)系和相互關系;統(tǒng)計方法應當包括社會統(tǒng)計調查中資料的搜集、整理,以及對其分析研究。同時,他們還認為,在社會統(tǒng)計中,全面調查,包括人口普查和工農業(yè)調查,居于重要地位;以概率論為根據的抽樣調查,在一定的范圍內具有實際意義和作用。,返回本章,返回總目錄,3統(tǒng)計學的現(xiàn)代期,從世界范圍看,自20世紀60年代以后,統(tǒng)計學的發(fā)展有3個明顯的趨勢第一,隨著數學的發(fā)展,統(tǒng)計學依賴和吸收數學營養(yǎng)的程度越來越迅速;第二,向其他學科領域滲透,或者說,以統(tǒng)計學為基礎的邊緣學科不斷形成;第三,隨著應用的日益廣泛和深入,特別是借助電子計算機后,統(tǒng)計學所發(fā)揮的功效日益增強。,返回本章,返回總目錄,統(tǒng)計學的研究對象和研究方法,1統(tǒng)計的涵義,統(tǒng)計一詞由英語“STATISTICS”翻譯過來。統(tǒng)計一般具有統(tǒng)計學、統(tǒng)計工作和統(tǒng)計資料三種涵義。統(tǒng)計工作是對社會、經濟以及自然現(xiàn)象的總體數量方面進行搜集、整理和分析的活動過程。統(tǒng)計資料是統(tǒng)計工作的成果,是統(tǒng)計工作過程所取得的各項數字和有關情況的資料,它反映現(xiàn)象的規(guī)模、水平、速度和比例關系等等,以表明現(xiàn)象發(fā)展的特征。統(tǒng)計工作的好壞直接影響統(tǒng)計資料的數量和質量。統(tǒng)計學是研究如何進行統(tǒng)計工作,是統(tǒng)計工作經驗的理論概括,又用理論和方法指導統(tǒng)計工作,推動統(tǒng)計工作的不斷提高。隨著統(tǒng)計工作的進一步發(fā)展,統(tǒng)計學不斷地充實和提高,兩者是理論和實踐的關系。,返回本章,返回總目錄,2統(tǒng)計學的研究對象,由統(tǒng)計學的發(fā)展史可知,統(tǒng)計學是從研究社會經濟現(xiàn)象的數量開始的,隨著統(tǒng)計方法的不斷完善,統(tǒng)計學得以不斷發(fā)展。因此,統(tǒng)計學的研究對象為大量現(xiàn)象的數量方面。就其性質來說,它是一門適用于自然現(xiàn)象和社會現(xiàn)象的方法論學科。,返回本章,返回總目錄,3統(tǒng)計學的研究方法,統(tǒng)計學的研究對象和性質決定著統(tǒng)計學的研究方法。統(tǒng)計學的研究方法主要有大量觀察法、綜合指標法和統(tǒng)計推斷法。,(1)大量觀察法是指對研究的事物的全部或足夠數量進行觀察的方法。大量觀察的意義在于可使個體與總體之間在數量上的偏誤相互抵消。大量觀察法的數學依據是大數定律。大數定律是隨機現(xiàn)象出現(xiàn)的基本規(guī)律,也是在隨機現(xiàn)象大量重復中出現(xiàn)的必然規(guī)律。大數定律的本質意義在于,經過大量觀察,把個別的、偶然的差異性相互抵消,而必然的、集體的規(guī)律性便顯示出來。,返回本章,返回總目錄,(2)綜合指標法,綜合指標就是從數量方面對現(xiàn)象總體的規(guī)模及其特征的概括說明。所謂綜合指標法,就是運用各種綜合指標對現(xiàn)象的數量關系進行對比分析的方法。,(3)統(tǒng)計推斷法在一定置信程度下,根據樣本資料的特征,對總體的特征作出估計和預測的方法稱為統(tǒng)計推斷法。統(tǒng)計推斷是現(xiàn)代統(tǒng)計學的基本方法,在統(tǒng)計研究中得到了極為廣泛的應用,它既可以用于對總體參數的估計,也可以用作對總體的某些假設檢驗。,返回本章,返回總目錄,統(tǒng)計學的要素和內容,1統(tǒng)計要素,統(tǒng)計的要素包括總體、樣本、推斷以及推斷的可靠性(1)總體就是要調查或統(tǒng)計的某一現(xiàn)象(如工商業(yè)中某一經濟現(xiàn)象)的全部數據的集合,就任何一個統(tǒng)計問題而言,總體是最基本的要素。(2)樣本就是從總體中隨機抽取的若干數據的子集。,返回本章,返回總目錄,就是對以樣本所包含的信息為基礎,對總體的某些特征作出決策、預測和估計。(4)推斷的可靠性推斷的可靠性測度是統(tǒng)計問題的最重要的要素,也是統(tǒng)計對企業(yè)決策最重要的貢獻,它使統(tǒng)計的推斷與“算命”截然分開。,(3)推斷,統(tǒng)計問題的4個要素小結明確調查的總體;從總體中抽取樣本并對樣本的信息加以分析;根據樣本信息對總體作出推斷;對推斷的可靠性加以測度。,返回本章,返回總目錄,2統(tǒng)計學的內容,統(tǒng)計學的內容由描述統(tǒng)計和推斷統(tǒng)計組成。,(1)描述統(tǒng)計就是指如何從一直的觀察資料,搜集、整理、分析、研究并提供統(tǒng)計的資料的理論和方法,用以說明研究現(xiàn)象的情況和特征。描述統(tǒng)計包括各種數據處理,主要是用來總括或描述數據的重要特征,而不必深入一層地去試圖推論數據本身以外的任何事情。其主要作用就是通過對現(xiàn)象進行調查,然后將所得到的大量數據加以整理、簡縮、制成統(tǒng)計圖表,并就這些數據的分布特征計算出一些概括性的數字。,返回本章,返回總目錄,(2)推斷統(tǒng)計,是指憑樣本資料來推斷總體特征的技術和方法。推斷統(tǒng)計可以利用樣本資料來代替總體資料,在觀察資料的基礎上深入一步地分析、研究和推斷,以推知資料本身以外的情況和數量關系,從而對不肯定的事物作出決斷,為進行決策提供數據依據。,推斷統(tǒng)計主要有兩種類型,即參數估計和假設檢驗。必須指出,描述統(tǒng)計是推斷統(tǒng)計的前提,而推斷統(tǒng)計是描述統(tǒng)計的發(fā)展。,返回本章,返回總目錄,統(tǒng)計在管理決策中作用的流程圖,,管理問題的提出,現(xiàn)實問題,管理問題的確立,統(tǒng)計問題的提出,管理問題的解決,管理問題的答案,統(tǒng)計問題的答案,統(tǒng)計分析,,,,,,,,,,,新問題,問題的再次提出,返回總目錄,返回本章,第2章,統(tǒng)計資料的搜集和整理,返回總目錄,統(tǒng)計調查的概念和方案的設計,統(tǒng)計調查就是對統(tǒng)計資料的搜集。它是根據統(tǒng)計研究的目的和要求,有組織、有計劃地向調查對象搜集原始資料和次級資料的過程。,原始資料又稱為初級資料,是指為了研究某個問題而進行實地觀察或通過調查所獲得的第一手資料。,次級資料是指借用原來已經加工的現(xiàn)成資料。,由于次級資料一般都是從原始資料過渡而來的,所以統(tǒng)計調查所搜集的資料主要是指原始資料。統(tǒng)計調查按照資料的組織方式不同,可以分為專門調查和統(tǒng)計報表兩類。,1統(tǒng)計調查的概念,返回本章,返回總目錄,一個完整的統(tǒng)計調查方案,應該包括以下五個方面的內容。,2統(tǒng)計調查方案的設計,(1)確定調查的目的,(2)確定調查對象、調查單位和填報單位,這是制定統(tǒng)計調查方案的首要問題。即首先要明確所搜集的資料要解決什么問題。,調查對象是被研究對象的總體。調查單位是指構成總體的每一個單位。填報單位是指受征集資料的單位。,返回本章,返回總目錄,(3)明確調查項目和制定調查表格,(4)確定調查時間,(5)制定調查的組織實施計劃,調查項目是進行調查時要向被調查者所要詢問的問題。,調查表是把確定好的調查項目按一定的邏輯順序排列在一定的表格上,凡是以文字作為答案的,可以采取問答式;凡是以數字作為答案的,則必須制定調查表。,調查時間包含兩個方面的含義一是調查資料所屬的時間;二是調查工作的起止時間。,返回本章,返回總目錄,統(tǒng)計調查的方式和方法,1專門調查,是指為了某些特定目的而專門進行的調查。這種調查多屬一次性調查,一般有普查、重點調查、抽樣調查和典型調查四種。,(1)普查是專門組織的一次性全面調查。普查所搜集的資料表明某一現(xiàn)象在某一時點或某一時期的情況,時間性要求很強。,一、統(tǒng)計調查的方式,返回本章,返回總目錄,(3)抽樣調查是指根據隨機原則從調查總體中抽取部分單位進行觀察并根據其結果推斷總體數量特征的一種非全面調查的方法。,(4)典型調查是指根據調查的目的和要求,在對研究對象進行全面分析的基礎上,有意識地選擇部分有代表性的單位進行調查,它是一種非全面調查。,返回本章,返回總目錄,抽樣調查、重點調查和典型調查之間是有區(qū)別的最大的不同點是,抽樣調查是從總體中隨機地抽取部分單位盡心調查,而重點調查和典型調查則是從總體中有意識地選擇部分單位作為調查的對象。,2統(tǒng)計報表,統(tǒng)計報表是我國搜集統(tǒng)計資料的主要方式之一,是按照國家有關法規(guī)的規(guī)定,自上而下地統(tǒng)一布置,自下而上地逐級提供統(tǒng)計資料的一種統(tǒng)計調查方法。,返回本章,返回總目錄,統(tǒng)計報表的資料來源于基層單位的原始記錄。從原始記錄到統(tǒng)計報表,中間還要經過統(tǒng)計臺賬和企業(yè)內部報表。,返回本章,返回總目錄,1直接觀察法,是指調查人員到現(xiàn)場對調查對象進行觀察、計量和登記以取得資料的方法。,二、統(tǒng)計調查的方法,2報告法,是指報告單位以各種原始記錄和核算資料為依據,向有關單位提供統(tǒng)計資料的方法。,返回本章,返回總目錄,3采訪法,是指調查員和應答者之間的一種對話。目的在于準確地搜集資料。它主要是按照事先印刷好的調查表由調查員逐一提問的方法進行的調查。,4郵寄調查法,是指通過郵政系統(tǒng)分發(fā)和收回調查表的調查方法,它是一種典型的被調查者自填法。,返回本章,返回總目錄,問卷的設計,1問卷的概念和作用,問卷,就是有問有答的調查表。,問卷調查的作用在于,(1)可以使調查研究規(guī)范化。(2)可以使調查研究程序化。(3)可以使調查研究科學化。,返回本章,返回總目錄,2問卷的基本要素,問卷的基本要素有四個前言、問題和答案、編碼、資料登錄地址。,(1)前言,是給應答者的簡短信函,一般寫在問卷的首頁或封面上。(2)問題和答案,是問卷的核心內容。(3)編碼,就是用自然數給各種答案編上號碼。(4)登錄地址,是指明每一項資料在匯總時,登錄在什么地方,實際上起著資料索引的作用。,返回本章,返回總目錄,3設計問卷時應注意的問題,(1)對每個問題和答案的設計,應充分考慮到問題的統(tǒng)計方法。(2)提問的意義要準確、清楚。(3)問題要適用于調查對象的最低文化程度。(4)問題應當短小,便于作明確的答復。(5)問題的排列應當具有邏輯性。(6)對敏感性問題設計問卷時應遵守保密的原則。,返回本章,返回總目錄,統(tǒng)計分組,1統(tǒng)計分組的意義,統(tǒng)計分組就是根據統(tǒng)計研究的需要,將統(tǒng)計總體按照一定的標志區(qū)分為若干組成部分的一種統(tǒng)計方法。,統(tǒng)計分組的作用在于(1)劃分現(xiàn)象的類型,并反映各類型組的數量特征;(2)按照某一標志將性質不同的單位進行分組,以說明現(xiàn)象的內部結構;(3)通過分組可以揭示現(xiàn)象與現(xiàn)象之間的依存關系。,返回本章,返回總目錄,2統(tǒng)計分組的標志,在進行統(tǒng)計分組時,最關鍵的問題就是如何選擇分組的標志和確定各組的界限。分組標志,是將總體區(qū)分為不同組別的標準和根據。分組標志有品質標志和數量標志2種。,(1)按品質標志分組就是按事物的品質特征進行分組。,(2)按數量標志分組就是按事物的數量特征進行分組。,返回本章,返回總目錄,3統(tǒng)計分組體系,為了從不同側面反映總體的特征,就必須運用幾個標志對總體進行分組,形成一個完整的體系,這就是統(tǒng)計分組體系。,統(tǒng)計分組體系有以下兩種不同的形式,(1)平行分組體系如果總體按照一個標志進行分組,就稱為簡單分組。同一總體的幾個簡單分組按某一規(guī)定排列起來就構成一個平行分組體系。,返回本章,返回總目錄,(2)復合分組體系如果總體同時按兩個或兩個以上的標志層疊起來分組,就稱為復合分組,由復合分組形成的分組系列就稱為復合分組體系。,返回本章,返回總目錄,頻數分布,1頻數分布的概念,在統(tǒng)計分組的基礎上,將總體中所有單位按一定標志進行分組整理,形成總體中各單位數在各組間的分布,稱為頻數分布,又稱分布數列,它是統(tǒng)計整理的結果。分布在各組的個體單位數稱為頻數,又稱次數。各組次數與總次數之比稱為頻率,又稱為比率。,根據分組標志特征的不同,分布數列可分為屬性分布數列和變量分布數列兩種。,返回本章,返回總目錄,(1)屬性分布數列是指按品質標志分組所形成的分布數列,簡稱品質數列。,對于品質數列來講,如果分組標志選擇得好、分組標準定得恰當,則事物的差異就表現(xiàn)得比較明確,總體中各組如何劃分就較易解決。屬性分布數列一般也比較穩(wěn)定,通常均能準確地反映總體的分布特征。,返回本章,返回總目錄,(2)變量分布數列是指按數量標志形成的分布數列,簡稱變量數列。,變量數列往往因人的主觀認識不同而不同,因此,按同一數量標志分組是有出現(xiàn)多種分布數列的可能。,變量數列按照用以分組的變量的表現(xiàn)形式,可以分為單項式變量數列和組距變量數列。單項式變量數列是指數列中每個組的變量值都只有一個,即一個變量值就代表一組。單項式變量數列一般是在離散型變量變異幅度不太大的情況下所采用。組距式變量數列是指按一定的變化范圍或距離進行分組的變量數列。編制組距數列適用于變量值個數較多、變動范圍較大的資料。,返回本章,返回總目錄,2頻數分布表的編制,(1)整理原始資料確定最大最小值,并計算全距,(2)確定變量數列的形式對于離散型變量,可以按一定的次序一一列舉數值;對于連續(xù)型變量,不能編制單項式變量數列,而只能貶值組距式變量數列。,(3)編制組距式變量數列應注意的問題①確定組距組距的大小要適度,要能正確地反映總體的分布特征及其規(guī)律。如果資料分布比較均勻,就可采用等距分組,否則應采用不等距分組。,②確定組限基本原則是,按這樣的組限分組后,要能是性質相同的單位歸入同一組內,使不同性質的單位按不同的組別劃分。,返回本章,返回總目錄,(4)頻數分布表的具體編制,3頻數分布表示方法,頻數分布表示方法主要有列表法和圖示法,(1)列表法即用統(tǒng)計表來表示頻數分布,并可列入累計頻數。,(2)圖示法即用統(tǒng)計圖形來表示頻數分布的方法。常用的有直方圖、折線圖和曲線圖三種。,返回本章,返回總目錄,統(tǒng)計匯總方法和統(tǒng)計表,1統(tǒng)計匯總的組織方法,統(tǒng)計匯總的組織方法基本上有兩種逐級匯總法和集中匯總法。,(2)集中匯總法是一種把全部調查資料集中到某一機構進行一次性匯總的方法。,(1)逐級匯總法就是一種從基層取得調查資料,按照一定的領導系統(tǒng),自下而上逐級整理綜合的方法。,返回本章,返回總目錄,2統(tǒng)計匯總的技術方法,在我國的統(tǒng)計實踐中,常用的有手工匯總和電子計算機匯總兩種。,3次級資料的匯總整理方法,從統(tǒng)計角度來講,對刺激資料的匯總整理主要有三種方法調整法、推算法、再分組。,返回本章,返回總目錄,4統(tǒng)計表,統(tǒng)計表是縱橫線交叉所組成的一種表格,表格內所列的是整理后系統(tǒng)的統(tǒng)計資料。其優(yōu)點在于資料易于條理化,簡單明了,且可以節(jié)省大量文字敘述,便于比較分析、檢查數值的完整性和準確性。,(2)統(tǒng)計表的內容,統(tǒng)計表是由總標題、橫行標題、縱欄標題、縱橫表格線和數字資料等基本內容構成。,(1)統(tǒng)計表的形式,統(tǒng)計表分為主詞欄和賓詞欄兩部份。,返回本章,返回總目錄,第3章,集中趨勢和離散趨勢,返回總目錄,集中趨勢的測度,集中趨勢是對頻數分布資料的集中狀況和平均水平的綜合測度。而離散趨勢是對頻數分布資料的差異程度和離散程度的測度,用來衡量集中趨勢所冊書之的代表性,或者反映變量值的穩(wěn)定性和均勻性。,常用來表達數列集中趨勢的測度有算術平均數、調和平均數、幾何平均數、中位數和眾數。這些測度在統(tǒng)計學中也稱為平均指標或平均數,可以用來反映標志值的典型水平和標志值分布的中心位置或集中趨勢。,返回本章,返回總目錄,1算術平均數,算術平均數是平均指標中最重要的一種,一般不特別說明時,所稱的“平均數”就是指算術平均數,其定義的公式為,算術平均數=總體標志總量/總體單位總量,計算算術平均數時,標志總量和單位總量必須屬于同一總體,分子分母所包含的口徑必須一致。否則,計算出來的平均數指標便失去了科學性。算術平均數,可以分為簡單算術平均數和加權算術平均數兩種。,返回本章,返回總目錄,(1)簡單算術平均數,將總體的各個單位標志值簡單相加,然后除以單位個數,求出的平均標志值,叫做簡單算術平均數。簡單算術平均數的計算公式為,,式中,返回本章,返回總目錄,(2)加權算術平均數,加權算術平均數的計算公式為,,返回本章,返回總目錄,2調和平均數,調和平均數又稱“倒數平均數”,它是根據各標志值的倒數來計算的平均數,即各個標志值倒數的算術平均數的倒數。調和平均數也分簡單調和平均數和加權調和平均數。,簡單調和平均數的計算公式為,,,即,設M為權數,則加權調和平均數的計算公式為,,,則,返回本章,返回總目錄,3幾何平均數,幾何平均數是計算平均比率和平均速度最適用的一種方法。幾何平均數有簡單幾何平均數和加權幾何平均數之分。,其計算公式為,在用幾何平均數法計算平均數時,如果,大于2,,可采用對數法計算。計算公式為,返回本章,返回總目錄,需要指出的是,當把幾何平均數應用于經濟現(xiàn)象時,必須注意經濟現(xiàn)象本身的特點。只有當標志總量表現(xiàn)為各個標志值的連乘積時,才適合采用幾何平均數方法來計算平均標志值。一般來說,計算社會經濟現(xiàn)象在各個時期的平均發(fā)展速度時,要采用幾何平均數。例如,工農業(yè)總產值年平均發(fā)展速度、全國人口年平均發(fā)展速度等。,返回本章,返回總目錄,4中位數,中位數是一種按其在數列中的特殊位置而決定的平均數。把總體各單位標志值按大小順序排列后,處在中點位次的標志值就是中位數,它將全部標志值分成兩個部分,一半標志值比它大,一半標志值比它小,而且比它大的標志值個數和比它小的標志值個數相等。,要求得中位數,首先要確定中位數的位次。,未分組資料時,中位數位次=,,當總體位數為奇數時,中位數就是中位數位次上的那個數據;當為偶數時,中位數是中位數位次上2項數據的算術平均數。,返回本章,返回總目錄,分組資料時,中位數位次,可以利用中位數所在組的下限來測算中位數,即中位數的下限公式為,,式中,返回本章,返回總目錄,也可以利用中位數所在組的上限來測算中位數,即中位數的上限公式為,,式中,中位數所在組的上限,大于中位數組的各組次數之和,中位數最大的特點是它是序列中間1項或2項的平均數,不受極端值的影響,所以在當一個變量數列中含有特大值與特小值的情況下,采用中位數較為適宜。正式由于中位數的這一特點,在統(tǒng)計研究中,當遇到掌握統(tǒng)計資料不多而且各標志值之間差異程度較大或頻數分布有偏態(tài)時,為避免計算標志值所得的算術平均數偏大或偏小,就可利用中位數來表示現(xiàn)象的一般水平。,返回本章,返回總目錄,5眾數,眾數是一種位置平均數。眾數是總體單位中,標志值出現(xiàn)次數最多的那個數值。為了確定眾數的具體數值,可以利用下限公式或上限公式加以計算。,,計算眾數的下限公式為,式中,眾數,眾數組的下限,眾數組次數與上一組次數之差,眾數組次數與下一組次數之差,眾數組的組距,返回本章,返回總目錄,計算眾數的上限公式為,式中,眾數組的上限,眾數的計算只適用于單位數較多,且存在明顯的集中趨勢的情況,否則,計算眾數時沒有意義的。,返回本章,返回總目錄,離散趨勢的測度,離散趨勢的測度,在統(tǒng)計學中也稱為指標變異指標,是用來描述數列中指標值的離散趨勢與離散程度的。常用的標志變異指標有極差、平均差和標準差等。,1極差,極差是指一個數列中兩個極端值即最大值與最小值之間的差異。根據極差的大小能說明標志值變動范圍的大小。其計算公式為,極差=最大標志值-最小標志值,根據組距數列求極差的計算公式為,極差=最高組上限-最低組下限,在實際工作中,極差可以用于檢查產品質量的穩(wěn)定性和進行質量控制。在正常生產的條件下,產品質量穩(wěn)定,極差在一定范圍內波動,若極差超過給定的范圍,就說明有不正常情況產傷。但極差受到極端是的影響,測定結果往往不能反映數據的實際離散程度。,返回本章,返回總目錄,2四分位差,四分位差是根據四分位數計算的。首先把變量各單位標志值從小到大排序,再將數列四等分,處于四分位點位次的標志值就是四分位數,記作,為第一四分位數(也稱為下四分位數),為第二四分位數,就是中位數,為第三四分位數。,,四分位差的計算公式為,,,四分位差的計算步驟為,先尋找四分位數,然后根據四分位差的計算公式計算。,返回本章,返回總目錄,四分位數的計算,(1)由未分組資料計算四分位數。,,,是整數,則位次對應的標志值即為相應的四分位數。,首先確定四分位數的位次,再找出對應位次的標志值即為四分位數。,設樣本容量為N,,不是整數,則用,相鄰位次上的標志值的加權算術平均數,插值法,計算四分位數。,返回本章,返回總目錄,(2)由分組資料計算四分位數。,,第四分位數所在組的下限;,第四分位數所在組的次數;,總次數,即各組次數總和;,小于第四分位數所在組的各組次數之和;,第四分位數所在組的組距。,式中,第四分位數的計算公式為,返回本章,返回總目錄,四分位差是對極差的一種改進。與極差相比,四分位差因不受極值的影響,在反映數據的離散程度方面比極差準確,具有較高的穩(wěn)定性;同時,對于存在開口的組距數列,不能計算極差,但可以計算四分位差。,,,,四分位差與極差相比較,四分位差和極差一樣,不能充分利用數據的全部信息,也無法反映標志值的一般變動。,返回本章,返回總目錄,3平均差,平均差是各單位標志值對平均數的離差絕對值的平均數。平均差僅反映總體各單位標志值對其平均數的平均離差量。平均差越大,表明標志變異程度越大;反之,則表明標志變異程度越小。平均差通常用字母表示。,,未分組資料時,其計算公式為,,分組資料時,其計算公式為,,返回本章,返回總目錄,4方差和標準差,未分組資料時,方差的公式為,,標準差的公式為,,分組資料時,方差的公式為,標準差的公式為,,,式中,算術平均數,總體單位數,返回本章,返回總目錄,各組次數,方差,標準差,變量值,需要指出的是,是總體標準差,而樣本標準差為。,當樣本較大時,由于幾乎等于,因此常用公式代替公式來計算樣本標準差S,并用于估計總體標準差。,在小樣本的情況下,較為總體標準差的更優(yōu)良的估計量。,返回本章,返回總目錄,5離散系數,上述的各種標志變異度指標,都是對總體中各單位指標值變異測定的絕對量指標。而離散系數是測定總體中各單位標志值變異的相對量指標,以消除不同總體之間在計量單位、平均水平方面的不可比因素。常用的離散系數主要有平均差離散系數和標準差離散系數,其公式分別為,,,返回本章,返回總目錄,6偏度和峰度,(1)偏度,偏度是用來反映變量數列分布偏斜程度的指標。,變量數列的單峰鐘形分布,,對稱分布,非對稱分布(或稱偏態(tài)分布),右偏分布(或稱正偏分布),左偏分布(或稱負偏分布),,返回本章,返回總目錄,,,偏態(tài)分布情況下平均數、中位數、眾數有近似的關系,X,,,,F,,,,,,,X,F,,,,X,,F,,,,,對稱分布,右偏分布,左偏分布,利用平均數、中位數、眾數的位置關系大致判斷分布是否對稱,返回本章,返回總目錄,,,用偏度系數準確地測定分布的偏
下載積分: 4 賞幣
上傳時間:2024-01-06
頁數: 356
大?。?9.96(MB)
子文件數: