簡介:第4章數(shù)據(jù)的概括性度量,41集中趨勢的度量42離散程度的度量43偏態(tài)與峰態(tài)的度量,數(shù)據(jù)的概括性度量,41集中趨勢的度量,集中趨勢CENTRALTENDENCY是指一組數(shù)據(jù)向某一中心值靠攏的傾向和程度,集中趨勢可以反映一組數(shù)據(jù)的中心值或代表值,不同數(shù)據(jù)類型可選用不同的集中趨勢測度值低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù),411分類數(shù)據(jù)眾數(shù),一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值稱為眾數(shù)MODE,用M0表示不受極端值的影響眾數(shù)主要用于測度分類數(shù)據(jù)的集中趨勢也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)一組數(shù)據(jù)可以沒有眾數(shù),也可以有幾個(gè)眾數(shù),眾數(shù)的特性,1一組數(shù)據(jù)可以沒有眾數(shù)假定一組數(shù)據(jù)如下12345則這組數(shù)據(jù)沒有眾數(shù),,,,,,,,,1,1,2,3,4,5,2一組數(shù)據(jù)可以有多個(gè)眾數(shù)假定一組數(shù)據(jù)如下1223445那么這組數(shù)據(jù)有兩個(gè)眾數(shù),,,,,,,,1,1,2,3,4,5,,,2,圖41眾數(shù)示意圖,,,,無眾數(shù)一個(gè)眾數(shù)多于一個(gè)眾數(shù),例41,根據(jù)第3章表34的數(shù)據(jù),計(jì)算“飲料品牌”的眾數(shù),表34不同品牌飲料的頻數(shù)分布,解這里的變量為“飲料品牌”,是分類變量,不同類型的飲料就是變量值在所調(diào)查的50人中,購買可口可樂的人數(shù)最多,為15人,占總被調(diào)查人數(shù)的30,因此眾數(shù)為“可口可樂”這一品牌即可口可樂,例42,表36甲城市家庭對(duì)住房狀況的評(píng)價(jià),根據(jù)第3章表36的數(shù)據(jù),計(jì)算甲城市對(duì)住房狀況滿意度評(píng)價(jià)的眾數(shù),解這里的變量是回答類別,是順序變量甲城市所調(diào)查的300戶家庭中,對(duì)目前住房不滿意的戶數(shù)最多,有108戶所以這組數(shù)據(jù)的眾數(shù)為“不滿意”這一類別即不滿意,例43,在某城市中隨機(jī)抽取9戶家庭,調(diào)查得每戶家庭的人均月收入數(shù)據(jù)如下單位元要求計(jì)算人均月收入的眾數(shù)108075010801080850960200012501630解人均月收入1080的家庭最多,即元,一個(gè)由CLAREMONT學(xué)院本科學(xué)生組成的“莎士比亞診所”,用統(tǒng)計(jì)分析對(duì)58個(gè)與莎士比亞同時(shí)代的作家進(jìn)行分析,以確定誰的寫作風(fēng)格與莎士比亞的作品風(fēng)格最相近。他們從58個(gè)作家的作品中選取片段,并將其分成500字一段的小段,對(duì)區(qū)組中的一些變量進(jìn)行計(jì)數(shù)統(tǒng)計(jì),例如,考察52個(gè)關(guān)鍵字的出現(xiàn)情況,并找出其眾數(shù),由此得出各個(gè)作家的主要特征。結(jié)果,58個(gè)備選者中沒有一個(gè)能通過眾數(shù)檢驗(yàn)。因此證明,是莎士比亞寫下了他本人的詩篇。,莎士比亞著作中的眾數(shù),412順序數(shù)據(jù)中位數(shù)和分位數(shù),1中位數(shù)MEDIAN,一組數(shù)據(jù)按從小到大排列時(shí),處于中間位置上的變量值稱為中位數(shù),用ME表示中位數(shù)主要用于測度順序數(shù)據(jù)的集中趨勢中位數(shù)當(dāng)然也適用于數(shù)值型數(shù)據(jù),但不適用于分類數(shù)據(jù)顯然,中位數(shù)作為位置代表值,其數(shù)值不受極大值和極小值的影響,中位數(shù)的位置,對(duì)未分組數(shù)據(jù)中位數(shù)的位置=即未分組數(shù)據(jù)的中位數(shù)是1,2,,N這N個(gè)位置的平均而對(duì)于分組數(shù)據(jù),則中位數(shù)的位置=,41,中位數(shù)的計(jì)算,例44,根據(jù)第3章表36的數(shù)據(jù),計(jì)算甲城市家庭對(duì)住房狀況滿意程度評(píng)價(jià)的中位數(shù),表36甲城市家庭對(duì)住房狀況的評(píng)價(jià),解已知N300,從而中位數(shù)的位置為,從累積頻數(shù)可知,中位數(shù)在“一般”這一類中,因此,一般,例45,在某城市中隨機(jī)抽取9個(gè)家庭,調(diào)查得各個(gè)家庭的人均月收入數(shù)據(jù)如下單位元,試計(jì)算人均月收入的中位數(shù)15007507801080850960200012501630解把數(shù)據(jù)排序得75078085096010801250150016302000而中位數(shù)的位置91/25,于是,例45續(xù),假定例45中隨機(jī)抽取10個(gè)家庭,各個(gè)家庭的人均月收入數(shù)據(jù)如下66075078085096010801250150016302000從而中位數(shù)的位置101/255,于是,例,根據(jù)第3章表312的數(shù)據(jù),計(jì)算電腦銷售量的中位數(shù)解由于N120,則中位數(shù)的位置為,中位數(shù)為,2四分位數(shù)(QUARTILE),與中位數(shù)類似的還有四分位數(shù)。一組數(shù)據(jù)按從小到大排列時(shí),處于位置上的變量值稱為第一個(gè)四分位數(shù)(下四分位數(shù)),處于位置上的變量值稱為第三個(gè)四分位數(shù)(上四分位數(shù)),而中位數(shù)就是第二個(gè)四分位數(shù)。,四分位數(shù)的位置,對(duì)未分組時(shí)下四分位數(shù)的位置=上四分位數(shù)的位置=而對(duì)于分組數(shù)據(jù),則下四分位數(shù)的位置=上四分位數(shù)的位置=,43,例,例46,對(duì)例45的數(shù)據(jù),計(jì)算人均月收入的下四分位數(shù)和上四分位數(shù)解已知N9,得下四分位數(shù)和上四分位數(shù)的位置,于是,例,解QL位置300/475QU位置3300/4225從累計(jì)頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此QL不滿意QU一般,413數(shù)值型數(shù)據(jù)平均數(shù),平均數(shù)也稱均值MEAN,是最常用的集中趨勢測度值,易受極端值的影響主要適用于數(shù)值型數(shù)據(jù),但不適用于分類數(shù)據(jù)和順序數(shù)據(jù),1簡單平均數(shù)與加權(quán)平均數(shù),1根據(jù)未分組的數(shù)據(jù)計(jì)算簡單平均數(shù),設(shè)一組數(shù)據(jù)為則平均數(shù)的計(jì)算公式為,例如,根據(jù)例45的數(shù)據(jù),計(jì)算9個(gè)家庭人均月收入的平均數(shù)為,元,44,2根據(jù)分組的數(shù)據(jù)計(jì)算加權(quán)平均數(shù),設(shè)一組數(shù)據(jù)分為K組,各組的組中值和組頻數(shù)分別為則平均數(shù)的計(jì)算公式為,45,例47,根據(jù)第3章表313中的數(shù)據(jù),計(jì)算電腦銷售量的平均數(shù),表41某電腦公司銷售量數(shù)據(jù)平均數(shù)計(jì)算表,解根據(jù)45式,得,臺(tái),加權(quán)平均數(shù)權(quán)數(shù)對(duì)平均數(shù)的影響,甲乙兩組各有10名學(xué)生,他們的考試成績及其分布數(shù)據(jù)如下甲組考試成績(X)020100人數(shù)分布(F)118乙組考試成績(X)020100人數(shù)分布(F)811,,,2調(diào)和平均數(shù)(HARMONICMEAN),均值的另一種表現(xiàn)形式,易受極端值的影響計(jì)算公式為,原來只是計(jì)算時(shí)使用了不同的數(shù)據(jù),調(diào)和平均數(shù)例題分析,【例】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表,計(jì)算三種蔬菜該日的平均批發(fā)價(jià)格。,,3一種特殊的平均數(shù)幾何平均數(shù),幾何平均數(shù)GEOMETRICMEAN是平均數(shù)的另一種類型,主要用于比率或速度的平均1根據(jù)未分組的數(shù)據(jù)計(jì)算幾何平均數(shù)設(shè)一組數(shù)據(jù)為則幾何平均數(shù)為,46,2根據(jù)分組的數(shù)據(jù)計(jì)算幾何平均數(shù)設(shè)一組數(shù)據(jù)分為K組,各組的組中值和組頻數(shù)分別為,則幾何平均數(shù)的計(jì)算公式為,平均增長率,對(duì)逐年增長率平均增長率應(yīng)滿足,48,即,或,49,幾何平均數(shù)例題分析,【例】某水泥生產(chǎn)企業(yè)1999年的水泥產(chǎn)量為100萬噸,2000年與1999年相比增長率為9,2001年與2000年相比增長率為16,2002年與2001年相比增長率為20。求各年的年平均增長率。,年平均增長率=1149111491,幾何平均數(shù)例題分析,【例】某企業(yè)生產(chǎn)某種產(chǎn)品要經(jīng)過三個(gè)連續(xù)作業(yè)車間才能完成。若某月份第一車間粗加工產(chǎn)品的合格率為95,第二車間精加工產(chǎn)品的合格率為93,第三車間最后裝配的合格率為90,則該產(chǎn)品的車間平均合格率為多少,即該產(chǎn)品的車間平均合格率為9264。,例48,一位投資者持有一種股票,20012004年的收益率分別為45,21,255和19計(jì)算該投資者在這四年內(nèi)的平均收益率解根據(jù)46,得,即該投資者的投資平均收益率為108078710080787,414眾數(shù)、中位數(shù)和平均數(shù)的比較,1眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系,圖42不同分布的眾數(shù)、中位數(shù)和平均數(shù),A對(duì)稱分布,B左偏分布,C右偏分布,,2眾數(shù)、中位數(shù)和平均數(shù)的特點(diǎn),1眾數(shù)是一組數(shù)據(jù)出現(xiàn)次數(shù)最多的數(shù)值,不受極端值的影響,但可能沒有眾數(shù),也可能有兩個(gè)或兩個(gè)以上眾數(shù)。眾數(shù)主要適用于分類數(shù)據(jù)的集中趨勢測度2中位數(shù)是一組數(shù)據(jù)處于中間位置上的數(shù)值,不受極端值的影響,主要適用于順序數(shù)據(jù)的集中趨勢測度3平均數(shù)具有優(yōu)良的統(tǒng)計(jì)性質(zhì),是實(shí)際應(yīng)用最廣泛的集中趨勢測度值主要適用于數(shù)值型數(shù)據(jù)的集中趨勢測度.,3眾數(shù)、中位數(shù)和平均數(shù)的應(yīng)用場合,例從一家公司中選取一個(gè)20名工人的樣本,將他們每周除去所有費(fèi)用后的凈收入近似為整數(shù)并按升序排列如下(元)240,240,240,240,240,240,240,240,255,255,265,265,280,280,290,300,305,325,330,340。計(jì)算(1)、平均數(shù),中位數(shù),眾數(shù);,中位數(shù)260元,眾數(shù)240元(2)、從偏斜度的角度描述這組工資數(shù)據(jù);由于平均數(shù)大于中位數(shù),所以這個(gè)分布是右偏分布。,3眾數(shù)、中位數(shù)和平均數(shù)的應(yīng)用場合,(3)、假如你是這家公司負(fù)責(zé)勞資問題的副總經(jīng)理,你會(huì)采用哪個(gè)測度值代表公司中所有員工的收入水平因?yàn)闃颖酒骄鶖?shù)是這三個(gè)平均數(shù)測度值中的最大值,所以你可能傾向于采用它作為平均數(shù)。事實(shí)上,使用它非常合適,因?yàn)檫@里牽涉到統(tǒng)計(jì)推斷,而樣本平均數(shù)是可用的最穩(wěn)定的統(tǒng)計(jì)量。(4)、假設(shè)你是推選出的工會(huì)主席,你會(huì)采用哪個(gè)測度值代表公司中所有員工的收入水平從你在工資問題談判中所處的位置出發(fā),你可能傾向于選擇眾數(shù),或者至少是中位數(shù),而決不會(huì)選用平均數(shù)。為了說明你選擇的測度值是合理的,你應(yīng)該指出眾數(shù)代表了樣本中大部分人的凈收入,或者可以指出從樣本中可以看出樣本平均數(shù)受到極少數(shù)高工資的影響。然而,無論是眾數(shù)還是中位數(shù)都會(huì)隨樣本不同而產(chǎn)生很大變化,所以比起平均數(shù)都是不穩(wěn)定的總體估計(jì)值。,數(shù)據(jù)類型與集中趨勢測度值,42離散程度的度量,離散程度或分散程度是數(shù)據(jù)分布的另一個(gè)重要特征,離散程度的測度值反映數(shù)據(jù)的分散程度數(shù)據(jù)的分散程度越大,則集中趨勢測度值的代表性就越差;分散程度越小,則集中趨勢測度值的代表性就越好不同數(shù)據(jù)類型有不同的離散程度測度值,421分類數(shù)據(jù)異眾比率,異眾比率VARIATIONRATIO是非眾數(shù)組的頻數(shù)所占的比例,即,異眾比率用于衡量眾數(shù)的代表程度1異眾比率大,說明眾數(shù)的代表性差2異眾比率小,說明眾數(shù)的代表性好,410,例49,根據(jù)第3章表3–4的數(shù)據(jù),計(jì)算異眾比率,表34不同品牌飲料的頻數(shù)分布,解根據(jù)410式,得異眾比率,在所調(diào)查的50人當(dāng)中,購買其他品牌飲料的人數(shù)占70由于異眾比率比較大,因此用“可口可樂”代表消費(fèi)者購買飲料品牌的狀況,其代表性不是很好,422順序數(shù)據(jù)四分位差,四分位差QUARTILEDEVIATION是上四分位數(shù)與下四分位數(shù)之差,即,411,四分位差反映了下四分位數(shù)至上四分位數(shù)之間即中間的50數(shù)據(jù)的離散程度或變動(dòng)范圍.四分位差越大,說明中間這部分?jǐn)?shù)據(jù)越分散,而四分位差越小,則說明中間這部分?jǐn)?shù)據(jù)越集中四分位差在一定程度上可用于衡量中位數(shù)的代表程度,四分位差例題分析,解為了計(jì)算順序數(shù)據(jù)的四分位差,需要把各類別數(shù)量化。設(shè)非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5,已知QL不滿意2QU一般3四分位差QDQUQL3–21,例410,根據(jù)例46的數(shù)據(jù),已求得,從而四分位差為,臺(tái),423數(shù)值型數(shù)據(jù)方差和標(biāo)準(zhǔn)差,測度數(shù)值型數(shù)據(jù)離散程度的主要方法有極差、平均差、方差和標(biāo)準(zhǔn)差,但最常用的是方差和標(biāo)準(zhǔn)差,1極差,極差RANGE是一組數(shù)據(jù)的最大值與最小值之差,即未分組數(shù)據(jù)R=最大值-最小值分組數(shù)據(jù)R≈最后一組的上限-第一組的下限412極差計(jì)算簡單,是描述數(shù)據(jù)離散程度的最簡單的測值.但極差易受極端值的影響,并且不能反映中間數(shù)據(jù)的分散程度。例如,根據(jù)例45的數(shù)據(jù),得9個(gè)家庭人均月收入的極差為R=2000-750=1250元,2平均差,平均差MEANDEVIATION是各變量值與均值離差絕對(duì)值的平均平均差雖然能全面反映一組數(shù)據(jù)的分散程度,但由于離差取了絕對(duì)值,這給計(jì)算和統(tǒng)計(jì)性質(zhì)的討論帶來不便,因而實(shí)際工作中應(yīng)用較少計(jì)算公式為,未分組數(shù)據(jù),組距分組數(shù)據(jù),413,414,例411,含義每一天的銷售量與平均數(shù)相比,平均相差17臺(tái),3方差和標(biāo)準(zhǔn)差,方差和標(biāo)準(zhǔn)差VARIANCEANDSTANDARDDEVIATION是最常用的離散程度測度值根據(jù)總體數(shù)據(jù)計(jì)算的稱為總體方差或總體標(biāo)準(zhǔn)差,而根據(jù)樣本數(shù)據(jù)計(jì)算的則稱為樣本方差或樣本標(biāo)準(zhǔn)差,(1)總體方差和標(biāo)準(zhǔn)差,方差的計(jì)算公式未分組數(shù)據(jù)組距分組數(shù)據(jù),標(biāo)準(zhǔn)差的計(jì)算公式未分組數(shù)據(jù)組距分組數(shù)據(jù),,總體標(biāo)準(zhǔn)差(例題分析),某車間50名工人日加工零件的標(biāo)準(zhǔn)差計(jì)算表,解計(jì)算過程列于表,根據(jù)計(jì)算公式得,(個(gè)),(2)樣本方差和標(biāo)準(zhǔn)差,未分組數(shù)據(jù),組距分組數(shù)據(jù),未分組數(shù)據(jù),組距分組數(shù)據(jù),方差的計(jì)算公式,標(biāo)準(zhǔn)差的計(jì)算公式,,(415),(417),(418),自由度的說明,1、一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)2、當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為N時(shí),若樣本均值?X確定后,只有N1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)不能自由取值3、例如,樣本有3個(gè)數(shù)值,即X12,X24,X39,則?X5。當(dāng)?X5確定后,X1,X2和X3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如X16,X27,那么X3則必然取2,而不能取其他值4、樣本方差用自由度去除,其原因可從多方面來解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差Σ2時(shí),它是Σ2的無偏估計(jì)量,例412樣本標(biāo)準(zhǔn)差的計(jì)算,含義每一天的銷售量與平均數(shù)相比,平均相差2158臺(tái),方差的展開公式,在實(shí)際計(jì)算時(shí),也可按展開公式計(jì)算方差,,1.,2.,3.,4.,4相對(duì)位置的測量,1標(biāo)準(zhǔn)分?jǐn)?shù),標(biāo)準(zhǔn)分?jǐn)?shù)性質(zhì),標(biāo)準(zhǔn)分?jǐn)?shù)性質(zhì),標(biāo)準(zhǔn)分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒有改變?cè)摻M數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。,例413,根據(jù)例45的數(shù)據(jù),計(jì)算每個(gè)家庭的人均月收入的標(biāo)準(zhǔn)分?jǐn)?shù)解根據(jù)例45的數(shù)據(jù)求可得,由419式得每個(gè)家庭的人均月收入的標(biāo)準(zhǔn)分?jǐn)?shù)如下表44表449個(gè)家庭人均月收入標(biāo)準(zhǔn)分?jǐn)?shù)計(jì)算表,可以看出,收入最低的家庭其人均收入與平均數(shù)相比低1042個(gè)標(biāo)準(zhǔn)差;而收入最高的家庭人均收入比平均數(shù)高1853個(gè)標(biāo)準(zhǔn)差。,標(biāo)準(zhǔn)分?jǐn)?shù)例題分析,前NBA巨星MICHAELJORDAN身高78英寸,而WNBA運(yùn)動(dòng)員RLOBO身高76英寸,很明顯JORDAN高出2英寸,但誰相對(duì)來說高一些呢(男性平均身高69英寸,標(biāo)準(zhǔn)差為28英寸;女性平均身高636英寸,標(biāo)準(zhǔn)差為25英寸),JORDAN的身高高于平均數(shù)321個(gè)標(biāo)準(zhǔn)差,而LOBO的身高高于平均數(shù)496個(gè)標(biāo)準(zhǔn)差。,2經(jīng)驗(yàn)法則,經(jīng)驗(yàn)法則表明當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí)▽約有68的數(shù)據(jù)在均值加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)▽約有95的數(shù)據(jù)在均值加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)▽約有99的數(shù)據(jù)在均值加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),(415),3切比雪夫不等式CHEBYSHEVINEQUALITY,對(duì)于K2,3,4,該不等式的含義是▽至少有75的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)▽至少有89的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)▽至少有94的數(shù)據(jù)在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),1)如果一組數(shù)據(jù)不是對(duì)稱分布,經(jīng)驗(yàn)法則就不再使用,這時(shí)可使用切比雪夫不等式,它對(duì)任何分布形狀的數(shù)據(jù)都適用2)切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”3)對(duì)于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有11/的數(shù)據(jù)落在K個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中K是大于1的任意值,但不一定是整數(shù),424相對(duì)離散程度離散系數(shù),方差或標(biāo)準(zhǔn)差都反映了數(shù)據(jù)分散程度的絕對(duì)值,而影響方差或標(biāo)準(zhǔn)差數(shù)值大小有2個(gè)方面的原因1與這組數(shù)據(jù)的平均數(shù)大小有關(guān)2與這組數(shù)據(jù)的計(jì)量單位有關(guān)例設(shè)一組數(shù)據(jù)為1,2,3N3,則而另一組數(shù)據(jù)為100,200,300N3,則從而對(duì)于不同平均水平或不同計(jì)量單位的兩組數(shù)據(jù),不能通過直接比較方差或標(biāo)準(zhǔn)差來表明數(shù)據(jù)離散程度的大小為消除平均水平與計(jì)量單位的影響,需要計(jì)算離散系數(shù),420,例414,表45某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù),某管理局抽查了8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)見表45試比較產(chǎn)品銷售額與銷售利潤的離散程度,,,例414的解,解由于銷售額與利潤額的平均數(shù)大小不同,不能直接按標(biāo)準(zhǔn)差進(jìn)行比較,需計(jì)算離散系數(shù)根據(jù)表45數(shù)據(jù),得,由于,說明銷售額的離散程度小于銷售利潤的離散程度,數(shù)據(jù)類型與離散程度測度值,43偏態(tài)與峰態(tài)的測度,偏態(tài)與峰度是對(duì)數(shù)據(jù)分布形狀的測度,431偏態(tài)及其測度,1未分組樣本數(shù)據(jù)的偏態(tài)系數(shù),2分組樣本數(shù)據(jù)的偏態(tài)系數(shù),設(shè)一組數(shù)據(jù)分為K組,各組的組中值和組頻數(shù)分別為則偏態(tài)系數(shù)的計(jì)算公式為,422,1,為對(duì)稱分布,2,為右偏分布,3,為左偏分布,4越大,則偏斜程度就越大,例415,根據(jù)表39的數(shù)據(jù),計(jì)算電腦銷售量的偏態(tài)系數(shù),表46某電腦公司銷售量偏態(tài)與峰度系數(shù)計(jì)算表,例415的解,已知,根據(jù)422式,得,偏態(tài)系數(shù)為正值,且數(shù)值較小,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù),432峰態(tài)及其測度,1未分組樣本數(shù)據(jù)的峰態(tài)系數(shù),峰態(tài)KURTOSIS是對(duì)分布尖峭或平緩程度的測度設(shè)一組數(shù)據(jù),則峰態(tài)系數(shù)KURTOSISCOEFFICIENT的計(jì)算公式為,423,2分組樣本數(shù)據(jù)的峰態(tài)系數(shù),峰態(tài)是與正態(tài)分布相比較而言的,由于正態(tài)分布的峰度系數(shù)等于0,所以Ⅰ,峰態(tài)適中Ⅱ,比正態(tài)分布更尖峭,為尖峰分布Ⅲ,比正態(tài)分布更平緩,為平峰分布,設(shè)一組數(shù)據(jù)分為K組,各組的組中值和組頻數(shù)分別為則峰態(tài)系數(shù)的計(jì)算公式為,424,例416,根據(jù)表46的數(shù)據(jù),計(jì)算電腦銷售量的峰態(tài)系數(shù)解根據(jù)424式,得,由于,說明電腦銷售量的分布為平峰分布,偏態(tài)與峰態(tài)從直方圖上觀察,按銷售量分組臺(tái),結(jié)論1為右偏分布2峰態(tài)適中,某電腦公司銷售量分布的直方圖,用EXCEL計(jì)算描述統(tǒng)計(jì)量,把第3章表39電腦公司的銷售量的數(shù)據(jù)輸入到EXCEL工作表中,然后按下列步驟操作1選擇【工具】下拉菜單,并選擇【數(shù)據(jù)分析】命令2在【數(shù)據(jù)分析】對(duì)話框中,選擇【描述統(tǒng)計(jì)】,并單擊【確定】3當(dāng)對(duì)話框出現(xiàn)時(shí)1在【輸入?yún)^(qū)域】方框內(nèi)鍵入數(shù)據(jù)區(qū)域2在【輸出選項(xiàng)】中選擇輸出區(qū)域3選擇【匯總統(tǒng)計(jì)】4選擇【確定】計(jì)算結(jié)果列于表47,表4–7EXCEL輸出的描述統(tǒng)計(jì)量,
下載積分: 4 賞幣
上傳時(shí)間:2024-01-06
頁數(shù): 78
大?。?0.73(MB)
子文件數(shù):