醫(yī)學統(tǒng)計學定量資料的統(tǒng)計描述_第1頁
已閱讀1頁,還剩69頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、定量資料的統(tǒng)計描述,賈 睿:成都中醫(yī)藥大學公共衛(wèi)生學院,學習要求,掌握內(nèi)容,頻數(shù)分布表的編制和應(yīng)用描述數(shù)據(jù)分布平均水平的指標掌握算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)的意義、用途及計算方法。描述數(shù)據(jù)分布變異程度的指標掌握極差、四分位數(shù)間距、方差、標準差、變異系數(shù)的意義、用途及計算方法。,熟悉內(nèi)容,描述數(shù)據(jù)分布平均水平的指標熟悉百分位數(shù)、眾數(shù)、調(diào)和均數(shù)的意義、用途及計算方法。了解內(nèi)容描述分布形態(tài)的指標偏度系數(shù)峰度系數(shù),2,3,

2、1.頻數(shù)表的繪制,4,從上表可以看出:“某市某年8歲男孩”—— 同質(zhì)觀察對象這些男孩的身高并不完全相等 —— 同質(zhì)的基礎(chǔ)上存在變異“120名”—— 樣本,5,頻數(shù)(frequency)觀察數(shù)據(jù)的個數(shù)頻數(shù)分布(frequency distribution) 觀察數(shù)據(jù)在其取值范圍內(nèi)的分布情況定量資料的頻數(shù)分布情況可以用頻數(shù)表(frequency distribution table)或直方圖表示。,6,步驟:計算極差134

3、.5-112.3=22.2cm確定組數(shù)、組距和組段通常8~15組組距:極差/組數(shù)(可調(diào)整)組段的起點叫“下限”,終點叫“上限”。首尾組段分別包含最小值和最大值列表劃記計算頻數(shù)、頻率、累計頻數(shù)和累計頻率,7,同一組資料,不同的人編制的頻數(shù)表,結(jié)果不盡相同,允許幾個合理的結(jié)果并存。,2.頻數(shù)表的應(yīng)用,描述分布類型描述分布特征發(fā)現(xiàn)離群值簡化計算陳述資料,9,10,2.1描述分布類型,對稱分布——強調(diào):近似正態(tài)分布(中間高

4、、兩邊低,左右對稱,近似鐘型) 本例為近似正態(tài)分布,11,12,不對稱分布——強調(diào):偏態(tài)分布正偏態(tài)分布:頻數(shù)集中在數(shù)據(jù)小側(cè)負偏態(tài)分布:數(shù)據(jù)集中在數(shù)據(jù)大側(cè)本例為正偏態(tài)分布醫(yī)學資料常見偏態(tài)分布。,13,2.2描述分布特征,平均水平(集中趨勢):描述頻數(shù)分布集中的位置,本例數(shù)據(jù)集中在122~124cm之間變異程度(離散程度):描述數(shù)據(jù)分散狀況,本例數(shù)據(jù)分布在112~136cm之間,18,19,2.3發(fā)現(xiàn)離群值,離群值為資料的特

5、大值或特小值。,20,3.描述平均水平,定量資料的平均水平指資料的集中位置,其大小用平均數(shù)表示。平均數(shù)(average)是一個指標體系,包括:算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、第x百分位數(shù)、眾數(shù)、調(diào)和均數(shù)等。平均數(shù)的計算必須以同質(zhì)為基礎(chǔ)。,21,3.1算術(shù)均數(shù)(簡稱均數(shù)mean),22,總體均數(shù) ;樣本均數(shù) 代表每組觀察值的平衡點,也就是重心。適用于單峰對稱分布資料,直接法:適用于樣本含量較小的未分組資料說明

6、:x表示變量值,∑表示求和,n表示樣本含量,23,加權(quán)法:適用于樣本含量較大的頻數(shù)表資料 說明:此處x表示組中值,f表示頻數(shù),∑表示求和例:120名8歲男孩的身高資料,24,3.2中位數(shù)(median,M),例:4 4 5 5 6 6 4 4 5 5 6 6 70 x1 x2 x3 x4 x5 x6

7、 x7定義: 將一組觀察值按從小到大的順序進行排列,位置居中的數(shù)就是中位數(shù)。,25,直接法:樣本含量較小的未分組資料。n為奇數(shù)時:n為偶數(shù)時:4 4 5 5 6 6 1704 4 5 5 6 6 ?,26,加權(quán)法:適用于樣本含量較大的頻數(shù)表資料公式:說明:L表示M所在組段的下限;i表示該組段的組距;f表示該組段的頻數(shù);n表示樣本含量;∑fL表

8、示小于該組段的累計頻數(shù)。例:M=12+12/56(150/2-23) =23.14(小時),27,適用情況:任何分布類型,尤其適用于下列情況偏態(tài)分布開口資料分布不清,28,3.3百分位數(shù)(percentile,PX),定義公式例:P50 =12+12/56(150×50%-23) =23.14(小時)P25 =12+12/56(150×25%-23)

9、 =15.11(小時)P75=24+12/38(150×75%-79) =34.58(小時),29,3.4幾何均數(shù)(geometric mean,G),資料A: 2 4 6 8 10資料B: 2 4 8 16 32適用情況:標準情況:等比級數(shù)資料擴展情況:正偏態(tài)分布,變量值跨越多個數(shù)量級,30,直接

10、法 加權(quán)法,31,,,,注意事項幾何均數(shù)常用于等比級資料或?qū)?shù)正態(tài)分布資料。觀察值中若有0或負值,則不宜直接使用幾何均數(shù)。觀察值一般同時不能有正值和負值。若全是負值,計算時可先將負號去掉,得出結(jié)果后再加上負號。,32,變量變換2 4 8 16 32lg2 lg4 lg8 lg16 lg320.30 0.60 0.90 1.20 1.51等

11、比級數(shù)資料可以通過對數(shù)變換,轉(zhuǎn)化為正態(tài)分布,33,3.5眾數(shù)(mode),指總體中出現(xiàn)機會最高的數(shù)值,樣本中出現(xiàn)次數(shù)最高的數(shù)字。,34,眾數(shù)、均數(shù)、中位數(shù)之間的關(guān)系,對稱分布三者相等正偏態(tài)分布眾數(shù)<中位數(shù)<均數(shù),35,3.6調(diào)和均數(shù)(harmonica mean,H),先求原始數(shù)據(jù)的倒數(shù)的算術(shù)均數(shù),該算術(shù)均數(shù)的倒數(shù)即稱為原始數(shù)據(jù)的調(diào)和均數(shù)。適用于變異程度較大的資料,36,,你還知道哪些描述平均水平的指標?,37,,4

12、.描述變異程度,例:兩個資料如下:A:1 3 5 7 9 11 13B:6 6 6 7 8 8 8兩資料均為對稱分布,可選用均數(shù)描述平均水平,且均為7,但資料A的數(shù)據(jù)分布較資料B分散,7對資料的代表性相對較差。,38,4.1平均數(shù)與變異度的關(guān)系,平均數(shù)表示的集中性與變異度表示的離散性,是從兩個不同的角度闡明計量資料的特征 變異度越小,平均數(shù)對各變量值的代表性越好 變異度越大,平均數(shù)對各變量值的代表性

13、越差,變異程度是指各觀察值之間參差不齊的程度,反映資料的變異程度。常用指標:極差、四分位間距、離均差平方和、方差、標準差、變異系數(shù)等。反映平均水平和變異程度的指標結(jié)合起來,全面認識事物。,40,4.2極差(range,R,又稱全距),一組觀察值中最大值與最小值之差,單位與觀察值相同。極差越大,變異程度越大。如上例:A:1 3 5 7 9 11 13 R=12B:6 6 6 7 8 8 8

14、 R=2,41,適用情況:描述單峰對稱分布小樣本資料的變異程度;初步了解資料的變異程度。,42,不足之處:只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度;樣本含量越大,抽到較大或較小觀察值的可能性越大,則全距可能越大,因此樣本含量懸殊時不宜用全距比較。如上例資料B改為:B:1 6 6 7 8 8 13 R=12,則無法區(qū)分與資料A的變異程度誰大。,43,4.3方差、標準差,A:1 3 5

15、 7 9 11 13B:1 6 6 7 8 8 13由于極差不能反映每個觀察值對數(shù)據(jù)變異程度的影響,擬改用離均差之和(每個觀察值與均數(shù)的差稱為離均差):由于離均差有正有負,離均差之和肯定為0。,44,改用離均差平方和:A資料:(1-7)2+(3-7)2+……+(13-7)2=112B資料:(1-7)2+(6-7)2+……+(13-7)2=72,45,離均差平方和的優(yōu)點:能反映每一個觀察值對變異程度的影響。

16、把資料B作如下修改:B:1 6…6 7 8…8 13(共40個6和40個8)計算得:(1-7)2+…+(13-7)2=152離均差平方和的缺點:離均差平方和不能消除觀察值個數(shù)對指標的影響。,46,將離均差平方和進一步修改,考慮觀察值個數(shù)對指標的影響,得方差(varianc):總體方差:樣本方差: 資料A:s2=18.66,資料B:s2=1.85,47,方差

17、的優(yōu)點:可以反映每個觀察值對變異程度的影響;考慮了觀察值個數(shù)對指標的影響。方差的不足:單位是原觀察值單位的平方。,48,進一步修改,得標準差(standard deviation):總體標準差:樣本標準差: 資料A:s=4.32,資料B:s=1.36,49,標準差越大,變異程度越大,數(shù)據(jù)越分散。標準差的優(yōu)點:可以反映每個觀察值對變異程度的影響考慮了觀察值

18、個數(shù)對指標的影響單位與觀察值相同標準差適用于對稱分布的資料,通常與均數(shù)結(jié)合使用。,50,4.4四分位數(shù)間距(quartile range,Q),公式 Q=P75-P25 (例:)適用條件:(同中位數(shù)),51,4.5變異系數(shù)(coefficient of variations,CV),公式:應(yīng)用條件:兩組資料單位不同兩組資料均數(shù)差異較大,52,例:觀察某地100名8歲男孩身高 =123.4cm,s=4

19、.79cm;體重 =23.46Kg,s=2.68Kg。試比較兩組資料的變異程度。身高: =3.89%體重: =11.42%體重變異較大。,53,絕對變異受平均水平的影響相對變異排除了平均水平的影響,注意:,55,☆ 重要提示,對稱分布平均水平:均數(shù)變異程度:標準差不對稱分

20、布平均水平:中位數(shù)變異程度:四分位數(shù)間距等比級數(shù)或?qū)?shù)正態(tài)分布的資料: 平均水平:幾何均數(shù) 變異程度:???,56,5.描述分布類型,偏度系數(shù)(coefficient of skewness,SKEW)峰度系數(shù)(coefficient of kurtosis,KURT),57,6. SPSS下進行統(tǒng)計描述,58,6.1 統(tǒng)計描述的模塊,Frequencies過程計算各種常用的描述指標特色是產(chǎn)生頻數(shù)表對分類資料和定量

21、資料都適用Descriptive 過程一般性的統(tǒng)計描述適用于服從正態(tài)分布的定量資料,@文彤老師,59,6.1 統(tǒng)計描述的模塊,Explore 過程用于對數(shù)據(jù)分布狀況不清時的探索性分析功能極為強大Crosstabs過程完成分類資料和等級資料的統(tǒng)計描述完成分類資料各種各樣“常規(guī)”的統(tǒng)計檢驗Ratio過程用于兩個連續(xù)變量計算相對比指標,很少用PP圖和QQ圖,@文彤老師,60,6.2 Frequencies(頻率)過程,計

22、算各種常用的描述指標特色是產(chǎn)生頻數(shù)表對分類資料和定量資料都適用,61,6.2 Frequencies(頻率)過程,Statistics 子對話框,@文彤老師,62,,6.2 Frequencies(頻率)過程,圖表子對話框,2013年8月15日,@文彤老師,63,,6.3 Descriptive(描述) 過程,一般性的統(tǒng)計描述適用于服從正態(tài)分布的定量資料可直接計算標準化Z值,2013年8月15日,@文彤老師,64,6.3 Des

23、criptive(描述) 過程,65,,6.4 Explore (探索)過程,可對變量進行更為深入詳盡的描述性分析主要用于對資料的性質(zhì)、分布特點等完全不清楚時可分組進行描述,2013年8月15日,@文彤老師,66,6.4 Explore (探索)過程,Statistics 子對話框,2013年8月15日,@文彤老師,67,,6.4 Explore (探索)過程,plot子對話框,2013年8月15日,@文彤老師,68,,作業(yè),教材3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論