版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、預(yù) 防 醫(yī) 學(xué),Preventive Medicine,預(yù)防醫(yī)學(xué)教研室,2004.06,第十四章 數(shù)值變量的統(tǒng)計描述蔡泳,頻數(shù)表的編制方法,1.找全距:Range = Max - Min2. 劃分組段(1)確定組數(shù):8—15組,一般取10組(2)確定組距:組距(i)= 全距 / 組段數(shù)(3)確定各組段的上下限:各組的起點為下限, 終點為上限。 要求:(1)第一組含最小值 (2)最后組含
2、最大值3.歸納計數(shù):劃計法4. 計算頻率與累計頻率,集中趨勢,集中趨勢: 表示數(shù)據(jù)的中心位置 。集中趨勢的指標(biāo) : 平均數(shù)是一組統(tǒng)計指標(biāo),常用的有算術(shù)均數(shù)、幾何均數(shù)及中位數(shù)等。,平均數(shù),平均數(shù) 是表示一組同質(zhì)計量資料的集中趨勢或平均水平的統(tǒng)計指標(biāo),是計量資料中非常重要的一個指標(biāo)體系。醫(yī)學(xué)研究中常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)及中位數(shù)三種。這個平均數(shù)是廣義的,而日常人們所說的平均數(shù)是
3、狹義的算術(shù)均數(shù)。,(一)算術(shù)均數(shù) ( mean),算術(shù)均數(shù) 簡稱均數(shù)。用于說明一組觀測值的趨中位置或平均水平。 均數(shù)用于對稱分布、正態(tài)或近似正態(tài)分布的資料。x表示變量X的樣本均數(shù),?(希臘字母)表示總體均數(shù)。 常用的計算方法是直接法和加權(quán)法。,,直接法,當(dāng)樣本含量較小時,可選用此法。有n個觀察值,分別為X1,X2,……Xn,均數(shù)的計算公式為: 式中,Σ是求和的符號
4、 。,例題,例 14-1 10名12歲男孩身高(cm)分別為125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.0,122.5,140.0。求平均數(shù)。,,加權(quán)法,1.列出頻數(shù)表 2.計算組中值 組中值X,計算方法是將本組下限和下組下限相加除以2。3.用加權(quán)法計算均數(shù): 式中f為各組的頻數(shù),x為各組的組中值。,,(二)幾何均數(shù)(geometric mean
5、),幾何均數(shù) 適用于對數(shù)正態(tài)分布的資料,例如抗體的平均滴度和平均效價。幾何均數(shù)用G表示。 例:5人的抗體滴度為:1:10,1:100,1:1000,1:10000,1:100000,直接法,直接法: 樣本含量較小時,選用此法。有n個觀察值X1,X2,…Xn,幾何均數(shù)的計算公式為:一般采用對數(shù)形式計算:式中l(wèi)g為取常用對數(shù)的符號,lg-1為反對數(shù)。,,,例題,6份血清抗體滴度為:1:
6、2,1:4,1:8,1:8,1:16,1:32,求平均數(shù)。 幾何平均滴度為1:8,,加權(quán)法,加權(quán)法: 當(dāng)樣本含量較大時,可將資料整理成頻數(shù)表,用下式計算:,,例題,[例1-4]某地102名健康人的鉤端螺旋體血清抗體滴度如表1-2,計算平均滴度。 102名健康人的鉤端螺旋體血清滴度的幾何平均滴度為1:464,,表14-1 102名健康人的鉤端螺旋體 血清抗體平均滴度的計算,(三)中位數(shù)(m
7、edian),將一組觀察值從小到大按順序排列,位次居中的觀察值就稱中位數(shù)。 中位數(shù)適用于任何一種分布的計量數(shù)據(jù),一般多用于描述偏態(tài)分布或數(shù)據(jù)一端無界資料的集中趨勢。中位數(shù)用M表示。,直接法,樣本含量較小時,可根據(jù)下式計算: n為奇數(shù)時n為偶數(shù)時 上式中n為一組觀察值的總個數(shù), 、 及 均為下標(biāo),表示有序數(shù)列中觀察值的位次。,,,,,,頻數(shù)表法,樣本含量較大時用此法
8、L為本組(中位數(shù)所在組)下限,i為本組組距,f為本組頻數(shù),ΣfL為上一組的累計頻數(shù)。本組位置可根據(jù)累計頻數(shù)的數(shù)值來判斷。當(dāng)某一組的累計頻數(shù)首先超過n/2時或累計頻率首先超過50%時,即定為本組。,,例題,[例1-6]調(diào)查某地107名正常人尿鉛含量(mg/L)結(jié)果列于下表,計算中位數(shù): 本例,第3組的累計頻數(shù)為65,超過n/2=53.5,即第3組為本組。,,(四)百分位數(shù)(percentile),百分位數(shù)是一種位置指標(biāo),用P
9、X表示。 百分位數(shù)是一個有序數(shù)列百等分的分割值。第50百分位數(shù)(P50)也就是中位數(shù),中位數(shù)是一個特定的百分位數(shù)。 計算百分位數(shù)的計算公式為: 計算百分位數(shù)一般需計算累計頻率(%),為各組段累計頻數(shù)除以總例數(shù)n。,,離散趨勢的統(tǒng)計描述,計量數(shù)據(jù)的頻數(shù)分布有兩個重要特征:集中趨勢和離散趨勢。必須指出,要把兩者結(jié)合起來才能全面地反映數(shù)據(jù)頻數(shù)分布的基本特征。 [例1-8]兩組計量數(shù)據(jù)如下,
10、分析其分布特征。 甲組 98,99,100,101,102 乙組 80,90,100,110,120 描述離散趨勢的常用指標(biāo)有全距、四分位間距、方差和標(biāo)準(zhǔn)差等。,,,一、全距(range),亦稱極差,用R表示,是一組觀察值中最大值與最小值之差,反映個體差異的范圍。全距大,說明變異度大;反之,說明變異度小。 如例1-8中甲組全距為4,乙組全距為40,表明乙組變異度大。
11、 但全距易受個別數(shù)據(jù)的影響,穩(wěn)定性較差,抽樣誤差較大,而且還受n大小的影響,一般n越大,全距越大。,二、四分位間距(inter-quartile range),四分位間距是兩個特定的百分位數(shù)之差,即第75百分數(shù)P75(上四分位數(shù)QU)和第25百分位數(shù)P25(下四分位數(shù)QL)之差,用Q表示,適用于任何分布的計量資料,尤其適用于偏態(tài)分布的資料. 四分位間距比全距穩(wěn)定,但仍然未考慮到每個觀察值的變異。
12、,Q=QU-QL,三、平均偏差與離均差平方和,平均偏差(mean difference) :每個觀測值與均數(shù)之差的絕對值相加,然后取平均。離均差平方和:為了避免使用絕對值,采用取平方的方法。 離均差平方和=,,四、方差(variance),為了消除觀察值的總個數(shù)N的影響,將 除以N,這就是總體方差,用σ2表示。 對于樣本資料,在對離均差平方和取平均時分母用n-1代替n。,,,五、
13、標(biāo)準(zhǔn)差(standard deviation),方差的單位是原度量單位(如kg)的平方,把總體方差開平方,這就是總體標(biāo)準(zhǔn)差,度量單位與原始觀察值一致,即 對于樣本資料,樣本標(biāo)準(zhǔn)差的計算公式為: 可改寫為: 上式n-1稱為自由度。,,,,,,例題,[例1-9]對例1-8的數(shù)據(jù)計算標(biāo)準(zhǔn)差 甲組:n=5,ΣX=98+99+10
14、0+101+102=500ΣX2=982+992+1002+1012+1022=50010,,,標(biāo)準(zhǔn)差應(yīng)用,表示觀察值的變異程度 在兩組(或幾組)均數(shù)相近、單位相同的條件下,標(biāo)準(zhǔn)差大,表示變量值的變異度大,均數(shù)的代表性較差;反之,標(biāo)準(zhǔn)差小,表示變量組變異度小,數(shù)據(jù)多集中在均數(shù)周圍,則均數(shù)的代表性較好。計算變異系數(shù) 結(jié)合均數(shù)描述頻數(shù)分布的特征和制定醫(yī)學(xué)參考值范圍。 計算標(biāo)準(zhǔn)誤,六、變異系數(shù)(coefficien
15、t of variation),當(dāng)單位不同時,均數(shù)相差較大時,用標(biāo)準(zhǔn)差就不適宜了,此時用變異系數(shù)更好。 變異系數(shù)是一種相對的離散程度指標(biāo),它無單位,用CV表示,其計算公式為:,,例題,[例1-11 ]某地20歲男子100人,其身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm,其體重均數(shù)為53.72kg,標(biāo)準(zhǔn)差為4.96kg。請比較何者變異度較大。 由于兩者度量單位不同,不能直接比較標(biāo)準(zhǔn)差,而應(yīng)比較變異系數(shù)。
16、 身高 體重 結(jié)果表明該地20歲男子體重的變異大于身高的變異。,,,正態(tài)分布,正態(tài)分布的圖形 圖頻數(shù)分布逐漸接近正態(tài)分布狀態(tài),,正態(tài)分布的特點,正態(tài)分布是一種很重要的連續(xù)型分布。正態(tài)分布以均數(shù)為中心,左右兩側(cè)對稱,靠近均數(shù)兩側(cè)的頻數(shù)較多,而距均數(shù)兩側(cè)較遠處,頻數(shù)逐漸減少,形成鐘形分布。正態(tài)曲線下的面積分布有一定的規(guī)律。,正態(tài)曲線下面積的分布規(guī)律,曲線下橫軸上的總面積為100%或
17、1。 下面是應(yīng)用較多的三個區(qū)間的面積分布規(guī)律。(1)正態(tài)分布區(qū)間(?-?,?+?)下的面積,即???范圍的面積占總面積為68.27%;(2)正態(tài)分布區(qū)間(?-1.96?,?+1.96?),即??1.96?范圍的面積占總面積為95.00%;(3)正態(tài)分布區(qū)間(?-2.58?,?+2.58?),即??2.58?范圍的面積為99.00%。(如圖1-2),正態(tài)分布曲線下的面積,圖1-2 正態(tài)分布曲線及其面積分布,,正
18、態(tài)分布的主要特征,1. 以均值μ為中心,左右對稱。2. X取值范圍理論上沒有邊界。X離μ越遠,函數(shù)f(x)值越接近0,但不會等于0。3. 正態(tài)分布曲線下的面積分布有一定的規(guī)律。4. 正態(tài)分布完全由參數(shù)μ和?決定。 μ是位置參數(shù)(即平均水平),決定分布曲線在橫軸的偏移位置。當(dāng) ?一定后, μ 增大,曲線右移; 反之μ減小,曲線左移。?是變異參數(shù),決定分布曲線的形態(tài)。 ?越大,曲線的形態(tài)越“矮胖”,表示數(shù)據(jù)分布越分散; ?越小,曲線的
19、形態(tài)越“瘦高”,表示數(shù)據(jù)分布越集中。,標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution),標(biāo)準(zhǔn)正態(tài)分布:是均數(shù)為0、標(biāo)準(zhǔn)差為1的正態(tài)分布,即?=0、?=1 亦稱u分布。u變換 :將均數(shù)為μ ,標(biāo)準(zhǔn)差?為的正態(tài)分布變換成標(biāo)準(zhǔn)正態(tài)分布。 u=(X-?)/?,正態(tài)分布的應(yīng)用 醫(yī)學(xué)參考值范圍的估計,1.正態(tài)分布法估計參考值范圍公式為: 如制定95%參考值范圍,雙側(cè)界值
20、u=1.96,單側(cè)界值u=1.645。 雙側(cè)界值:x?1.96s 單側(cè)上界:x+1.645s 單側(cè)下界:x-1.645s,,,,,例題,[例1-12]某地調(diào)查正常成年男子144人的紅細胞數(shù)近似正態(tài)分布,得均數(shù)=5.38(1012/L),標(biāo)準(zhǔn)差s=0.44(1012/L),試估計該地成年男子紅細胞數(shù)的95%參考值范圍。 因紅細胞數(shù)過多或過少均為異常,故按雙側(cè)估計95%界值。 下限為:x -
21、1.96s=5.38-1.96 ×0.44 =4.52 (1012/L)上限為:x + 1.96s=5.38+1.96×0.44 =6.24(1012/L) 故該地成年男子紅細胞數(shù)的95%參考值范圍(4.52—6.24)1012/L,,,2、百分位數(shù)法,用于描述偏態(tài)分布資料 。1)白細胞數(shù)的95
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 從統(tǒng)計圖分析數(shù)據(jù)的集中趨勢教案
- 6.3 從統(tǒng)計圖分析數(shù)據(jù)的集中趨勢
- 6.3 從統(tǒng)計圖分析數(shù)據(jù)的集中趨勢-(4465)
- 6.3 從統(tǒng)計圖分析數(shù)據(jù)的集中趨勢2
- 6.3 從統(tǒng)計圖分析數(shù)據(jù)的集中趨勢1
- 醫(yī)學(xué)統(tǒng)計-統(tǒng)計描述
- 定性的統(tǒng)計描述
- 基礎(chǔ)統(tǒng)計描述
- 變異程度的統(tǒng)計描述
- 定性數(shù)據(jù)的統(tǒng)計描述
- 醫(yī)學(xué)統(tǒng)計學(xué)分類的統(tǒng)計描述
- 描述性統(tǒng)計
- 統(tǒng)計專管崗位描述
- 醫(yī)學(xué)統(tǒng)計學(xué)-計數(shù)資料的統(tǒng)計描述
- 分類變量資料的統(tǒng)計描述
- 統(tǒng)計數(shù)據(jù)的描述
- 醫(yī)學(xué)統(tǒng)計學(xué)定量資料的統(tǒng)計描述
- 數(shù)據(jù)的統(tǒng)計描述和分析
- 數(shù)據(jù)的統(tǒng)計描述和分析
- [學(xué)習(xí)]統(tǒng)計學(xué)-分布數(shù)量特征的統(tǒng)計描述
評論
0/150
提交評論