簡介:第三節(jié),資料的統(tǒng)計描述,一計量資料的統(tǒng)計描述,頻數(shù)分布集中趨勢指標離散趨勢指標,(一)頻數(shù)分布,一、頻數(shù)分布表簡稱頻數(shù)表(FREQUENCYTABLE,例97(P187),1頻數(shù)表的編制,(1)計算極差(RANGE)即最大值與最小值之差,又稱為全距。本例極差R591-386205(1012/L)(2)確定組數(shù)、組距和組限根據(jù)研究目的和樣本含量N確定。組數(shù)通常分815個組,為方便計,組距參考極差的十分之一,再略加調(diào)整。本例IR/10205/100205≈020。組距極差/擬分組數(shù)組限每個組段的起點為上限,終點為下限;第一組段要包括最小值,最后一個組段必須包含最大值。(3)列表劃記用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。,2、頻數(shù)分布圖(GRAPHOFFREQUENCYDISTRIBUTION,3頻數(shù)分布的兩個特征,集中趨勢,CENTRALTENDENCY指變量值的中心數(shù)值或中心位置所在。離散趨勢,TENDENCYOFDISPERSION指變量值圍繞中心數(shù)值或中心位置的分布情況。,4頻數(shù)分布的類型,對稱分布集中位置居中,左右兩邊對稱(特例正態(tài)分布)偏態(tài)分布正偏態(tài)分布(峰偏左)負偏態(tài)分布,5、頻數(shù)表的用途,揭示頻數(shù)的分布特征和分布類型;可以代替原始資料,便于計算和分析;便于發(fā)現(xiàn)某些特大或特小的可疑值。,(二)集中趨勢的描述,平均數(shù)(AVERAGE)用于觀察一組同質(zhì)變量值的平均水平/集中位置。亦稱中心位置指標。它不但給人一個簡明概括的印象,而且便于事物間的分析比較。常用的平均數(shù)算術均數(shù)ARITHMETICMEAN/MEAN幾何均數(shù)GEOMETRICMEAN中位數(shù)MEDIAN,1、算術均數(shù),簡稱均數(shù)ARITHMETICMEAN/MEAN,均數(shù)是算術均數(shù)的簡稱。總體均數(shù)用希臘字母Μ繆,MU表示樣本均數(shù)(XBAR)表示。,均數(shù)的應用條件,主要用于對稱性或近似對稱性分布的資料尤其是在正態(tài)分布或近似正態(tài)分布上的應用。,計算方法1直接法,Σ希臘字母SIGMA,求和符號例92有8名正常人的空腹血糖值(MMOL/L)62,54,57,53,61,60,58,596254575361605859588,,2加權法,加權法計算均數(shù),XJ為各組的組中值。組中值等于該組的上限加下限之和除以2。FJ為各組的頻數(shù)。101名正常成年女子的血清總膽固醇均值為40975/101406(MMOL/L),(二)幾何均數(shù)GEOMETRICMEAN,G,描述一組呈倍數(shù)(等比)關系的觀察值的平均水平。適用數(shù)據(jù)呈正偏態(tài)分布,經(jīng)對數(shù)轉換后呈正態(tài)分布。多用于觀察值之間呈倍數(shù)關系,如抗體滴度計算方法直接法加權法,1直接法,例有8份血清的抗體效價為15,110,120,140,180,1160,1320,1640。求平均效價。,用直接法計算G,將各效價的倒數(shù)代入公式,得該8份血清的平均抗體效價為15657,近似為157注意變量值不能有0,2加權法,式中F為頻數(shù)。,用加權法計算G,例30名麻疹易感兒童接種麻疹疫苗一個月后,血凝抑制抗體滴度如下表所示,試求其平均抗體滴度。,30名麻疹易感兒童血凝抑制抗體滴度,∑FLGX5058,30名麻疹易感兒童接種麻疹疫苗一個月后血凝抑制抗體滴度為1485,同一組資料求得的幾何均數(shù)小于均數(shù)。,將一組觀察值從小到大按順序排列,位次居中的觀察值,即為中位數(shù)。一半的值比M小,一半的值比M大。,(三)中位數(shù)MEDIAN,M,例1,3,5,7,18(奇數(shù))1,3,5,7,18,20(偶數(shù))計算N為奇數(shù)時N為偶數(shù)時,M計算方法,例9人某病潛伏期天分別為3,4,4,5,6,7,7,19,19,求中位數(shù)。例6名新生兒身長CM分別為501,520,530,550,550,560,求中位數(shù)。,,中位數(shù)的應用條件,偏態(tài)分布或分布狀態(tài)不明的資料;觀察值中有個別過小或過大值的資料分布的一端或兩端無確定的數(shù)值;(如50,或10)注意在完全對稱的單峰曲線分布中,同一組資料的均數(shù)與中位數(shù)相同,MEANMEDIAN,中位數(shù)的優(yōu)缺點,優(yōu)點不受個別特大或特小的觀察值影響;其它平均數(shù)不宜使用時,中位數(shù)就顯示出它的優(yōu)越性。缺點掉失了大量信息,其敏感性不夠。,三離散趨勢指標,例有3組同齡男孩體重(KG)如下,其體重均數(shù)都是30(KG),試分析離散程度。甲組2628303234乙組2427303336丙組2629303134,離散程度(或變異程度),指數(shù)據(jù)參差不齊的程度,反映資料的離散趨勢。將反映平均水平與離散程度的指標結合起來使用,可全面地描述數(shù)據(jù)的分布規(guī)律。,1極差(RANGE),極差最大值–最小值優(yōu)點簡單明了缺點不能反映組內(nèi)其他數(shù)據(jù)的變異,樣本含量相差較大時,不宜用極差比較分布的離散程度。,2四分位數(shù)間距INTERQUARTILERANGE,百分位數(shù)指把數(shù)據(jù)從小到大排列后處于第X百分位置的數(shù)值。它將全部數(shù)據(jù)分為兩部分,在不包括PX的全部數(shù)據(jù)中有X數(shù)據(jù)小于PX,有1X的數(shù)據(jù)大于PX。中位數(shù)是一個特定的百分位數(shù)P50。四分位數(shù)下四分位數(shù)P25;上四分位數(shù)P75P0P25P50P75P100四分位數(shù)間距P75P25或QUQL比極差穩(wěn)定,但仍未考慮每個數(shù)據(jù)的大小。常和中位數(shù)結合使用描述數(shù)據(jù)的分布規(guī)律。,3方差和標準差,離均差平方和考慮每個觀察值,但受N的影響。對離均差平方和求均數(shù),得總體方差?2,開根號得標準差?。,一般?未知,常常用來估計,數(shù)理統(tǒng)計證明,如用樣本的變量個數(shù)N來代替N,計算出的樣本方差比實際?2低,需要用N1校正,得樣本方差S2。開根號得樣本標準差S。,自由度,DEGREEOFFREEDOM,方差計算公式中的N1被稱為自由度,它描述了當選定時,N個X中能自由變動的X(變量值)的個數(shù)。例某樣本含有5個數(shù)據(jù),要求∑X15。則在自由確定了四個數(shù)據(jù)后,第5個數(shù)據(jù)只能是15X1X2X3X4。即有4個數(shù)據(jù)可以自由變動,其自由度4。推而廣之,任何統(tǒng)計量的自由度?=NK,K為限制條件的個數(shù)。自由度是隨機變量可以“自由”取值的個數(shù)。,總體標準差樣本標準差,標準差STANDARDDEVIATION,,,標準差的計算,甲組2628303234標準差316乙組2427303336474丙組2629303134292甲組∑X2628303234150∑X22622823023223424540,用頻數(shù)表法計算標準差,標準差的應用,反映一組觀察值的變異程度;衡量均數(shù)的代表性;結合樣本均數(shù)描述頻數(shù)分布特征;計算變異系數(shù)和標準誤;,標準差與算術均數(shù)之比,反映了相對離散程度常用于比較度量衡單位不同的多組資料的變異度均數(shù)相差懸殊的多組資料的變異度,5變異系數(shù)CV,例度量衡單位不同的變異度,某地20歲男子110名身高17273CM,S=409CM;體重=5504KG,S=410KG,試比較兩組資料的變異程度,即身高、體重的變異程度哪個大,例均數(shù)相差懸殊的變異度,二計數(shù)資料的統(tǒng)計描述,,常見的數(shù)據(jù)形式,絕對數(shù),,相對數(shù),但絕對數(shù)通常不具有可比性。,例甲地麻疹發(fā)病人數(shù)30人乙地麻疹發(fā)病人數(shù)25人地區(qū)麻疹發(fā)病人數(shù)易感兒童數(shù)麻疹發(fā)?。ǎ┘椎?030001乙地25100025,,,,構成比率相對比,常用的相對數(shù)指標,1構成比,,表示事物內(nèi)部各組成部分的比重或分布,常以百分數(shù)表示。,例1本班有學生40名,其中男生15名,女生25名。性別構成比男生性別構成比15/40100375;女生性別構成比25/40100625,白細胞分類計數(shù),,構成比的特點,(1)各部分構成比的合計為100。(2)事物內(nèi)部某一部分的構成比發(fā)生變化,其他部分構成也發(fā)生變化。,說明某現(xiàn)象或某事物發(fā)生的頻率或強度。常用百分率()、千分率(‰)、萬分率()、十萬分率()來表示。,2率,比例基數(shù)的選用一般依據(jù)習慣,使計算出來的率的結果保留12位整數(shù)。,例1某醫(yī)院1998年在某城區(qū)隨機調(diào)查了8589例60歲及以上老人,體檢發(fā)現(xiàn)高血壓患者為2823例,求高血壓的患病率。,例21999年某幼兒園有36名兒童患了腮腺炎,該幼兒園共有200名兒童(其中25名兒童以前患過),求該幼兒園1999年腮腺炎的發(fā)病率。,3相對比(RELATIVERATIO)是兩個相關聯(lián)的指標之比。說明(1)式中甲乙兩指標可以是絕對數(shù)、平均數(shù)或相對數(shù);(2)式中甲乙兩指標的性質(zhì)可以相同,也可以是性質(zhì)不同。,例1某地某年出生的嬰兒中,男性嬰兒為484人,女性嬰兒為460人,求出生嬰兒的性別比。出生嬰兒的性別比例為484/4601052(或105100),(二)應用相對數(shù)的注意事項,1計算相對數(shù)時樣本含量應足夠多,2不能用構成比代替率,3注意資料的可比性,4要考慮存在抽樣誤差,,,,習題1,有人說50~歲組患者的比重最高,該組患病最嚴重,60~歲后患病下降。此說法對嗎為什么,下列因素可能影響對比組之間的可比性(1)觀察對象是否同質(zhì),研究方法是否相同,觀察時間是否相等,以及地區(qū)、周圍環(huán)境、風俗習慣和經(jīng)濟條件是否一致或相近等。(2)觀察對象內(nèi)部結構是否相同,若兩組資料的年齡、性別等構成不同,可以分別進行同年齡別、同性別的小組率比較或對總率(合計率)進行標準化后再作比較。,
下載積分: 6 賞幣
上傳時間:2024-01-07
頁數(shù): 56
大小: 0.7(MB)
子文件數(shù):
簡介:發(fā)病頻率測量指標發(fā)病率(INCIDENCERATE)定義是指一定期間內(nèi),一定范圍人群中某病新發(fā)生病例出現(xiàn)的頻率。,,K100,1000‰,10000/萬,罹患率(ATTACKRATE)定義測量某人群某病新病例發(fā)生頻率的指標,通常指在某一局限范圍短時間內(nèi)的發(fā)病率。,K的取值常為100,1000‰,續(xù)發(fā)率(SECONDARYATTACKRATE,SAR)也稱二代發(fā)病率。定義指在某些傳染病最短潛伏期到最長潛伏期之間,易感接觸者中發(fā)病人數(shù)占所有易感接觸者總數(shù)的百分比。,,病死率(CASEFATALITYRATE)定義一定時期內(nèi)因某病死亡者占該病患者的比例,表示某病患者因該病死亡的危險性。應用表示確診某病者的死亡概率,可反映疾病的嚴重程度,也可反映醫(yī)療水平和診治能力,常用于急性傳染病,較少用于慢性病。,,描述性研究又稱橫斷面研究(CROSSSECTIONALSTUDY也稱患病率研究(PREVALENCESTUDY)現(xiàn)況研究,,隊列研究,定群研究前瞻性隊列研究回顧性隊列研究雙向隊列研究,41資料的整理,暴露組發(fā)病率A/AB對照組發(fā)病率C/CD如果二者差異顯著,并且無明顯偏倚,則暴露因素與疾病之間有可能存在因果關系,前言概述步驟分析,451效應估計相對危險度,意義暴露組發(fā)病或死亡的危險是非暴露組的多少倍RR值越大,暴露的效應越大,暴露與結局關聯(lián)強度越大,IE暴露組率IO非暴露組率,RELATIVERISK,前言概述步驟分析,451效應估計相對危險度,LNRR的95CI,RR95CI,反自然對數(shù)即為RR95CI,WOOLF法,前言概述步驟分析,452效應估計歸因危險度AR,前言概述步驟分析,意義暴露與非暴露人群比較,所增加的疾病發(fā)生數(shù)量AR值越大,暴露因素消除后所減少的疾病數(shù)量越大,或,452效應估計歸因危險度百分比AR,前言概述步驟分析,意義暴露人群中的發(fā)病或死亡歸因于暴露的部分占全部發(fā)病或死亡百分比也就是說是指暴露人群中單純由于暴露所引起的發(fā)病人數(shù)占總發(fā)病人數(shù)的百分比,或,453效應估計人群歸因危險度PAR,前言概述步驟分析,POPULATIONATTRIBUTABLERISKPAR,PARIT-I0,IT總人群發(fā)生率IO非暴露組發(fā)生率,454效應估計人群歸因危險度百分比PAR,前言概述步驟分析,意義它反映實際人群中單純由于暴露因素所致的發(fā)病占人群中發(fā)病總數(shù)的百分比,或,PE總人群的暴露比例,病例對照研究,CASECONTROLSTUDY,第五章,病例對照研究特點,,回顧性由果因研究觀察法一般不能驗證病因,(二)推斷統(tǒng)計,ORODDSRATIO又稱優(yōu)勢比,比值比,交叉乘積比,指病例組中暴露人數(shù)與非暴露人數(shù)的比值除以對照組中暴露人數(shù)與非暴露人數(shù)的比值ORA/C/B/DAD/BC,比值是指事件發(fā)生的概率與不發(fā)生的概率之比病例組有暴露史與無暴露史的概率之比A/M1/C/M1對照組有暴露史與無暴露史的概率之比B/M0/D/M0以暴露比值/無暴露比值或有病比值/無病比值計算的OR值結果一致,暴露與疾病的聯(lián)系強度的指標隊列研究RR暴露組發(fā)病率(或死亡率)/非暴露組發(fā)病率(或死亡率)病例-對照研究由于無暴露組和非暴露組的觀察人數(shù),而只是所有病例和所有對照的有代表性樣本,故無法直接計算真實的發(fā)病率或死亡率,也無法計算相對危險度,只能計算比值比OR。ORAD/BC,1、不匹配不分層資料的分析,Χ2檢驗四格表的專用公式,,暴露與疾病聯(lián)系強度的OR,OR的95可信區(qū)間,例食管癌發(fā)病因素的研究,①四格表的專用公式,(2)OR值的的點估計值(樣本值),2)MIETTINEN氏卡方值法,,(3)OR的95可信區(qū)間1)WOOLF自然對數(shù)轉換法,結果表明吸煙者患食管癌的危險性是不吸煙者的287倍,OR的95的可信區(qū)間是在218~378之間,OR1±196/Χ,配對數(shù)據(jù)的分析11配對資料,匹配資料是由病例與對照結合成對子,列成下表的格式,表內(nèi)的數(shù)字A、B、C、D是病例與對照配成對的對子數(shù),11配對研究中疾病與暴露的關系,OR的95CI,例食管癌發(fā)病因素的男性研究資料,93對男性食管癌與對照的吸煙史,表明男性吸煙者患食管癌的危險性是不吸煙者的43倍,95的可信區(qū)間是在184~1008之間。,(一)二分類情形22列聯(lián)表,四格表資料Χ2檢驗專用公式,(一)二分類情形22列聯(lián)表,四格表資料Χ2檢驗專用公式的校正,完全隨機設計四格表資料Χ2檢驗適用條件當N≥40且TMIN≥5時,Χ2檢驗基本公式或四格表專用公式;當N≥40,1≤TMIN<5時,需對Χ2值進行校正;當N<40或TMIN<1時,改用四格表確切概率計算法。(Χ2檢驗所得概率P≈Α時),,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 27
大小: 0.25(MB)
子文件數(shù):