簡介:第1章緒論,1,醫(yī)學(xué)統(tǒng)計(jì)學(xué),主講程琮,THETEACHINGPLANFORMEDICALSTUDENTS,PROFESSORCHENGCONG,DEPTOFPREVENTIVEMEDICINETAISHANMEDICALCOLLEGE,預(yù)防醫(yī)學(xué)教授,碩士生導(dǎo)師。男,1959年6月出生。漢族,無黨派。1982年12月,山東醫(yī)學(xué)院公共衛(wèi)生專業(yè)五年本科畢業(yè),獲醫(yī)學(xué)學(xué)士學(xué)位。1994年7月,上海醫(yī)科大學(xué)公共衛(wèi)生學(xué)院研究生畢業(yè),獲醫(yī)學(xué)碩士學(xué)位。2003年12月晉升教授?,F(xiàn)任預(yù)防醫(yī)學(xué)教研室副主任。主要從事醫(yī)學(xué)統(tǒng)計(jì)學(xué)、預(yù)防醫(yī)學(xué),醫(yī)學(xué)人口統(tǒng)計(jì)學(xué)等課程的教學(xué)及科研工作,每年聽課學(xué)生500800人。自2000年起連續(xù)六年,為碩士研究生開設(shè)醫(yī)學(xué)統(tǒng)計(jì)學(xué)、SPSS統(tǒng)計(jì)分析簡明教程、衛(wèi)生經(jīng)濟(jì)學(xué)等課程,同時(shí)指導(dǎo)研究生的科研設(shè)計(jì)、開題報(bào)告及科研資料的統(tǒng)計(jì)處理與分析。發(fā)表醫(yī)學(xué)統(tǒng)計(jì)學(xué)及預(yù)防醫(yī)學(xué)的科研論文30多篇。代表作有“鋅對(duì)乳癌細(xì)胞生長、增殖與基因表達(dá)的影響”,,“行列相關(guān)的測度”等。主編、副主編各類教材及專著8部,代表作有醫(yī)學(xué)統(tǒng)計(jì)學(xué)、SPSS統(tǒng)計(jì)分析簡明教程獲得院級(jí)科研論文及科技進(jìn)步獎(jiǎng)8項(xiàng),院第四屆教學(xué)能手比賽二等獎(jiǎng)一項(xiàng),院教學(xué)評(píng)建先進(jìn)工作者一項(xiàng)。獲2004年泰山醫(yī)學(xué)院首屆十大教學(xué)名師獎(jiǎng)。,程琮教授簡介,醫(yī)學(xué)統(tǒng)計(jì)學(xué)總目錄,第1章緒論,第2章定量資料統(tǒng)計(jì)描述,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第4章方差分析,第5章定性資料的統(tǒng)計(jì)描述,第6章總體率的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第7章二項(xiàng)分布與泊松分布,第8章秩和檢驗(yàn),第9章直線相關(guān)與回歸,第10章實(shí)驗(yàn)設(shè)計(jì),第11章調(diào)查設(shè)計(jì),第12章統(tǒng)計(jì)表與統(tǒng)計(jì)圖,第1章緒論目錄,第五節(jié)學(xué)習(xí)統(tǒng)計(jì)學(xué)應(yīng)注意的幾個(gè)問題,第二節(jié)統(tǒng)計(jì)工作的基本步驟,第三節(jié)統(tǒng)計(jì)資料的類型,第四節(jié)統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念,第一節(jié)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義和內(nèi)容,第一章緒論第一節(jié)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義和內(nèi)容,醫(yī)學(xué)統(tǒng)計(jì)學(xué)MEDICALSTATISTICS是以醫(yī)學(xué)理論為指導(dǎo),運(yùn)用數(shù)理統(tǒng)計(jì)學(xué)的原理和方法研究醫(yī)學(xué)資料的搜集、整理與分析,從而掌握事物內(nèi)在客觀規(guī)律的一門學(xué)科。,醫(yī)學(xué)研究的對(duì)象主要是人以及與其健康有關(guān)的各種影響因素。醫(yī)學(xué)統(tǒng)計(jì)學(xué)的主要內(nèi)容1統(tǒng)計(jì)設(shè)計(jì)包括實(shí)驗(yàn)設(shè)計(jì)和調(diào)查設(shè)計(jì),它可以合理地、科學(xué)地安排實(shí)驗(yàn)和調(diào)查工作,使之能較少地花費(fèi)人力、物力和時(shí)間,取得較滿意和可靠的結(jié)果。2資料的統(tǒng)計(jì)描述和總體指標(biāo)的估計(jì)通過計(jì)算各種統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)圖表來描述資料的集中趨勢、離散趨勢和分布特征況(如正態(tài)分布或偏態(tài)分布);利用樣本指標(biāo)來估計(jì)總體指標(biāo)的大小。,3假設(shè)檢驗(yàn)是通過統(tǒng)計(jì)檢驗(yàn)方法(如T檢驗(yàn)、U檢驗(yàn)、F檢驗(yàn)、卡方檢驗(yàn)、秩和檢驗(yàn)等)來推斷兩組或多組統(tǒng)計(jì)指標(biāo)的差異是抽樣誤差造成的還是有本質(zhì)的差別。4相關(guān)與回歸醫(yī)學(xué)中存在許多相互聯(lián)系、相互制約的現(xiàn)象。如兒童的身高與體重、胸圍與肺活量、血糖與尿糖等,都需要利用相關(guān)與回歸來分析。,5多因素分析如多元回歸、判別分析、聚類分析、正交設(shè)計(jì)分析、主成分分析、因子分析、LOGISTIC回歸、COX比例風(fēng)險(xiǎn)回歸等,都是分析醫(yī)學(xué)中多因素有效的方法(本書不涉及,請(qǐng)參考有關(guān)統(tǒng)計(jì)書籍)。這些方法計(jì)算復(fù)雜,大部分需借助計(jì)算機(jī)來完成。6健康統(tǒng)計(jì)研究人群健康的指標(biāo)與統(tǒng)計(jì)方法,除了用上述的某些方法外,他還有其特有的方法,如壽命表、生存分析、死因分析、人口預(yù)測等方法,醫(yī)學(xué)統(tǒng)計(jì)工作可分為四個(gè)步驟統(tǒng)計(jì)設(shè)計(jì)、搜集資料、整理資料和分析資料。這四個(gè)步驟密切聯(lián)系,缺一不可,任何一個(gè)步驟的缺陷和失誤,都會(huì)影響統(tǒng)計(jì)結(jié)果的正確性。,第二節(jié)統(tǒng)計(jì)工作的基本步驟,設(shè)計(jì)(DESIGN)是統(tǒng)計(jì)工作的第一步,也是關(guān)鍵的一步,是對(duì)統(tǒng)計(jì)工作全過程的設(shè)想和計(jì)劃安排。統(tǒng)計(jì)設(shè)計(jì)---就是根據(jù)研究目的確定試驗(yàn)因素、受試對(duì)象和觀察指標(biāo),并在現(xiàn)有的客觀條件下決定用什么方式和方法來獲取原始資料,并對(duì)原始資料如何進(jìn)行整理,以及整理后的資料應(yīng)該計(jì)算什么統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)分析的預(yù)期結(jié)果如何等。,一、統(tǒng)計(jì)設(shè)計(jì),搜集資料COLLECTIONOFDATE是根據(jù)設(shè)計(jì)的要求,獲取準(zhǔn)確可靠的原始資料,是統(tǒng)計(jì)分析結(jié)果可靠的重要保證。醫(yī)學(xué)統(tǒng)計(jì)資料的來源主要有以下三個(gè)方面1統(tǒng)計(jì)報(bào)表統(tǒng)計(jì)報(bào)表是醫(yī)療衛(wèi)生機(jī)構(gòu)根據(jù)國家規(guī)定的報(bào)告制度,定期逐級(jí)上報(bào)的有關(guān)報(bào)表。如法定傳染病報(bào)表、出生死亡報(bào)表、醫(yī)院工作報(bào)表等,報(bào)表要完整、準(zhǔn)確、及時(shí)。,二、搜集資料,2醫(yī)療衛(wèi)生工作記錄如病歷、醫(yī)學(xué)檢查記錄、衛(wèi)生監(jiān)測記錄等。3專題調(diào)查或?qū)嶒?yàn)研究它是根據(jù)研究目的選定的專題調(diào)查或?qū)嶒?yàn)研究,搜集資料有明確的目的與針對(duì)性。它是醫(yī)學(xué)科研資料的主要來源。,整理資料(SORTINGDATA)的目的就是將搜集到的原始資料進(jìn)行反復(fù)核對(duì)和認(rèn)真檢查,糾正錯(cuò)誤,分類匯總,使其系統(tǒng)化、條理化,便于進(jìn)一步的計(jì)算和分析。整理資料的過程如下1審核認(rèn)真檢查核對(duì),保證資料的準(zhǔn)確性和完整性。2分組歸納分組,分組方法有兩種①質(zhì)量分組,即將觀察單位按其類別或?qū)傩苑纸M,如按性別、職業(yè)、陽性和陰性等分組。②數(shù)量分組,即將觀察單位按其數(shù)值的大小分組,如按年齡的大小、藥物劑量的大小等分組。,三、整理資料,3匯總分組后的資料要按照設(shè)計(jì)的要求進(jìn)行匯總,整理成統(tǒng)計(jì)表。原始資料較少時(shí)用手工匯總,當(dāng)原始資料較多時(shí),可使用計(jì)算機(jī)匯總。四、分析資料分析資料ANALYSISOFDATA是根據(jù)設(shè)計(jì)的要求,對(duì)整理后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析,結(jié)合專業(yè)知識(shí),作出科學(xué)合理的解釋。,1統(tǒng)計(jì)描述DESCRIPTIVESTATISTICS將計(jì)算出的統(tǒng)計(jì)指標(biāo)與統(tǒng)計(jì)表、統(tǒng)計(jì)圖相結(jié)合,全面描述資料的數(shù)量特征及分布規(guī)律。2統(tǒng)計(jì)推斷INFERENTIALSTATISTICS使用樣本信息推斷總體特征。通過樣本統(tǒng)計(jì)量進(jìn)行總體參數(shù)的估計(jì)和假設(shè)檢驗(yàn),以達(dá)到了解總體的數(shù)量特征及其分布規(guī)律,才是最終的研究目的。,統(tǒng)計(jì)分析包括以下兩大內(nèi)容,醫(yī)學(xué)統(tǒng)計(jì)資料按研究指標(biāo)的性質(zhì)一般分為定量資料、定性資料和等級(jí)資料三大類。一、定量資料定量資料(QUANTITATIVEDATA)亦稱計(jì)量資料(MEASUREMENTDATA),是用定量的方法測定觀察單位(個(gè)體)某項(xiàng)指標(biāo)數(shù)值的大小,所得的資料稱定量資料。如身高(㎝)、體重(㎏)、脈搏(次/分)、血壓(KPA)等為數(shù)值變量,其組成的資料為定量資料。,第三節(jié)統(tǒng)計(jì)資料的類型,定性資料(QUALITATIVEDATA)亦稱計(jì)數(shù)資料(ENUMERATIONDATA)或分類資料(CATEGORICALDATA),是將觀察單位按某種屬性或類別分組,清點(diǎn)各組的觀察單位數(shù),所得的資料稱定性資料。定性資料的觀察指標(biāo)為分類變量(CATEGORICALVARIABLE)。如人的性別按男、女分組;化驗(yàn)結(jié)果按陽性、陰性分組;動(dòng)物實(shí)驗(yàn)按生存、死亡分組;調(diào)查某人群的血型按A、B、O、AB分組等,觀察單位出現(xiàn)的結(jié)果為分類變量,分類變量沒有量的差別,只有質(zhì)的不同,其組成的資料為定性資料。,二、定性資料,三、等級(jí)資料,,等級(jí)資料(RANKEDDATA)亦稱有序分類資料(ORDINALCATEGORICALDATA),是將觀察單位按屬性的等級(jí)分組,清點(diǎn)各組的觀察單位數(shù),所得的資料為等級(jí)資料。如治療結(jié)果分為治愈、顯效、好轉(zhuǎn)、無效四個(gè)等級(jí)。,根據(jù)需要,各類變量可以互相轉(zhuǎn)化。若按貧血的診斷標(biāo)準(zhǔn)將血紅蛋白分為四個(gè)等級(jí)重度貧血、中度貧血、輕度貧血、正常,可按等級(jí)資料處理。有時(shí)亦可將定性資料或等級(jí)資料數(shù)量化,如將等級(jí)資料的治療結(jié)果賦以分值,分別用0、1、2等表示,則可按定量資料處理。如調(diào)查某人群的尿糖的情況,以人為觀察單位,結(jié)果可分、±、+、++、+++五個(gè)等級(jí)。,同質(zhì)(HOMOGENEITY)是指觀察單位或研究個(gè)體間被研究指標(biāo)的主要影響因素相同或基本相同。如研究兒童的生長發(fā)育,同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質(zhì)兒童。變異(VARIATION)由于生物個(gè)體的各種指標(biāo)所受影響因素極為復(fù)雜,同質(zhì)的個(gè)體間各種指標(biāo)存在差異,這種差異稱為變異。如同質(zhì)的兒童身高、體重、血壓、脈搏等指標(biāo)會(huì)有一定的差別。,第四節(jié)統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念一、同質(zhì)與變異,,二、總體與樣本,樣本(SAMPLE)是從總體中隨機(jī)抽取的部分觀察單位變量值的集合。樣本的例數(shù)稱為樣本含量(SAMPLESIZE)。注意1。總體是相對(duì)的,總體的大小是根據(jù)研究目的而確定的。2。樣本應(yīng)有代表性,即應(yīng)該隨機(jī)抽樣并有足夠的樣本含量。,圖示總體與樣本,POPULATION,SAMPLE2,SAMPLE1,SAMPLE3,SAMPLE4,SAMPLE5,,,,,,三、參數(shù)與統(tǒng)計(jì)量,參數(shù)(PARAMETER)由總體計(jì)算或得到的統(tǒng)計(jì)指標(biāo)稱為參數(shù)??傮w參數(shù)具有很重要的參考價(jià)值。如總體均數(shù)Μ,總體標(biāo)準(zhǔn)差Σ等。統(tǒng)計(jì)量(STATISTIC)由樣本計(jì)算的指標(biāo)稱為統(tǒng)計(jì)量。如樣本均數(shù),樣本標(biāo)準(zhǔn)差S等。注意一般不容易得到參數(shù),而容易獲得樣本統(tǒng)計(jì)量。,四、抽樣誤差,抽樣誤差(SAMPLEERROR)由于隨機(jī)抽樣所引起的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異以及樣本統(tǒng)計(jì)量之間的差別稱為抽樣誤差。如樣本均數(shù)與總體均數(shù)之間的差別,樣本率與總體率的差別等。注意抽樣誤差是不可避免的。無論抽樣抽得多么好,也會(huì)存在抽樣誤差。,五、概率,概率(PROBABILITY)是描述隨機(jī)事件發(fā)生可能性大小的量值。用英文大寫字母P來表示。概率的取值范圍在0~1之間。當(dāng)P=0時(shí),稱為不可能事件;當(dāng)P=1時(shí),稱為必然事件。小概率事件統(tǒng)計(jì)學(xué)上一般把P≤005或P≤001的事件稱為小概率事件。小概率原理小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生。利用該原理可對(duì)科研資料進(jìn)行假設(shè)檢驗(yàn)。,第五節(jié)學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題,1重點(diǎn)掌握醫(yī)學(xué)統(tǒng)計(jì)學(xué)的基本知識(shí)、基本技能、基本概念和基本方法,掌握使用范圍和注意事項(xiàng)。2要培養(yǎng)科學(xué)的統(tǒng)計(jì)思維方法,提高分析問題、解決問題的能力。3掌握調(diào)查設(shè)計(jì)和實(shí)驗(yàn)設(shè)計(jì)的原則,培養(yǎng)搜集、整理、分析統(tǒng)計(jì)資料的系統(tǒng)工作能力。,課后作業(yè),列舉出計(jì)量資料、分類資料、等級(jí)資料各10個(gè)實(shí)例。列舉出可能事件、必然事件、不可能事件及小概率事件各10個(gè)。認(rèn)真復(fù)習(xí)本章已學(xué)過的基本概念2-3遍。,BESTWISHESTOALLOFYOUTHANKYOUFORLISTENING,THEEND,醫(yī)學(xué)本科生用,主講程琮,泰山醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室ZCHENGTSMCEDUCN,醫(yī)學(xué)統(tǒng)計(jì)學(xué),THETEACHINGPLANFORMEDICALSTUDENTS,PROFESSORCHENGCONG,DEPTOFPREVENTIVEMEDICINETAISHANMEDICALCOLLEGE,第2章定量資料的統(tǒng)計(jì)描述目錄,第二節(jié)集中趨勢的描述,第三節(jié)離散趨勢的描述,第四節(jié)正態(tài)分布,第一節(jié)頻數(shù)分布表,統(tǒng)計(jì)描述是用統(tǒng)計(jì)圖表、統(tǒng)計(jì)指標(biāo)來描述資料的分布規(guī)律及其數(shù)量特征。頻數(shù)分布表(FREQUENCYDISTRIBUTIONTABLE)主要由組段和頻數(shù)兩部分組成表格。,第一節(jié)頻數(shù)分布表,第二章定量資料的統(tǒng)計(jì)描述,二、頻數(shù)分布表的編制,編制步驟1計(jì)算全距RANGE一組變量值最大值和最小值之差稱為全距RANGE,亦稱極差,常用R表示。2確定組距CLASSINTERVAL組距用I表示;3劃分組段每個(gè)組段的起點(diǎn)稱組下限,終點(diǎn)稱組上限。一般分為8~15組。;4統(tǒng)計(jì)頻數(shù)將所有變量值通過劃記逐個(gè)歸入相應(yīng)組段;5頻率與累計(jì)頻率將各組的頻數(shù)除以N所得的比值被稱為頻率。累計(jì)頻率等于累計(jì)頻數(shù)除以總例數(shù)。,,表22某年某市120名12歲健康男孩身高(CM)的頻數(shù)分布,二、頻數(shù)分布表的用途,1揭示資料的分布類型2觀察資料的集中趨勢和離散趨勢3便于發(fā)現(xiàn)某些特大或特小的可疑值4便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和作統(tǒng)計(jì)處理,第二節(jié)集中趨勢的描述,集中趨勢代表一組同質(zhì)變量值的集中趨勢或平均水平。常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。另外不常用的有眾數(shù),調(diào)和平均數(shù)和調(diào)整均數(shù)等。,一、算術(shù)均數(shù),算術(shù)均數(shù)ARITHMETICMEAN簡稱均數(shù)。適用條件對(duì)稱分布或近似對(duì)稱分布的資料。習(xí)慣上以希臘字母Μ表示總體均數(shù)POPULATIONMEAN,以英文字母表示樣本均數(shù)SAMPLEMEAN,1直接法用于觀察值個(gè)數(shù)不多時(shí),,,,計(jì)算方法,2加權(quán)法WEIGHTINGMETHOD用于變量值個(gè)數(shù)較多時(shí)。,,,注意權(quán)數(shù)即頻數(shù)F,為權(quán)重權(quán)衡之意。,,,,表24120名12歲健康男孩身高CM均數(shù)和標(biāo)準(zhǔn)差加權(quán)法計(jì)算表,120名12歲健康男孩身高均數(shù)為14307CM。,,,計(jì)算結(jié)果,幾何均數(shù)GEOMETRICMEAN,簡記為G表示其平均水平。適用條件對(duì)于變量值呈倍數(shù)關(guān)系或呈對(duì)數(shù)正態(tài)分布正偏態(tài)分布,如抗體效價(jià)及抗體滴度,某些傳染病的潛伏期,細(xì)菌計(jì)數(shù)等。計(jì)算公式有直接法和加權(quán)法。,二、幾何均數(shù),1直接法用于變量值的個(gè)數(shù)N較少時(shí),,,,,,,,,直接法計(jì)算實(shí)例,2加權(quán)法用于資料中相同變量值的個(gè)數(shù)F(即頻數(shù))較多時(shí)。,,,,,,表2550名兒童麻疹疫苗接種后血凝抑制抗體滴度幾何均數(shù)計(jì)算表,,,50名兒童麻疹疫苗接種后平均血凝抑制抗體滴度為16055。,計(jì)算結(jié)果將有關(guān)已知數(shù)據(jù)代入公式有,①變量值中不能有0;②不能同時(shí)有正值和負(fù)值;③若全是負(fù)值,計(jì)算時(shí)可先把負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。,計(jì)算幾何均數(shù)注意事項(xiàng),㈠中位數(shù)定義將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)MEDIAN,簡記為M。適用條件①變量值中出現(xiàn)個(gè)別特小或特大的數(shù)值②資料的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè)③變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個(gè)數(shù)值④資料的分布不清。,三、中位數(shù)及百分位數(shù),定義百分位數(shù)PERCENTILE是一種位置指標(biāo),以PX表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小到大按順序排列,理論上有X的變量值比PX小,有100X的變量值比PX大。故P50分位數(shù)也就是中位數(shù),即P50M。,㈡百分位數(shù),①描述一組資料在某百分位置上的水平;②用于確定正常值范圍;③計(jì)算四分位數(shù)間距。,百分位數(shù)的應(yīng)用條件,計(jì)算方法有直接法和加權(quán)法,1直接法用于例數(shù)較少時(shí),,,,,N為奇數(shù)時(shí),N為偶數(shù)時(shí),2頻數(shù)表法用于例數(shù)較多時(shí),,,,,中位數(shù),百分位數(shù),,,,表26145例食物中毒病人潛伏期分布表,先找到包含PX的最小累計(jì)頻率;該累計(jì)頻率同行左邊的組段值為L;L同行右邊的頻數(shù)為FX或FM;L前一行的累計(jì)頻數(shù)為∑FL;將上述已知條件代入公式計(jì)算PX或P50。,計(jì)算中位數(shù)及百分位數(shù)的步驟,計(jì)算結(jié)果,,,,,,定義用來說明變量值的離散程度或變異程度。注意僅用集中趨勢尚不能完全反映一組數(shù)據(jù)的特征。故應(yīng)將集中趨勢和離散趨勢結(jié)合起來才能更好地反映一組數(shù)據(jù)的特征。常用離散指標(biāo)有極差、四分位數(shù)間距、標(biāo)準(zhǔn)差、方差、變異系數(shù)。,第三節(jié)離散趨勢的描述,甲組184186188190192乙組180184188192196兩組球員的平均身高都是188CM,但甲組球員身高比較集中,乙組球員身高比較分散。為了說明離散趨勢,就要用離散指標(biāo)。,實(shí)例分析,㈠極差極差RANGE,簡記為R亦稱全距,即一組變量值中最大值與最小值之差。特點(diǎn)計(jì)算簡單,不穩(wěn)定,不全面,易變化;可用于各種分布的資料。,一、極差和四分位數(shù)間距,㈡四分位數(shù)間距,公式QP75-P25特點(diǎn)比極差穩(wěn)定,只反映中間兩端值的差異。計(jì)算不太方便??捎糜诟鞣N分布的資料。,二、方差和標(biāo)準(zhǔn)差,㈠方差(VARIANCE),,,,,總體方差,樣本方差,自由度DEGREEOFFREEDOM的概念,N1是自由度,用希臘小寫字母Ν表示,讀作NJU。定義在N維或N度空間中能夠自由選擇的維數(shù)或度數(shù)。例A+B=C,共有N3個(gè)元素,其中只能任選2個(gè)元素的值,故自由度Ν=N1312。,方差的特點(diǎn),充分反映每個(gè)數(shù)據(jù)間的離散狀況,意義深刻;指標(biāo)穩(wěn)定,應(yīng)用廣泛,但計(jì)算較為復(fù)雜,不易理解;方差的單位與原數(shù)據(jù)不同,有時(shí)使用時(shí)不太方便;在方差分析中應(yīng)用甚廣而極為重要。,(二)標(biāo)準(zhǔn)差STANDARDDEVIATION,,,,,總體標(biāo)準(zhǔn)差,樣本標(biāo)準(zhǔn)差,牢記離均差平方和展開式,,,標(biāo)準(zhǔn)差的特點(diǎn),意義同方差,是方差的開平方;標(biāo)準(zhǔn)差的單位與原數(shù)據(jù)相同,使用方便,意義深刻,應(yīng)用廣泛;故一般已作為醫(yī)學(xué)生物學(xué)領(lǐng)域中反映變異的標(biāo)準(zhǔn),故稱標(biāo)準(zhǔn)差。,標(biāo)準(zhǔn)差的計(jì)算方法可分為直接法和加權(quán)法。,1直接法,,,2加權(quán)法,,,直接法標(biāo)準(zhǔn)差計(jì)算實(shí)例,例212例22中7名正常男子紅細(xì)胞數(shù)(1012/L)如下467,474,477,488,476,472,492,計(jì)算其標(biāo)準(zhǔn)差。∑X4674744774884764724923346∑X2467247424772488247624722492215999,計(jì)算結(jié)果,,,例213對(duì)表24資料用加權(quán)法計(jì)算120名12歲健康男孩身高值的標(biāo)準(zhǔn)差。,加權(quán)法標(biāo)準(zhǔn)差計(jì)算實(shí)例,,,在表24中已算得∑FX17168,∑FX22460040,代入公式,變異系數(shù)COEFFICIENTOFVARIATION簡記為CV;特征①變異系數(shù)為無量綱單位,可以比較不同單位指標(biāo)間的變異度;②變異系數(shù)消除了均數(shù)的大小對(duì)標(biāo)準(zhǔn)差的影響,所以可以比較兩均數(shù)相差較大時(shí)指標(biāo)間的變異度。,三、變異系數(shù),,,例214某地20歲男子160人,身高均數(shù)為16606CM,標(biāo)準(zhǔn)差為495CM體重均數(shù)為5372KG,標(biāo)準(zhǔn)差為496KG。試比較身高與體重的變異程度。,變異系數(shù)計(jì)算實(shí)例,身高,,,體重,,,變異系數(shù)計(jì)算結(jié)果,第四節(jié)正態(tài)分布,一、正態(tài)分布的概念和特征,正態(tài)分布(NORMALDISTRIBUTION)也稱高斯分布,是醫(yī)學(xué)和生物學(xué)最常見的連續(xù)性分布。如身高、體重、紅細(xì)胞數(shù)、血紅蛋白等。,圖21120名12歲健康男孩身高的頻數(shù)分布,㈠正態(tài)分布的函數(shù)和圖形,,,正態(tài)分布的密度函數(shù),即正態(tài)曲線的方程為,圖22頻數(shù)分布逐漸接近正態(tài)分布示意,,為了應(yīng)用方便,常按公式(219)作變量變換,,,U值稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差,有的參考書也將U值稱為Z值。,這樣將正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布(STANDARDNORMALDISTRIBUTION),,,圖23正態(tài)分布的面積與縱高,,㈡正態(tài)分布的特征,1集中性正態(tài)曲線的高峰位于正中央,即均數(shù)所在的位置。對(duì)稱性正態(tài)曲線以均數(shù)為中心,左右對(duì)稱,3正態(tài)分布有兩個(gè)參數(shù),即均數(shù)和標(biāo)準(zhǔn)差。4正態(tài)曲線下面積有一定的分布規(guī)律,圖24不同標(biāo)準(zhǔn)差的正態(tài)分布示意,,二、正態(tài)曲線下面積的分布規(guī)律,,標(biāo)準(zhǔn)正態(tài)分布表(U值表),標(biāo)準(zhǔn)正態(tài)分布曲線下的面積,由此表可查出曲線下某區(qū)間的面積。查表時(shí)應(yīng)注意①表中曲線下面積為∞到U的下側(cè)累計(jì)面積;②當(dāng)已知Μ、Σ、和X時(shí),先按公式(219)求得U值,再查表;當(dāng)和未知時(shí),并且樣本例數(shù)在100例以上,常用樣本均數(shù)和標(biāo)準(zhǔn)差S分別代替Μ和Σ,按公式(219)求得U值;③曲線下橫軸上的總面積為100或1,例216前例21中,某年某市120名12歲健康男孩身高,已知均數(shù)14307CM,標(biāo)準(zhǔn)差S570CM,①估計(jì)該地12歲健康男孩身高在135CM以下者占該地12歲男孩總數(shù)的百分?jǐn)?shù);②估計(jì)身高界于135CM~150CM范圍內(nèi)12歲男孩的比例;③分別求出均數(shù)±1S、均數(shù)±196S、均數(shù)±258S范圍內(nèi)12歲男孩人數(shù)占該120名男孩總數(shù)的實(shí)際百分?jǐn)?shù),說明與理論百分?jǐn)?shù)是否接近。,根據(jù)題意,按公式(219)作U變換,,,,,,,身高范圍所占面積,,故估計(jì)該地12男孩身高在135CM以下者約占778%;身高界于135CM~150CM范圍內(nèi)者約占8110%。,,,三、正態(tài)分布的應(yīng)用,㈠制定醫(yī)學(xué)參考值范圍參考值范圍也稱為正常值范圍。醫(yī)學(xué)上常把絕大數(shù)正常人的某指標(biāo)范圍稱為該指標(biāo)的正常值范圍。這里的“絕大多數(shù)”可以是90%、95%、99%,最常用的是95%。㈡質(zhì)量控制常以均數(shù)±2S作為上、下警戒值,以均數(shù)±3S作為上、下控制值。㈢正態(tài)分布是很多統(tǒng)計(jì)方法的理論基礎(chǔ),,,,THEEND,THANKYOUFORLISTENING,本科生用醫(yī)學(xué)統(tǒng)計(jì)學(xué)教案,主講程琮,泰山醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室ZCHENGTSMCEDUCN,THETEACHINGPLANFORMEDICALSTUDENTS,PROFESSORCHENGCONG,DEPTOFPREVENTIVEMEDICINETAISHANMEDICALCOLLEGE,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)?zāi)夸?第五節(jié)均數(shù)的U檢驗(yàn),第二節(jié)T分布,第三節(jié)總體均數(shù)的區(qū)間估計(jì),第四節(jié)假設(shè)檢驗(yàn)的意義和基本步驟,第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,第六節(jié)均數(shù)的T檢驗(yàn),第七節(jié)兩個(gè)方差的齊性檢驗(yàn)和T’檢驗(yàn),第八節(jié)Ⅰ型錯(cuò)誤和Ⅱ型錯(cuò)誤,第九節(jié)應(yīng)用假設(shè)檢驗(yàn)應(yīng)注意的問題,圖示總體與樣本,POPULATIONΜ,SAMPLE2,SAMPLE1,SAMPLE3,SAMPLE4,SAMPLE5,,,,,,一、標(biāo)準(zhǔn)誤的意義及其計(jì)算統(tǒng)計(jì)推斷STATISTICALINFERENCE根據(jù)樣本信息來推論總體特征。均數(shù)的抽樣誤差由抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。標(biāo)準(zhǔn)誤STANDARDERROR反映均數(shù)抽樣誤差大小的指標(biāo)。,第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,,,Σ已知,,,標(biāo)準(zhǔn)誤計(jì)算公式,Σ未知,實(shí)例如某年某市120名12歲健康男孩,已求得均數(shù)為14307CM,標(biāo)準(zhǔn)差為570CM,按公式計(jì)算,則標(biāo)準(zhǔn)誤為,,,1表示抽樣誤差的大小;2進(jìn)行總體均數(shù)的區(qū)間估計(jì);3進(jìn)行均數(shù)的假設(shè)檢驗(yàn)等。,二、標(biāo)準(zhǔn)誤的應(yīng)用,正態(tài)變量X采用U=X-Μ/Σ變換,則一般的正態(tài)分布NΜ,Σ即變換為標(biāo)準(zhǔn)正態(tài)分布N0,1。又因從正態(tài)總體抽取的樣本均數(shù)服從正態(tài)分布NΜ,,同樣可作正態(tài)變量的U變換,即,第二節(jié)T分布一、T分布的概念,,,,,,實(shí)際工作中由于理論的標(biāo)準(zhǔn)誤往往未知,而用樣本的標(biāo)準(zhǔn)誤作為的估計(jì)值,此時(shí)就不是U變換而是T變換了,即下式,,,T分布于1908年由英國統(tǒng)計(jì)學(xué)家WSGOSSET以“STUDENT”筆名發(fā)表,故又稱STUDENTT分布STUDENTS’TDISTRIBUTION。,二、T分布曲線的特征,T分布曲線是單峰分布,以0為中心,左右兩側(cè)對(duì)稱,曲線的中間比標(biāo)準(zhǔn)正態(tài)曲線(U分布曲線)低,兩側(cè)翹得比標(biāo)準(zhǔn)正態(tài)曲線略高。T分布曲線隨自由度Υ而變化,當(dāng)樣本含量越?。▏?yán)格地說是自由度ΥN1越小),T分布與U分布差別越大;當(dāng)逐漸增大時(shí),T分布逐漸逼近于U分布,當(dāng)Υ∞時(shí),T分布就完全成正態(tài)分布。T分布曲線是一簇曲線,而不是一條曲線。T分布下面積分布規(guī)律查T分布表。,,T分布示意圖,T分布曲線下雙側(cè)或單側(cè)尾部合計(jì)面積,我們常把自由度為Υ的T分布曲線下雙側(cè)尾部合計(jì)面積或單側(cè)尾部面積為指定值Α時(shí),則橫軸上相應(yīng)的T界值記為TΑ,Υ。如當(dāng)Υ20,Α005時(shí),記為T005,20;當(dāng)Υ22,Α001時(shí),記為T001,22。對(duì)于TΑ,Υ值,可根據(jù)Α和Υ值,查附表2,T界值表。,T分布是T檢驗(yàn)的理論基礎(chǔ)。由公式(34)可知,│T│值與樣本均數(shù)和總體均數(shù)之差成正比,與標(biāo)準(zhǔn)誤成反比。在T分布中│T│值越大,其兩側(cè)或單側(cè)以外的面積所占曲線下總面積的比重就越小,說明在抽樣中獲得此│T│值以及更大│T│值的機(jī)會(huì)就越小,這種機(jī)會(huì)的大小是用概率P來表示的。│T│值越大,則P值越小;反之,│T│值越小,P值越大。根據(jù)上述的意義,在同一自由度下,│T│≥TΑ,則P≤??;反之,│T│<TΑ,則P>Α。,第三節(jié)總體均數(shù)的區(qū)間估計(jì),參數(shù)估計(jì)用樣本指標(biāo)(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)(參數(shù))稱為參數(shù)估計(jì)。估計(jì)總體均數(shù)的方法有兩種,即點(diǎn)值估計(jì)(POINTESTIMATION)區(qū)間估計(jì)(INTERVALESTIMATION)。,一、點(diǎn)值估計(jì),點(diǎn)值估計(jì)是直接用樣本均數(shù)作為總體均數(shù)的估計(jì)值。此法計(jì)算簡便,但由于存在抽樣誤差,通過樣本均數(shù)不可能準(zhǔn)確地估計(jì)出總體均數(shù)大小,也無法確知總體均數(shù)的可靠程度。,二、區(qū)間估計(jì),區(qū)間估計(jì)是按一定的概率(1?。┕烙?jì)包含總體均數(shù)可能的范圍,該范圍亦稱總體均數(shù)的可信區(qū)間(CONFIDENCEINTERVAL,縮寫為CI)。1Α稱為可信度,常取1Α為095和099,即總體均數(shù)的95可信區(qū)間和99可信區(qū)間。1?。ㄈ?5%)可信區(qū)間的含義是總體均數(shù)被包含在該區(qū)間內(nèi)的可能性是1Α,即(95%),沒有被包含的可能性為Α,即(5%)。,總體均數(shù)的可信區(qū)間的計(jì)算,1未知Σ且N較小N100),可用U檢驗(yàn)。不同的統(tǒng)計(jì)檢驗(yàn)方法,可得到不同的統(tǒng)計(jì)量,如T值和U值。,,4確定概率P值P值是指在H0所規(guī)定的總體中作隨機(jī)抽樣,獲得等于及大于(或小于)現(xiàn)有統(tǒng)計(jì)量的概率。│T│≥TΑ,Υ,則P≤??;│T│Α。,
下載積分: 6 賞幣
上傳時(shí)間:2024-01-06
頁數(shù): 666
大?。?2.44(MB)
子文件數(shù):