醫(yī)學(xué)科研設(shè)計(jì)與統(tǒng)計(jì)學(xué)思維_第1頁(yè)
已閱讀1頁(yè),還剩62頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)學(xué)科研設(shè)計(jì)與統(tǒng)計(jì)學(xué)思維,醫(yī)學(xué)統(tǒng)計(jì)學(xué)要說(shuō)它簡(jiǎn)單吧,其實(shí)也挺簡(jiǎn)單的,常見(jiàn)的統(tǒng)計(jì)方法也就十余種,在教科書上都能找到,只要熟練掌握了,雖不敢夸下??谡f(shuō)可以“以秋風(fēng)掃落葉的氣概橫掃四海之內(nèi)的雜志”,但足以輕車熟路地應(yīng)付一般的科學(xué)研究。要說(shuō)它復(fù)雜吧,也挺復(fù)雜的,毫不夸張地說(shuō),絕大部分國(guó)內(nèi)期刊,甚至在SCI雜志上,亂用統(tǒng)計(jì)學(xué)的現(xiàn)象多如牛毛。很多人在學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)時(shí),都在抱怨自己很難走出“一學(xué)就會(huì),一會(huì)就用,一用就錯(cuò),一錯(cuò)就懵”的怪圈。

2、究其原因,主要是我們?cè)趯W(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)時(shí)都抱著一副“依葫蘆畫瓢”的態(tài)度,試圖“套用統(tǒng)計(jì)學(xué)方法”來(lái)解決自己面臨的問(wèn)題,而不去仔細(xì)思考統(tǒng)計(jì)學(xué)方法的本身的特點(diǎn)。,沒(méi)有設(shè)計(jì)的臨床干預(yù)試驗(yàn) 1685年搶救英國(guó)國(guó)王查理二世(Charles II ,1630-1685): “一品脫(0.568L)血從右臂放出,半品脫血從左肩放出,服下催吐劑、兩付湯藥和一種由15成份的灌腸劑。刮國(guó)王的頭部,直到起一個(gè)大泡。再服打噴嚏的藥粉和更多的催

3、吐劑。繼續(xù)放血,加服止痛劑。把瀝青和鴿子糞混合后敷于腳上。服一種含有10種成份的草藥。最后服人頭蓋骨粉制成的40滴糖漿,外敷牛黃。然后,國(guó)王陛下死了?!?有設(shè)計(jì)的臨床干預(yù)試驗(yàn) 1747年5月20日,英國(guó)的J. Lind醫(yī)生將12名病情相同似的患者帶到一艘船上?;颊叩闹饕Y狀是牙齦潰爛,皮膚有出血點(diǎn),雙膝無(wú)力。Lind將12名患者分為6組,分別給予下列主要干預(yù): A組:每天飲1夸脫(1.136L)蘋

4、果汁; B組:服25滴硫酸丹劑(elixir vitriol),每天3次; C組:服2匙醋,每天3次; D組:每天飲約半品脫海水,服緩和的瀉藥; E組:每天食2個(gè)桔子,一個(gè)檸檬; F組:每天服由大蒜、芥子等成份組成的干藥。 當(dāng)6月16日船返回英國(guó)Plymouth港時(shí),所有患者的病情都有好轉(zhuǎn),其中E組恢復(fù)的最快、最好

5、,其中一人到第6天就可以工作了。B組也有一人比登船時(shí)健康。Lind醫(yī)生的試驗(yàn)并沒(méi)有得出明確的結(jié)論,直到160年后,通過(guò)動(dòng)物實(shí)驗(yàn)才真正從科學(xué)意義上解釋了E組療效最好的真正原因。,J.Lind醫(yī)生的研究有二點(diǎn)符合統(tǒng)計(jì)學(xué)的設(shè)計(jì):1、設(shè)立了對(duì)照(相互對(duì)照);2、質(zhì)量控制(消除了一些混雜)。如果我們今天重復(fù)J.Lind的研究,在統(tǒng)計(jì)設(shè)計(jì)的上還需要做到以下幾點(diǎn):1、研究對(duì)象的定義與納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn)2、足夠多的觀察對(duì)象3、效應(yīng)指標(biāo)的選

6、擇4、結(jié)論是否能外推,統(tǒng)計(jì)學(xué)方法用于干預(yù)試驗(yàn) 1835年,法國(guó)醫(yī)生P.C.A. Louis 對(duì)當(dāng)時(shí)流行的“放血”療法治療肺炎的效果進(jìn)行了比較,發(fā)現(xiàn)“放血”的療效不象預(yù)期的那么好,而且早期“放血”和晚期“放血”組比較,患者的診斷、病情、病程、年齡等方面的差異很大,比較平均治愈時(shí)間意義不大。因?yàn)橥砥凇胺叛苯M的平均治愈時(shí)間長(zhǎng),但該組患者病情重、病程長(zhǎng)、年齡大。 Louis對(duì)醫(yī)學(xué)研究的方法學(xué)作出了很大貢獻(xiàn):

7、 (1)用數(shù)字的方法表示不同疾病患者的特征和預(yù)后; (2)提出了臨床療效對(duì)比的前瞻性原則; (3)提出抽樣誤差和混雜(confounding)概念。其中前瞻性研究和減少混雜,分別成為當(dāng)今臨床試驗(yàn)和流行病學(xué)研究的基本研究方法; (4)在J. Gavarret 的協(xié)助下,Louis的數(shù)字方法發(fā)展為“概率框架”,Gavarret也于1840年在巴黎出版了世界第一部醫(yī)學(xué)統(tǒng)計(jì)學(xué)教科書。,“非常痛心地看到,因?yàn)?/p>

8、數(shù)據(jù)分析的缺陷和錯(cuò)誤,那么多好的生物研究工作面臨著被葬送的危險(xiǎn)” F. Yates,M.J.R. Healy,醫(yī)學(xué)論文中的統(tǒng)計(jì)問(wèn)題 統(tǒng)計(jì)知識(shí)的運(yùn)用 撰寫論文:報(bào)告自己觀察或?qū)嶒?yàn)的研究結(jié)果 閱讀論文:吸收新知識(shí),了解學(xué)術(shù)進(jìn)展 1996年,對(duì)申報(bào)科技成果的4586篇科研論文分析,統(tǒng)計(jì)方法使用率為76%。 醫(yī)學(xué)論文中統(tǒng)計(jì)運(yùn)用

9、錯(cuò)誤,除了影響論文的科學(xué)性,還可能導(dǎo)致嚴(yán)重的倫理學(xué)問(wèn)題。,“調(diào)查結(jié)果反映了醫(yī)學(xué)論文作者統(tǒng)計(jì)知識(shí)和統(tǒng)計(jì)水平的低下,也再次強(qiáng)調(diào)了生物統(tǒng)計(jì)學(xué)者不是令人生畏的檢查官。恰恰相反,生物統(tǒng)計(jì)學(xué)者是我們的可貴盟友。生物統(tǒng)計(jì)學(xué)不是遠(yuǎn)離我們的數(shù)學(xué),而是現(xiàn)代醫(yī)學(xué)的一門基本學(xué)科,就像大廈中的一個(gè)支柱” ---JAMA的編輯部,60年代到80年代,國(guó)外醫(yī)學(xué)雜志調(diào)查結(jié)果:有統(tǒng)計(jì)錯(cuò)誤的論文20%~72%。1984年對(duì)《中華醫(yī)學(xué)雜志》、《中華內(nèi)科雜志》、《中華外科雜

10、志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文的調(diào)查結(jié)果: 相對(duì)數(shù)誤用為11.2% 抽樣方法誤用15.9% 統(tǒng)計(jì)圖表誤用11.7%1996年對(duì)4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會(huì)系列雜志占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。,科學(xué)容不得半點(diǎn)虛假,造假者一旦

11、被揭露就背上了永遠(yuǎn)洗脫不掉的恥辱 。,偽造統(tǒng)計(jì)數(shù)據(jù)違反科學(xué)道德 據(jù)1976年New Science 雜志關(guān)于科研舞弊行為的調(diào)查74%的調(diào)查表反映有不正當(dāng)修改數(shù)據(jù)的情況,其中,17%拼湊實(shí)驗(yàn)結(jié)果,7%憑空捏造數(shù)據(jù),2%故意曲解結(jié)果。 就統(tǒng)計(jì)學(xué)本身來(lái)說(shuō),正確實(shí)驗(yàn)設(shè)計(jì)得出的統(tǒng)計(jì)結(jié)果,是用P值作為“重現(xiàn)性”的概率保證。P<0.05,就是說(shuō)實(shí)驗(yàn)結(jié)果顯示的差別是機(jī)遇所致的可能性不足5%,或者說(shuō),別人在同樣的條

12、件下重復(fù)同樣的試驗(yàn),得出相反結(jié)論的可能性不足5%。,統(tǒng)計(jì)推斷,統(tǒng)計(jì)推斷 statistical inference,如:樣本均數(shù) 樣本標(biāo)準(zhǔn)差S 樣本率 P,如:總體均數(shù) 總體標(biāo)準(zhǔn)差 總體率,內(nèi)容:參數(shù)估計(jì)(estimation of parameters) 包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2. 假設(shè)檢驗(yàn)(test of hypothesis),統(tǒng)計(jì)推斷,抽

13、樣誤差,如:樣本均數(shù) 樣本標(biāo)準(zhǔn)差S 樣本率 P,如:總體均數(shù) 總體標(biāo)準(zhǔn)差 總體率,,抽樣誤差 (sampling error) :由于個(gè)體差異導(dǎo)致的樣本統(tǒng)計(jì)量與總體參數(shù)間的差別。,統(tǒng)計(jì)的結(jié)論是推斷而不是證明,正確的統(tǒng)計(jì)結(jié)論必須建立在科學(xué)的設(shè)計(jì)和合適的統(tǒng)計(jì)方法上,否則得到是不恰當(dāng)或是錯(cuò)誤的結(jié)論。 1、收集數(shù)據(jù)的方法(研究假說(shuō)、調(diào)查或?qū)嶒?yàn)設(shè)計(jì)、誤

14、 差和偏倚的控制等) 2、分析數(shù)據(jù)的方法(變量的類型、數(shù)據(jù)的分布、研究 目的和因素等) 3、結(jié)論的外推(統(tǒng)計(jì)結(jié)論是否適合所有研究對(duì)象),1. 采用統(tǒng)計(jì)學(xué)方法,發(fā)現(xiàn)不確定現(xiàn)象背后隱藏的規(guī)律。 變異(variation)是社會(huì)和生物醫(yī)學(xué)中的普遍現(xiàn)象。 變異使得實(shí)驗(yàn)或觀察的結(jié)果具有不確定性,如每個(gè)人的身高、體重、血壓等各有不同。,一、為什么要學(xué)統(tǒng)計(jì)學(xué)?,,最大值=6.18, 最小值=3.2

15、9, 極差=2.89。 算術(shù)均數(shù)=4.72,標(biāo)準(zhǔn)差=0.57。,案例一:兩個(gè)指標(biāo)診斷疾病的問(wèn)題路人甲做了一個(gè)研究,旨在比較兩個(gè)指標(biāo)(A和B)對(duì)肝癌的診斷價(jià)值。路人甲以A和B的參考范圍上限作為診斷界值,得出了A和B在該界值下對(duì)應(yīng)的診斷敏感性和特異性。結(jié)果表明,A的診斷敏感性為0.80,特異性為0.90;B的診斷敏感性為0.85,特異性為0.87。路人甲很快撰寫論文報(bào)道了自己的研究成果,指出B診斷肝癌的敏感性高于A,而特異性低于A。&#

16、160;路人乙是這篇文章的審稿人,當(dāng)他看見(jiàn)這個(gè)結(jié)論后,毫不猶豫地在審稿意見(jiàn)中寫道:就敏感性而言,B高于A;就特異性而言,A高于B。診斷敏感性和特異性與所采用的界值密切相關(guān),作者得出的敏感性和特異性僅僅代表了一個(gè)診斷界點(diǎn)下面的診斷效能,無(wú)法從全局上反映A和B的診斷價(jià)值。文章的結(jié)論到底是想說(shuō)明A優(yōu)秀還是B優(yōu)秀呢Reject!這個(gè)例子說(shuō)明:統(tǒng)計(jì)指標(biāo)選錯(cuò)了,統(tǒng)計(jì)出來(lái)的東西往往難以“自圓其說(shuō)”。,稿件被退了,路人甲有些許郁悶。經(jīng)過(guò)認(rèn)真學(xué)習(xí)科研

17、設(shè)計(jì)與統(tǒng)計(jì)學(xué)知識(shí)后,路人甲終于明白了一個(gè)問(wèn)題:兩個(gè)指標(biāo)診斷性能的比較是不能比較敏感性和特異性的,而應(yīng)該比較ROC的曲線下面積,因?yàn)榍€下面積才是衡量整體診斷效率的最佳指標(biāo)。路人甲很快繪制了ROC曲線,統(tǒng)計(jì)結(jié)果表明,A的曲線下面積為0.80,B的曲線下面積為0.82。路人甲欣喜若狂,趕緊動(dòng)筆寫論文,并且理直氣壯地給文章定了一個(gè)結(jié)論:B的診斷效率是優(yōu)于A的,其理由就是因?yàn)锽的曲線下面積大于A。 路人丙是這篇文章的審稿人,當(dāng)他看見(jiàn)

18、這個(gè)結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見(jiàn)中寫道:從表面上看,B的曲線下面積高于A,但是導(dǎo)致這種差異的原因有兩種,一種是隨機(jī)誤差,一種是試驗(yàn)效應(yīng),即B確實(shí)是高于A的。你怎么能確定這不是抽樣誤差呢?在統(tǒng)計(jì)學(xué)上,要確定0.82是否高于0.80,就一定要經(jīng)過(guò)統(tǒng)計(jì)學(xué)檢驗(yàn)的。又Reject! 這個(gè)例子說(shuō)明:在醫(yī)學(xué)科研中,沒(méi)有經(jīng)過(guò)統(tǒng)計(jì)學(xué)檢驗(yàn)的結(jié)論雜志社多半認(rèn)為是不科學(xué)的。,稿件又被退了,路人甲很是郁悶。他吸取了經(jīng)驗(yàn)教訓(xùn),自學(xué)了很多統(tǒng)計(jì)

19、學(xué)理論,終于弄清楚了采用何種方法去比較曲線下面積。接下來(lái)的事情就是改稿,然后另選雜志繼續(xù)投稿。路人甲在文稿中特別注明了,曲線下面積是經(jīng)過(guò)了統(tǒng)計(jì)學(xué)檢驗(yàn)的,B的曲線下面積(0.82)與A的曲線下面積(0.80)之間的差異是有統(tǒng)計(jì)學(xué)意義的,而且還大搖大擺地在后面加了個(gè)括號(hào),寫明P=0.01。路人甲仰天長(zhǎng)嘆了一口氣,很鄭重地給自己的研究下了結(jié)論:本研究表明B的診斷效率是優(yōu)于A的。 路人丁是這篇文章的審稿人,當(dāng)他看見(jiàn)這個(gè)結(jié)論后,臉色鐵

20、青,毫不猶豫地在審稿意見(jiàn)寫道:B是常見(jiàn)的診斷指標(biāo),其檢測(cè)結(jié)果并不對(duì)臨床醫(yī)師設(shè)盲,在很大程度上可以檢測(cè)影響臨床醫(yī)師對(duì)疾病的診斷。A是新進(jìn)發(fā)現(xiàn)的診斷指標(biāo),其結(jié)果完全對(duì)臨床醫(yī)師設(shè)盲,不可能影響醫(yī)生的診斷。所以作者的結(jié)論(B比A優(yōu)秀)是不可靠的。再說(shuō)得通俗點(diǎn),如果把A和B分別理解成法庭上的原稿和被告,那B無(wú)疑既充當(dāng)了辯護(hù)律師,又充當(dāng)了法官的角色。在這種情況下,A輸?shù)袅斯偎臼鞘终5摹H绻麚Q一個(gè)公平的、獨(dú)立的法官來(lái)斷案,B能否勝出就不好說(shuō)了。再

21、一次Reject! 這個(gè)例子說(shuō)明:實(shí)(試)驗(yàn)設(shè)計(jì)有缺陷,即便是統(tǒng)計(jì)學(xué)方法準(zhǔn)確也于事無(wú)補(bǔ)。,稿件又一次被退了,路人甲的心情極度郁悶。思來(lái)想去,決定把實(shí)驗(yàn)重做一遍,讓A和B在一個(gè)公平的環(huán)境中比較(為便于描述,此處忽略醫(yī)學(xué)倫理學(xué)問(wèn)題)。在新開(kāi)展的研究中,A和B都是對(duì)臨床醫(yī)生設(shè)盲的,不可能影響金標(biāo)準(zhǔn)。這下A和B的比較結(jié)果應(yīng)該比較可靠了吧,路人甲又仰天長(zhǎng)嘆了一口氣,感覺(jué)自己如釋重負(fù)了??蒲刑垓v人了,太不容易了!統(tǒng)計(jì)結(jié)果很快出來(lái),A的

22、曲線下面積是0.80,B的曲線下面積則變成了0.77,經(jīng)過(guò)統(tǒng)計(jì)學(xué)檢驗(yàn)后發(fā)現(xiàn),A的診斷效能確實(shí)是高于B的。整個(gè)研究的試驗(yàn)設(shè)計(jì)滴水不漏,統(tǒng)計(jì)學(xué)過(guò)程天衣無(wú)縫,我就不信還有人敢拒這篇稿件,路人甲心中開(kāi)始暗喜。,路人戊是這篇文章的審稿人,當(dāng)他看見(jiàn)這個(gè)結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見(jiàn)寫道:A和B的檢測(cè)并不矛盾,他們之間的關(guān)系不應(yīng)該是競(jìng)爭(zhēng)關(guān)系,而應(yīng)該是合作關(guān)系。讀者最關(guān)心的問(wèn)題顯然不是A和B“孰強(qiáng)孰弱”的問(wèn)題,雖然這個(gè)問(wèn)題有一定的專業(yè)價(jià)值。如果

23、我是坐診醫(yī)生,我會(huì)說(shuō):A和B誰(shuí)強(qiáng)誰(shuí)弱關(guān)我什么事?總之來(lái)一個(gè)病人我就A和B都檢測(cè),我的患者都不差錢!作者的研究重點(diǎn)應(yīng)該是明確A和B能否互補(bǔ),聯(lián)合使用是否能有助于提高診斷準(zhǔn)確性的問(wèn)題,而非A和B“孰強(qiáng)孰弱”的問(wèn)題。簡(jiǎn)單地說(shuō),就是明確1+1是否大于1的問(wèn)題。還是被Reject!(作者吐血),這個(gè)例子說(shuō)明:研究方向錯(cuò)了,即使是無(wú)懈可擊的實(shí)(試)驗(yàn)設(shè)計(jì)和天衣無(wú)縫的統(tǒng)計(jì)方法,也是無(wú)濟(jì)于事。,這四個(gè)例子說(shuō)明:醫(yī)學(xué)科研是很痛苦的,不重視統(tǒng)計(jì)學(xué)和科研設(shè)計(jì)

24、,會(huì)走很多彎路的。,2. 用統(tǒng)計(jì)學(xué)思維方式考慮有關(guān)醫(yī)學(xué)研究中的問(wèn)題 “陽(yáng)性”結(jié)果是否是虛假聯(lián)系? 某感冒藥治療1周后,治愈率為90%,能否說(shuō)該感冒藥十分有效? 以前的許多研究表明,血清甘油三酯的含量與冠心病危險(xiǎn)性有關(guān),即甘油三酯的含量越高,患冠心病的危險(xiǎn)性就越大。有的醫(yī)生以此篩選危險(xiǎn)人群?,冠心病,甘油三酯,膽固醇+ 高密度脂蛋白,,,,,,,虛假聯(lián)系,案例二,如何看待統(tǒng)計(jì)學(xué)結(jié)果路人甲經(jīng)歷數(shù)十年的

25、研究,動(dòng)用了各種高精尖的研究手段,發(fā)現(xiàn)了一個(gè)新的蛋白(命名為蛋白A)。在肝癌患者中展開(kāi)的研究表明,蛋白A和甲胎蛋白(AFP)有很好的相關(guān)性,其相關(guān)程度之好,幾乎可以用“一塌糊涂”來(lái)形容,相關(guān)系數(shù)達(dá)到了0.99(P<0.0001)。路人甲欣喜若狂,盡管蛋白A的檢測(cè)過(guò)程還十分繁瑣,檢測(cè)費(fèi)用還十分高,但是路人甲還是把持不住內(nèi)心的激動(dòng),日夜兼程地撰寫論文,宣稱自己找到了一個(gè)新的肝癌標(biāo)志物。 路人乙是這篇文章的審稿人,當(dāng)他看見(jiàn)這

26、個(gè)結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見(jiàn)寫道:統(tǒng)計(jì)結(jié)果表明蛋白A和AFP的相關(guān)性十分明顯。如果是這樣,在臨床實(shí)踐中,通過(guò)檢測(cè)AFP完全就可以得知蛋白A的濃度了,蛋白A在肝癌中的臨床價(jià)值完全可以被AFP代替,還不說(shuō)蛋白A的檢測(cè)過(guò)程繁瑣,費(fèi)用太高的問(wèn)題,你說(shuō)蛋白A還有什么價(jià)值? Reject!,這個(gè)例子說(shuō)明:統(tǒng)計(jì)學(xué)陽(yáng)性的結(jié)果未必是“好結(jié)果”。,,如:當(dāng)專業(yè)上有一定聯(lián)系的兩個(gè)變量之間的變化呈“S型”或“倒S型”曲線趨勢(shì)時(shí),若錯(cuò)誤地用直線方程去

27、描述,從統(tǒng)計(jì)學(xué)角度看效果也很好,但在專業(yè)上是解釋不通的。再比如,某兩個(gè)統(tǒng)計(jì)量(如均值、率等)之間的差別在統(tǒng)計(jì)學(xué)上有顯著性意義,有時(shí)在專業(yè)上并無(wú)實(shí)用價(jià)值。如某種新的降壓藥,平均降低血壓 2 mmHg,若樣本含量較大,誤差又較小,統(tǒng)計(jì)檢驗(yàn)可能會(huì)得到“P<0.05”的結(jié)果,但在臨床上卻認(rèn)為此新藥的療效沒(méi)有多大提高。另外,在運(yùn)用統(tǒng)計(jì)學(xué)中,稍有不慎都可能犯這樣或那樣的錯(cuò)誤。因此,統(tǒng)計(jì)結(jié)論的可靠性仍需通過(guò)實(shí)踐去檢驗(yàn)。所以,應(yīng)當(dāng)牢記:運(yùn)用統(tǒng)計(jì)學(xué)時(shí)

28、必須結(jié)合醫(yī)學(xué)實(shí)際,才能真正發(fā)揮統(tǒng)計(jì)學(xué)應(yīng)有的作用。,有統(tǒng)計(jì)學(xué)(差異)意義,并不代表有生物學(xué)、臨床意義,案例三,降糖藥的研究、學(xué)生自殺事件某醫(yī)生長(zhǎng)期從事降糖藥的研究,最近他發(fā)現(xiàn)了一種藥物,可以降低患者的血糖。為了評(píng)價(jià)該藥的降糖效果,路人甲費(fèi)盡心機(jī)地設(shè)計(jì)了一個(gè)看似完美的隨機(jī)對(duì)照試驗(yàn)(RCT),為了保證結(jié)果可靠,路人甲嚴(yán)格遵守RCT設(shè)計(jì)準(zhǔn)則,包括隨機(jī)、雙盲、安慰劑對(duì)照等措施。研究結(jié)果表明,實(shí)驗(yàn)組和對(duì)照組在接受藥物治療前血糖濃度的均值都是10m

29、mol/L,差異無(wú)統(tǒng)計(jì)學(xué)意義,表明兩組研究對(duì)象的基線特征具有可比性。對(duì)照組未經(jīng)任何藥物治療(為便于描述,此處忽略醫(yī)學(xué)倫理學(xué)問(wèn)題),血糖濃度還是10mmol/L;實(shí)驗(yàn)組經(jīng)過(guò)藥物干預(yù)后,血糖濃度變成了9mmol/L,統(tǒng)計(jì)學(xué)檢驗(yàn)結(jié)果表明,實(shí)驗(yàn)組和對(duì)照組治療后的血糖濃度的差異是有統(tǒng)計(jì)學(xué)意義的(P<0.01)。路人甲趕緊撰寫論文,并毫不客氣地給研究下了個(gè)結(jié)論:該藥可以降低患者血糖。,路人乙是這篇文章的審稿人,當(dāng)他看見(jiàn)這個(gè)結(jié)論后,臉色鐵青,毫

30、不猶豫地在審稿意見(jiàn)寫道:卻要確實(shí)可以降低血糖,但是一個(gè)只能降低1mmol/L的降糖藥有何臨床價(jià)值?Reject! 這個(gè)例子說(shuō)明:有統(tǒng)計(jì)學(xué)意義不一定有專業(yè)意義。,某CDC做了一個(gè)調(diào)查,同處一地的A和B兩所中學(xué),各有1000名學(xué)生,過(guò)去的一年,A校有5名學(xué)生自殺(自殺率為0.5%),B校沒(méi)有學(xué)生自殺(自殺率為0%)。統(tǒng)計(jì)學(xué)結(jié)果表明,兩校自殺率的差異無(wú)統(tǒng)計(jì)學(xué)意義(P=0.07,F(xiàn)isher確切概率法)。于是寫論文得出結(jié)論:A和B

31、兩校的自殺率是沒(méi)有統(tǒng)計(jì)學(xué)上的差異,A校5名學(xué)生自殺純屬小概率事件。路人乙是這篇文章的審稿人,當(dāng)他看見(jiàn)這個(gè)結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見(jiàn)寫道:5個(gè)鮮活的生命就這樣沒(méi)有了,5個(gè)家庭就這樣毀了,你卻告訴我這純屬小概率事件,你就不怕“人神共憤”嗎?Reject! 這個(gè)故事說(shuō)明:有專業(yè)意義不一定有統(tǒng)計(jì)學(xué)意義。,這兩個(gè)故事說(shuō)明:統(tǒng)計(jì)學(xué)只是方法學(xué),醫(yī)學(xué)科研中需要借助統(tǒng)計(jì)學(xué)方法來(lái)發(fā)現(xiàn)事物的規(guī)律性,但不能死磕統(tǒng)計(jì)。,例:某醫(yī)生用一種

32、新的治療某病的療法(簡(jiǎn)稱治療組),用現(xiàn)在公認(rèn)的療法作為對(duì)照(簡(jiǎn)稱對(duì)照組),經(jīng)臨床試驗(yàn),對(duì)照組和治療組的療效分別為P1=75%與P2=95%。問(wèn):能認(rèn)為這兩個(gè)有效率之間的差別有顯著性意義嗎?答:這兩個(gè)有效率之間的差別可能有統(tǒng)計(jì)學(xué)意義,也可能沒(méi)有統(tǒng)計(jì)學(xué)意義。因?yàn)槠浣Y(jié)論不僅取決于二者之差的絕對(duì)值大小,更主要的是取決于隨機(jī)誤差的大小和樣本大小,千萬(wàn)不可輕率地作出統(tǒng)計(jì)推斷。現(xiàn)假定這兩個(gè)有效率分別來(lái)自下列甲、乙、丙三批實(shí)驗(yàn)的結(jié)果,則具有下列3種不同

33、的統(tǒng)計(jì)檢驗(yàn)結(jié)果。,“陰性”結(jié)果是否是樣本含量不足? 有人曾對(duì)發(fā)表在Lancet, N Engl J Med,JAMA等著名醫(yī)學(xué)雜志上的71篇陰性結(jié)果的論文作過(guò)分析,發(fā)現(xiàn)其中有62篇( 93%)可能是由于樣本含量不足造成的假陰性。,表1、兩個(gè)有效率的比較,甲實(shí)驗(yàn)中,P1與P2之間的差別無(wú)統(tǒng)計(jì)學(xué)意義(校正χ2 =1.765,P>0.05)乙實(shí)驗(yàn)中,P1與P2之間的差別有統(tǒng)計(jì)學(xué)意義(χ2=6.275,0.01<P<0.

34、05);丙實(shí)驗(yàn)中,P1與P2之間的差別也有統(tǒng)計(jì)學(xué)意義(χ2=9.412,P<0.01)。,案例四:路人甲發(fā)明了兩套診斷肺癌的方案,分別命名為A和B。為了明確這兩種方到底誰(shuí)“更勝一籌”,路人甲找了100個(gè)肺癌患者和100個(gè)疑似肺癌患者(結(jié)核、肺炎等),分別用A、B兩套方案去進(jìn)行鑒別診斷。在200個(gè)研究對(duì)象中(100個(gè)肺癌和100個(gè)非肺癌),方案A正確了100例,準(zhǔn)確率50%,方案B僅僅正確了50例,準(zhǔn)確率僅為25%。卡方檢驗(yàn)結(jié)果:方案A

35、和B準(zhǔn)確率之間的差異有統(tǒng)計(jì)學(xué)意義(P<0.01)。很明顯,方案A的準(zhǔn)確性要高于方案B。路人甲趕緊發(fā)表論文,指出:方案A診斷肺癌的準(zhǔn)確性優(yōu)于方案B。路人乙是這篇文章的審稿人,當(dāng)他看見(jiàn)這個(gè)結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見(jiàn)寫道:如果我(審稿人本人)是坐診醫(yī)生,他就會(huì)反著看方案B的結(jié)果,凡是方案B認(rèn)為是肺癌的,他就認(rèn)為病人不是肺癌;反之亦然。這樣下來(lái),200個(gè)病人中,方案B應(yīng)該能正確識(shí)別150個(gè)人,準(zhǔn)確率為75%,統(tǒng)計(jì)學(xué)結(jié)果表明,

36、方案B的準(zhǔn)確率(75%)是高于方案A(50%)的,所以真實(shí)的情況是方案B優(yōu)于方案A。實(shí)際上,當(dāng)面對(duì)這200名患者的時(shí)候,隨便到城隍廟找個(gè)瞎子來(lái)“算命(猜患者是否患病)”,按照統(tǒng)計(jì)學(xué)理論,準(zhǔn)確率也應(yīng)該是50%,方案A的價(jià)值可以說(shuō)是“一無(wú)是處”。Reject!,這個(gè)例子說(shuō)明:統(tǒng)計(jì)學(xué)陰性的結(jié)果未必是“壞結(jié)果”。,3. 保證你的研究論文能通過(guò)統(tǒng)計(jì)學(xué)審查 據(jù)國(guó)外60~80年代對(duì)不同醫(yī)學(xué)雜志發(fā)表論文的調(diào)查,有統(tǒng)計(jì)錯(cuò)誤的論文的百分比最高

37、達(dá)72%,最低也有20%。 國(guó)內(nèi)1984年對(duì)《中華醫(yī)學(xué)雜志》、《中華內(nèi)科雜志》、《中華外科雜志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文的調(diào)查結(jié)果,相對(duì)數(shù)誤用為11.2%,抽樣方法誤用15.9%,統(tǒng)計(jì)圖表誤用11.7%。某研究者1996年對(duì)4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會(huì)系列雜志僅占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。,JAMA,新英格蘭醫(yī)學(xué)雜志(NEJM)、英國(guó)醫(yī)學(xué)雜志、中華醫(yī)學(xué)會(huì)雜志對(duì)來(lái)稿都有統(tǒng)計(jì)學(xué)要求

38、或統(tǒng)計(jì)學(xué)指導(dǎo)。 國(guó)際生物醫(yī)學(xué)雜志編輯協(xié)會(huì)在其《生物醫(yī)學(xué)期刊投稿的統(tǒng)一要求》中也包含了統(tǒng)計(jì)學(xué)要求。 Uniform Requirements for Manuscripts Submitted to Biomedical Journals http:// www.acponline.org,《中華醫(yī)學(xué)雜志》對(duì)來(lái)稿中統(tǒng)計(jì)學(xué)處理的有關(guān)要求1.統(tǒng)計(jì)研究設(shè)計(jì):應(yīng)交代統(tǒng)計(jì)研究設(shè)計(jì)的名稱和主要做法

39、。如調(diào)查設(shè)計(jì)(分為前瞻性、回顧性或橫斷面調(diào)查研究);實(shí)驗(yàn)設(shè)計(jì)(應(yīng)交代具體的設(shè)計(jì)類型,如自身配對(duì)設(shè)計(jì)、成組設(shè)計(jì)、交叉設(shè)計(jì)、析因設(shè)計(jì)、正交設(shè)計(jì)等);臨床試驗(yàn)設(shè)計(jì)(應(yīng)交代屬于第幾期臨床試驗(yàn),采用了何種盲法措施等)。主要做法應(yīng)圍繞4個(gè)基本原則(隨機(jī)、對(duì)照、重復(fù)、均衡)概要說(shuō)明,尤其要交代如何控制重要非試驗(yàn)因素的干擾和影響。2.資料的表達(dá)與描述:用x 和s表達(dá)近似服從正態(tài)分布的定量資料,用M(Q )表達(dá)呈偏態(tài)分布的定量資料;用統(tǒng)計(jì)表時(shí),要合理安

40、排縱橫標(biāo)目,并將數(shù)據(jù)的含義表達(dá)清楚;用統(tǒng)計(jì)圖時(shí),所用統(tǒng)計(jì)圖的類型應(yīng)與資料性質(zhì)相匹配,并使數(shù)軸上刻度值的標(biāo)法符合數(shù)學(xué)原則;用相對(duì)數(shù)時(shí),分母不宜小于2O,要注意區(qū)分百分率與百分比。3.統(tǒng)計(jì)分析方法的選擇:對(duì)于定量資料,應(yīng)根據(jù)所采用的設(shè)計(jì)類型、資料所具備的條件和分析目的,選用合適的統(tǒng)計(jì)分析方法,不應(yīng)盲目套用t檢驗(yàn)和單因素方差分析;對(duì)于定性資料,應(yīng)根據(jù)所采用的設(shè)計(jì)類型、定性變量的性質(zhì)和頻數(shù)所具備的條件以及分析目的,選用合適的統(tǒng)計(jì)分析方法,不應(yīng)

41、盲目套用χ2 檢驗(yàn)。對(duì)于回歸分析,應(yīng)結(jié)合專業(yè)知識(shí)和散布圖,選用合適的回歸類型,不應(yīng)盲目套用簡(jiǎn)單直線回歸分析,對(duì)具有重復(fù)實(shí)驗(yàn)數(shù)據(jù)的回歸分析資料,不應(yīng)簡(jiǎn)單化處理;對(duì)于多因素、多指標(biāo)資料,要在一元分析的基礎(chǔ)上,盡可能運(yùn)用多元統(tǒng)計(jì)分析方法,以便對(duì)因素之間的交互作用和多指標(biāo)之間的內(nèi)在聯(lián)系進(jìn)行全面、合理的解釋和評(píng)價(jià)。4.統(tǒng)計(jì)結(jié)果的解釋和表達(dá):當(dāng)P<0.05(或P<0.01)時(shí),應(yīng)說(shuō)明對(duì)比組之間的差異有統(tǒng)計(jì)學(xué)意義,而不應(yīng)說(shuō)對(duì)比組之間具有

42、顯著性(或非常顯著性)的差別;應(yīng)寫明所用統(tǒng)計(jì)分析方法的具體名稱(如:成組設(shè)計(jì)資料的t檢驗(yàn)、兩因素析因設(shè)計(jì)資料的方差分析、多個(gè)均數(shù)之間兩兩比較的q檢驗(yàn)等),統(tǒng)計(jì)量的具體值(如t=3.45,X2=4.68,F(xiàn)=6.79等)應(yīng)盡可能給出具體的P值(如P=0.0238);當(dāng)涉及到總體參數(shù)(如總體均數(shù) 總體率等)時(shí),在給出顯著性檢驗(yàn)結(jié)果的同時(shí),再給出95%置信區(qū)間。,還是那個(gè)AFP與蛋白A的例子。路人甲發(fā)現(xiàn)蛋白A和甲胎蛋白(AFP)之間有很好的相

43、關(guān)性,也開(kāi)始撰寫論文,但是他的結(jié)論并不是“蛋白A是診斷肝癌的標(biāo)記物”。他認(rèn)為,既然蛋白A與AFP之間有很強(qiáng)的相關(guān)性,那提示AFP和蛋白A之間可能存在十分密切的“調(diào)節(jié)”或者“被調(diào)節(jié)”關(guān)系。最終,路人甲圍繞“蛋白A與AFP之間的調(diào)節(jié)或者被調(diào)節(jié)關(guān)系”做了很多分子生物學(xué)試驗(yàn),指出蛋白A是調(diào)節(jié)AFP表達(dá)的唯一(注意“唯一”這兩個(gè)字)因子,因此二者之間才會(huì)呈現(xiàn)如此強(qiáng)烈的相關(guān)性。這是一項(xiàng)基礎(chǔ)研究,雖然未能直截了當(dāng)?shù)氐刂赋龅鞍譇的臨床價(jià)值,但是這個(gè)研究

44、形象生動(dòng)地講述了一個(gè)完整的分子生物學(xué)事件,豐富了我們對(duì)于肝癌發(fā)生與發(fā)展分子機(jī)制的認(rèn)識(shí)。最終,論文“堂而皇之”地accept了。 這個(gè)例子說(shuō)明:同一統(tǒng)計(jì)學(xué)結(jié)果,從不同的專業(yè)角度去解釋,結(jié)論是完全不同的。以上所有案例說(shuō)明:對(duì)統(tǒng)計(jì)學(xué)結(jié)果的解讀一定要結(jié)合專業(yè)!從專業(yè)中來(lái),到專業(yè)中去!,4. 獲得循證醫(yī)學(xué)證據(jù)的主要手段“良好愿望的醫(yī)學(xué)”(well-meaning medicine)轉(zhuǎn)入“以證據(jù)為基礎(chǔ)的醫(yī)學(xué)” (evidence

45、-based medicine,EBM)需要有統(tǒng)計(jì)學(xué)方法的支持。 全世界的醫(yī)學(xué)期刊每年大約刊登600萬(wàn)學(xué)術(shù)論文,但能作為可靠“證據(jù)”的論文并不多。,二、 醫(yī)學(xué)科研的基本要素,醫(yī)學(xué)科研由三個(gè)基本部分組成,即處理因素(study factor)、受試對(duì)象(study object)和實(shí)驗(yàn)效應(yīng)(experimental effect)。例如,觀察流甲丙脯酸對(duì)腎性高血壓患者的療效。其中,疏甲丙脯酸為處理因素,腎性高血壓患者為受試對(duì)象,

46、動(dòng)脈壓變化為試驗(yàn)效應(yīng)。通常將這三個(gè)組成部分稱為醫(yī)學(xué)科研的基本要素。如何正確選擇三個(gè)要素,是科研設(shè)計(jì)的關(guān)鍵問(wèn)題。,Study factor,,Study object,,Experimental effect,,,,1、醫(yī)學(xué)研究設(shè)計(jì)的基本原理:,降壓藥,高血壓病人,血壓值,,,T,,,s,e,T+S=e,基本模式:,T+s1=e1=20mmHg,O+s2=e2=5mmHg,,T-O=e1-e2=20-5,T,,e=15mmHg,,,處

47、理因素的作用被單獨(dú)的顯示,統(tǒng)計(jì)分析的思維: 在排除或控制了一些可能影響實(shí)驗(yàn)效應(yīng)的因素后,以概率為基礎(chǔ)計(jì)算其差異是否為隨機(jī)誤差(偶然性結(jié)果),從而推斷處理因素(或暴露)的效應(yīng)是否不為零。,,,,處理效應(yīng),(暴露),(目標(biāo)人群),(發(fā)病風(fēng)險(xiǎn)),,,處理組:,對(duì)照組:,研究假說(shuō):處理效應(yīng)不為零統(tǒng)計(jì)假設(shè):處理效應(yīng)為零,醫(yī)學(xué)科研類型由于不同的科研目的,有多種不同的分類方法。如,按科技活動(dòng)類型分為基礎(chǔ)研究、應(yīng)用研究和開(kāi)發(fā)研

48、究(發(fā)展研究);按照醫(yī)學(xué)中各專業(yè)的屬性,可分為:基礎(chǔ)醫(yī)學(xué)科研、臨床醫(yī)學(xué)科研、預(yù)防醫(yī)學(xué)科研、社會(huì)醫(yī)學(xué)科研(包括衛(wèi)生事業(yè)管理學(xué)研究和醫(yī)學(xué)心理學(xué)科)。 一般來(lái)說(shuō),醫(yī)學(xué)科研的分類,常按設(shè)計(jì)類型的不同,分為以下幾種基本類型。(圖1-1),2 、 醫(yī)學(xué)研究設(shè)計(jì)的4個(gè)基本原則,重復(fù)、隨機(jī)、對(duì)照、均衡是實(shí)驗(yàn)設(shè)計(jì)的4個(gè)基本原則,在實(shí)驗(yàn)設(shè)計(jì)中務(wù)必要嚴(yán)格遵守。否則,實(shí)驗(yàn)研究結(jié)果的可靠性將大受影響。所謂重復(fù),就是實(shí)驗(yàn)因素各水平組合下要有足夠的樣本含量。

49、因?yàn)榻y(tǒng)計(jì)學(xué)研究的是隨機(jī)現(xiàn)象的變化規(guī)律性,重復(fù)次數(shù)少,內(nèi)在規(guī)律表現(xiàn)不出來(lái)。在統(tǒng)計(jì)學(xué)上可根據(jù)設(shè)計(jì)類型選用相應(yīng)的樣本含量估算公式進(jìn)行計(jì)算。所謂隨機(jī),就是每一個(gè)實(shí)驗(yàn)單位都有同等的機(jī)會(huì)被分配到任何一個(gè)組中去,分組的結(jié)果不受人為因素的干擾和影響。在統(tǒng)計(jì)學(xué)上有許多實(shí)現(xiàn)隨機(jī)化的具體方法,應(yīng)當(dāng)嚴(yán)格實(shí)施。千萬(wàn)不可用“隨便”取代隨機(jī)。,所謂對(duì)照,就是要設(shè)立參照物。因?yàn)闆](méi)有對(duì)比,就無(wú)法鑒別優(yōu)劣。例如,要考察一種新的抗癌藥的療效如何,必須設(shè)立一個(gè)對(duì)照組。在對(duì)照

50、組里的癌癥患者,可以什么抗癌藥都不用(稱為空白對(duì)照,在臨床上應(yīng)當(dāng)慎用這種對(duì)照),亦可以用現(xiàn)在公認(rèn)的最好抗癌藥作為對(duì)照藥(稱為標(biāo)準(zhǔn)對(duì)照)。在研究干預(yù)措施的效果時(shí),直接觀察到的往往是多種因素的效應(yīng)交織在一起的綜合作用,而合理的對(duì)照能成功地將措施的真實(shí)效應(yīng)客觀、充分地識(shí)別出來(lái),使研究者得以做出正確評(píng)價(jià)。一般來(lái)說(shuō),設(shè)立對(duì)照可以最大可能地避免下列因素或現(xiàn)象對(duì)臨床試驗(yàn)研究結(jié)果的影響:①不能預(yù)知的結(jié)局(unpredictable outcome

51、),由于人類認(rèn)識(shí)的局限性,干預(yù)效應(yīng)受一些目前未被認(rèn)識(shí)的潛在未知因素的影響。②向均數(shù)回歸(regression to the mean)在臨床實(shí)踐中,有些極端的臨床癥狀或體征有向均數(shù)回歸的現(xiàn)象。所謂均衡,就是要設(shè)法使各條件(即實(shí)驗(yàn)因素的各水平組合)下的受試對(duì)象受到非實(shí)驗(yàn)因素的干擾和影響的機(jī)會(huì)和數(shù)量基本相等。這樣一來(lái),由各組受試對(duì)象反映出來(lái)的實(shí)驗(yàn)效應(yīng)才能較為客觀地體現(xiàn)出實(shí)驗(yàn)因素取不同水平時(shí)所產(chǎn)生的效果。,三、統(tǒng)計(jì)分析的意義:,有些論文

52、中的資料十分豐富,既有多因素又有多指標(biāo)。遺憾的是有些作者未對(duì)資料作統(tǒng)計(jì)分析就作出了結(jié)論;有些雖然作了統(tǒng)計(jì)分析,但一般僅作單因素分析,并且,所選用的分析方法還不完全得當(dāng)。由于統(tǒng)計(jì)軟件日趨普及,人們可以利用科學(xué)的統(tǒng)計(jì)分析方法,對(duì)同一份資料進(jìn)行更深入的的分析,這有助于更好地發(fā)掘資料中所蘊(yùn)藏的信息,揭示資料間的相互關(guān)系和內(nèi)在規(guī)律性。對(duì)于同一份實(shí)際資料,由于研究的目的、觀察的角度不同,所選用的統(tǒng)計(jì)處理方法也會(huì)不盡相同。用多種統(tǒng)計(jì)分析方法對(duì)資料進(jìn)行

53、多層次、多側(cè)面的綜合處理,盡量挖掘各方面的信息是十分必要的,也是完全可能的。,對(duì)資料作統(tǒng)計(jì)分析時(shí),可從以下幾個(gè)方面考慮如何合理選擇各種統(tǒng)計(jì)分析方法。其一,資料類型與描述統(tǒng)計(jì)量的選擇。資料一般可分為定量與定性兩大類,定量資料可細(xì)分為計(jì)量和計(jì)數(shù)兩種;定性資料可細(xì)分為有序和無(wú)序(名義)兩種。描述定量資料常用的統(tǒng)計(jì)指標(biāo)有:平均指標(biāo)、變異指標(biāo)、分位數(shù)等;描述定性資料常用的統(tǒng)計(jì)指標(biāo)有絕對(duì)數(shù)和相對(duì)數(shù)等。,按變量測(cè)量的精確程度由低到高,將數(shù)據(jù)分類為

54、:名義數(shù)據(jù)(如性別、婚姻狀況)、有序變量(如療效,類別間差別大小難以度量)、區(qū)間變量(如攝氏體溫,類別間差別有實(shí)際意義)、比變量(如身高,除具有區(qū)間變量的特征外,還具有真實(shí)意義的零點(diǎn)。攝氏溫度的零點(diǎn)為水結(jié)冰時(shí)溫度,并非絕對(duì)意義的零點(diǎn),所以它不屬于比變量),其二,資料類型與區(qū)間估計(jì)的選擇。常用于定量資料的區(qū)間估計(jì)方法有個(gè)體值的容許區(qū)間(醫(yī)學(xué)上亦稱“正常值范圍”)及總體均值(或其他特定參數(shù))的可信區(qū)間;常用于定性資料的區(qū)間估

55、計(jì)方法是總體率的可信區(qū)間。其三,資料類型與統(tǒng)計(jì)分析方法的選擇。一般來(lái)說(shuō),當(dāng)分組變量為定性變量,指標(biāo)(或結(jié)果)變量為定量變量時(shí),常用的統(tǒng)計(jì)分析方法有t檢驗(yàn)、Z檢驗(yàn)、方差分析(亦稱F檢驗(yàn))和秩和檢驗(yàn)等;當(dāng)分組變量和指標(biāo)(或結(jié)果)變量均為定性變量(包括由定量變量轉(zhuǎn)化而產(chǎn)生的)時(shí),常用的統(tǒng)計(jì)分析方法有卡方檢驗(yàn)、秩和檢驗(yàn)、Ridit分析、線性趨勢(shì)檢驗(yàn)等。其四,處理多因素多元資料的常見(jiàn)統(tǒng)計(jì)分析方法有多元回歸分析、多元方差和協(xié)方差分析、聚類分析、

56、主成分分析、因子分析、典型相關(guān)分析等。,四、資料統(tǒng)計(jì)分析中的錯(cuò)誤:,在對(duì)實(shí)際資料進(jìn)行分析時(shí),從統(tǒng)計(jì)分析的角度看,常見(jiàn)的錯(cuò)誤是:對(duì)資料未作統(tǒng)計(jì)處理就下結(jié)論;多元(或多因素)的資料用一元(或單因素)統(tǒng)計(jì)分析方法處理,導(dǎo)致資料的利用率低,不能反映資料的整體情況,不能很好地揭示變量之間的交互作用和內(nèi)在聯(lián)系。,當(dāng)暴露變量為一個(gè)分類變量時(shí),為單因素設(shè)計(jì),常見(jiàn)的設(shè)計(jì)類型有單組設(shè)計(jì)、兩組的成組設(shè)計(jì)和配對(duì)設(shè)計(jì)及多組的完全隨機(jī)設(shè)計(jì)。若滿足參數(shù)檢驗(yàn)條件,分別

57、選用單樣本t檢驗(yàn)、成組兩樣本t檢驗(yàn)、配對(duì)t檢驗(yàn)及單因素多水平方差分析(one-way ANOVA);若不滿足參數(shù)檢驗(yàn)條件,分別選用ilcoxon秩和檢驗(yàn)(或Mann-Whitney U檢驗(yàn))、Wilcoxon符號(hào)秩和檢驗(yàn)或Kruskal-Wallis H檢驗(yàn)。 常見(jiàn)錯(cuò)誤在做檢驗(yàn)前,不對(duì)結(jié)局變量的分布和方差齊性進(jìn)行檢驗(yàn),在不滿足參數(shù)檢驗(yàn)的前提條件下對(duì)定量資料盲目套用參數(shù)檢驗(yàn)方法。 錯(cuò)誤舉例,某項(xiàng)研究評(píng)價(jià)治療前后膝關(guān)節(jié)功能(表1),

58、從結(jié)果來(lái)看,部分指標(biāo)的標(biāo)準(zhǔn)差是均數(shù)的2倍,提示呈偏態(tài)分布,而原作者用單因素方差分析檢驗(yàn)治療前后的功能得分。正確做法是,選用非參數(shù)檢驗(yàn)的辦法,這個(gè)研究是自身配對(duì)設(shè)計(jì),可選用Wilcoxon符號(hào)秩和檢驗(yàn),或?qū)Y(jié)局變量進(jìn)行變換,滿足參數(shù)檢驗(yàn)的要求。,,用Pearson卡方檢驗(yàn)分析有序結(jié)局變量的數(shù)據(jù)?,某項(xiàng)研究探討原發(fā)性肝癌肝動(dòng)脈碘油化療栓塞(TACE)和三維適形放療(3DCRT)綜合治療價(jià)值(見(jiàn)表5)。原文將不同水平的療效進(jìn)行了合并,

59、采用Pearson卡方檢驗(yàn)比較兩組的有效率分別為71%和45%,P值為0.0097,這樣合并沒(méi)有充分利用資料的有序信息;而若用2×C表卡方檢驗(yàn),P值為0.0827,沒(méi)有考慮療效的遞減關(guān)系。所以,應(yīng)選用CMH卡方檢驗(yàn)行平均得分差的分析結(jié)果,P值為0.0160,(或用Ridit檢驗(yàn))才能做出正確的評(píng)價(jià)。,重復(fù)測(cè)量的數(shù)據(jù)用單因素分析:,某研究探討重型顱腦創(chuàng)傷患者硫酸鎂治療與患者血清丙二醛(MDA)含量及預(yù)后關(guān)系。治療組和對(duì)照組

60、患者分別在入院時(shí)、用藥后24、48和72小時(shí)抽取靜脈血,檢測(cè)MDA濃度(表3)。原文采用成組t檢驗(yàn)在不同時(shí)間點(diǎn)進(jìn)行兩組比較,割裂了整體設(shè)計(jì),沒(méi)有考慮到對(duì)于同一觀測(cè)對(duì)象,不同時(shí)間點(diǎn)上的數(shù)據(jù)是不獨(dú)立的。該研究可選用重復(fù)測(cè)量設(shè)計(jì)的方差分析。對(duì)于較復(fù)雜的重復(fù)測(cè)量設(shè)計(jì)資料,可選擇混合模型(Mixedmodel)或廣義估計(jì)方程(GEE)等方法進(jìn)行分析。,不能充分利用數(shù)據(jù)的信息,缺乏深入分析(浙江預(yù)防醫(yī)學(xué)2012 年第24 卷第4期),男童行

61、為因子均數(shù)比較( x ± s ),女童行為因子均數(shù)比較( x ± s ),作者分別對(duì)男童和女童的每項(xiàng)因子作了t檢驗(yàn),沒(méi)有很好的利用數(shù)據(jù)中隱藏的分布信息,另外,多次重復(fù)t檢驗(yàn)會(huì)增加I型錯(cuò)誤的概率。,對(duì)于這類數(shù)據(jù)可以考慮采用輪廓分析(Profile Analysis)方法:1、平行檢驗(yàn)2、相合檢驗(yàn)3、水平檢驗(yàn),筆誤?統(tǒng)計(jì)學(xué)知識(shí)的缺乏?或雜志社審稿的錯(cuò)誤?,,,,五、多變量分析與單變量分析 多變量分析是

62、對(duì)m個(gè)反應(yīng)變量進(jìn)行一次假設(shè)檢驗(yàn)(Hotelling T2檢驗(yàn)或MANOVA),對(duì)組間差別作出推斷。在大多數(shù)情況下,多變量假設(shè)檢驗(yàn)結(jié)論與對(duì)m個(gè)反應(yīng)變量進(jìn)行m次單變量假設(shè)檢驗(yàn)(t檢驗(yàn)或ANOVA)的結(jié)論是一致的,即多變量假設(shè)檢驗(yàn)拒絕H0,m次單變量假設(shè)檢驗(yàn)至少有一次拒絕H0,SPSS、SAS等統(tǒng)計(jì)軟件也是先給出多變量假設(shè)檢驗(yàn)結(jié)果,再給出單變量假設(shè)檢驗(yàn)結(jié)果,作為多變量分析的補(bǔ)充。,例: 某婦幼保健院將孕婦隨機(jī)分兩組,一組接受孕期保健教育,另

63、一組作為對(duì)照。表14-3是同一日出生的13名順產(chǎn)嬰兒的體重和身長(zhǎng),問(wèn)孕期保健教育對(duì)嬰兒生長(zhǎng)發(fā)育有無(wú)促進(jìn)作用? 表中用兩個(gè)指標(biāo)反映嬰兒的生長(zhǎng)發(fā)育狀況,通過(guò)孕期保健教育組和對(duì)照組嬰兒樣本均數(shù)比較,推論兩組總體均數(shù)μ1和μ2是否相等,進(jìn)而得出孕期保健教育對(duì)嬰兒體格發(fā)育有無(wú)影響的結(jié)論。,體重:t=2.35,p=0.038 身高:t=1.99,p=0.071,理論上單變量假設(shè)檢驗(yàn)不能代替多變量假設(shè)檢驗(yàn),主要理由: ①m次單變量

64、假設(shè)檢驗(yàn)增加假陽(yáng)性錯(cuò)誤的概率,設(shè)每次單變量假設(shè)檢驗(yàn)的檢驗(yàn)水準(zhǔn)定為a,做完m次檢驗(yàn)I類錯(cuò)誤的概率增加為am=1-(1-a)m。 ②單變量假設(shè)檢驗(yàn)只說(shuō)明某一變量在數(shù)軸分布上的組間差別,不能反映多個(gè)變量在平面或空間上的差別,兩者的意義不同,各自說(shuō)明各自的問(wèn)題,不能相互代替。如表14-8的兩組數(shù)據(jù),分別對(duì)兩組新生兒出生時(shí)的體重與身長(zhǎng)做單變量t檢驗(yàn):體重t=2.35,p=0.038,身長(zhǎng)t=1.99,p=0.071,結(jié)論不明確。但多變量

65、的Hotelling T2檢驗(yàn):T2=9.87,F(xiàn)=4 .58,P=0.03,拒絕H0:μ1= μ2,兩組在平面分布上差別如圖所示。,二組的平面分布,,,二組的空間分布,,,六、充分利用現(xiàn)有的臨床或體檢數(shù)據(jù)1、描述性研究: 臨床或體檢資料描述性研究包括體檢人群的健康現(xiàn)況分布、疾病的篩檢、生態(tài)學(xué)比較等 。2、分析性研究: 分析性研究可利用監(jiān)測(cè)或體檢數(shù)據(jù)所蘊(yùn)藏的信息再分析研究,以提高研究證據(jù)的強(qiáng)度主要包括病例對(duì)照研究

66、和隊(duì)列研究。病例對(duì)照研究資料的特點(diǎn)是回顧性資料、產(chǎn)生偏倚的可能性較大。隊(duì)列研究資料屬前瞻性,沒(méi)有回憶性偏倚,但存在失訪偏倚,與病例對(duì)照研究相比偏倚較少。隊(duì)列研究可直接估計(jì)危險(xiǎn)度指標(biāo)等 。,圖1 病例對(duì)照研究原理示意圖,,調(diào)查方向:收集回顧性資料,比較 人數(shù) 暴露 疾病,病例,對(duì)照,,,,,+,-,+,-,a,c

67、,b,d,OR:(a/c)/(b/d)=ad/bc(反映暴露與疾病關(guān)聯(lián)大小與方向的指標(biāo)),脂肪肝,對(duì)照組,暴露因素,,ALT 甘油三酯高密度脂蛋白,ALT 甘油三酯高密度脂蛋白,,,,,,,正常,正常,異常,異常,結(jié)局,,脂肪肝的病例-對(duì)照研究(一果多因),表2 脂肪肝Logistic回歸分析的結(jié)果,從表1看出,各參數(shù)估計(jì)值的Wald χ2檢驗(yàn),均有P<0.05,都有統(tǒng)計(jì)顯著性。且三者的OR值分別為1.030、1.819和

68、0.246。,,,,,目標(biāo)人群 未患某研究 疾病,代表性樣本,,,Yes,No,Yes,No,,,,暴露組,非暴露組,,,時(shí)間順序,,,,,是否暴露某個(gè)危險(xiǎn)因子,,結(jié)局(疾?。?圖2 隊(duì)列研究的結(jié)構(gòu)模式圖,,,,,時(shí)間順序,過(guò)去,現(xiàn)在,將來(lái),,,,,歷史性隊(duì)列,雙向性隊(duì)列,前瞻性隊(duì)列,回顧性收集已有的歷史資料,回顧性收集已有的歷史資料,繼續(xù)前瞻性收集資料,前瞻性收集資料,圖3 隊(duì)列研究類型示意圖,Thank you for

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論