醫(yī)學科研設(shè)計與統(tǒng)計學思維_第1頁
已閱讀1頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、醫(yī)學科研設(shè)計與統(tǒng)計學思維,醫(yī)學統(tǒng)計學要說它簡單吧,其實也挺簡單的,常見的統(tǒng)計方法也就十余種,在教科書上都能找到,只要熟練掌握了,雖不敢夸下??谡f可以“以秋風掃落葉的氣概橫掃四海之內(nèi)的雜志”,但足以輕車熟路地應(yīng)付一般的科學研究。要說它復雜吧,也挺復雜的,毫不夸張地說,絕大部分國內(nèi)期刊,甚至在SCI雜志上,亂用統(tǒng)計學的現(xiàn)象多如牛毛。很多人在學習醫(yī)學統(tǒng)計學時,都在抱怨自己很難走出“一學就會,一會就用,一用就錯,一錯就懵”的怪圈。

2、究其原因,主要是我們在學習醫(yī)學統(tǒng)計學時都抱著一副“依葫蘆畫瓢”的態(tài)度,試圖“套用統(tǒng)計學方法”來解決自己面臨的問題,而不去仔細思考統(tǒng)計學方法的本身的特點。,沒有設(shè)計的臨床干預試驗 1685年搶救英國國王查理二世(Charles II ,1630-1685): “一品脫(0.568L)血從右臂放出,半品脫血從左肩放出,服下催吐劑、兩付湯藥和一種由15成份的灌腸劑。刮國王的頭部,直到起一個大泡。再服打噴嚏的藥粉和更多的催

3、吐劑。繼續(xù)放血,加服止痛劑。把瀝青和鴿子糞混合后敷于腳上。服一種含有10種成份的草藥。最后服人頭蓋骨粉制成的40滴糖漿,外敷牛黃。然后,國王陛下死了。”,有設(shè)計的臨床干預試驗 1747年5月20日,英國的J. Lind醫(yī)生將12名病情相同似的患者帶到一艘船上?;颊叩闹饕Y狀是牙齦潰爛,皮膚有出血點,雙膝無力。Lind將12名患者分為6組,分別給予下列主要干預: A組:每天飲1夸脫(1.136L)蘋

4、果汁; B組:服25滴硫酸丹劑(elixir vitriol),每天3次; C組:服2匙醋,每天3次; D組:每天飲約半品脫海水,服緩和的瀉藥; E組:每天食2個桔子,一個檸檬; F組:每天服由大蒜、芥子等成份組成的干藥。 當6月16日船返回英國Plymouth港時,所有患者的病情都有好轉(zhuǎn),其中E組恢復的最快、最好

5、,其中一人到第6天就可以工作了。B組也有一人比登船時健康。Lind醫(yī)生的試驗并沒有得出明確的結(jié)論,直到160年后,通過動物實驗才真正從科學意義上解釋了E組療效最好的真正原因。,J.Lind醫(yī)生的研究有二點符合統(tǒng)計學的設(shè)計:1、設(shè)立了對照(相互對照);2、質(zhì)量控制(消除了一些混雜)。如果我們今天重復J.Lind的研究,在統(tǒng)計設(shè)計的上還需要做到以下幾點:1、研究對象的定義與納入標準和排除標準2、足夠多的觀察對象3、效應(yīng)指標的選

6、擇4、結(jié)論是否能外推,統(tǒng)計學方法用于干預試驗 1835年,法國醫(yī)生P.C.A. Louis 對當時流行的“放血”療法治療肺炎的效果進行了比較,發(fā)現(xiàn)“放血”的療效不象預期的那么好,而且早期“放血”和晚期“放血”組比較,患者的診斷、病情、病程、年齡等方面的差異很大,比較平均治愈時間意義不大。因為晚期“放血”組的平均治愈時間長,但該組患者病情重、病程長、年齡大。 Louis對醫(yī)學研究的方法學作出了很大貢獻:

7、 (1)用數(shù)字的方法表示不同疾病患者的特征和預后; (2)提出了臨床療效對比的前瞻性原則; (3)提出抽樣誤差和混雜(confounding)概念。其中前瞻性研究和減少混雜,分別成為當今臨床試驗和流行病學研究的基本研究方法; (4)在J. Gavarret 的協(xié)助下,Louis的數(shù)字方法發(fā)展為“概率框架”,Gavarret也于1840年在巴黎出版了世界第一部醫(yī)學統(tǒng)計學教科書。,“非常痛心地看到,因為

8、數(shù)據(jù)分析的缺陷和錯誤,那么多好的生物研究工作面臨著被葬送的危險” F. Yates,M.J.R. Healy,醫(yī)學論文中的統(tǒng)計問題 統(tǒng)計知識的運用 撰寫論文:報告自己觀察或?qū)嶒灥难芯拷Y(jié)果 閱讀論文:吸收新知識,了解學術(shù)進展 1996年,對申報科技成果的4586篇科研論文分析,統(tǒng)計方法使用率為76%。 醫(yī)學論文中統(tǒng)計運用

9、錯誤,除了影響論文的科學性,還可能導致嚴重的倫理學問題。,“調(diào)查結(jié)果反映了醫(yī)學論文作者統(tǒng)計知識和統(tǒng)計水平的低下,也再次強調(diào)了生物統(tǒng)計學者不是令人生畏的檢查官。恰恰相反,生物統(tǒng)計學者是我們的可貴盟友。生物統(tǒng)計學不是遠離我們的數(shù)學,而是現(xiàn)代醫(yī)學的一門基本學科,就像大廈中的一個支柱” ---JAMA的編輯部,60年代到80年代,國外醫(yī)學雜志調(diào)查結(jié)果:有統(tǒng)計錯誤的論文20%~72%。1984年對《中華醫(yī)學雜志》、《中華內(nèi)科雜志》、《中華外科雜

10、志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文的調(diào)查結(jié)果: 相對數(shù)誤用為11.2% 抽樣方法誤用15.9% 統(tǒng)計圖表誤用11.7%1996年對4586篇論文統(tǒng)計(中華醫(yī)學會系列雜志占6.9%),數(shù)據(jù)分析方法誤用達55.7%。,科學容不得半點虛假,造假者一旦

11、被揭露就背上了永遠洗脫不掉的恥辱 。,偽造統(tǒng)計數(shù)據(jù)違反科學道德 據(jù)1976年New Science 雜志關(guān)于科研舞弊行為的調(diào)查74%的調(diào)查表反映有不正當修改數(shù)據(jù)的情況,其中,17%拼湊實驗結(jié)果,7%憑空捏造數(shù)據(jù),2%故意曲解結(jié)果。 就統(tǒng)計學本身來說,正確實驗設(shè)計得出的統(tǒng)計結(jié)果,是用P值作為“重現(xiàn)性”的概率保證。P<0.05,就是說實驗結(jié)果顯示的差別是機遇所致的可能性不足5%,或者說,別人在同樣的條

12、件下重復同樣的試驗,得出相反結(jié)論的可能性不足5%。,統(tǒng)計推斷,統(tǒng)計推斷 statistical inference,如:樣本均數(shù) 樣本標準差S 樣本率 P,如:總體均數(shù) 總體標準差 總體率,內(nèi)容:參數(shù)估計(estimation of parameters) 包括:點估計與區(qū)間估計2. 假設(shè)檢驗(test of hypothesis),統(tǒng)計推斷,抽

13、樣誤差,如:樣本均數(shù) 樣本標準差S 樣本率 P,如:總體均數(shù) 總體標準差 總體率,,抽樣誤差 (sampling error) :由于個體差異導致的樣本統(tǒng)計量與總體參數(shù)間的差別。,統(tǒng)計的結(jié)論是推斷而不是證明,正確的統(tǒng)計結(jié)論必須建立在科學的設(shè)計和合適的統(tǒng)計方法上,否則得到是不恰當或是錯誤的結(jié)論。 1、收集數(shù)據(jù)的方法(研究假說、調(diào)查或?qū)嶒炘O(shè)計、誤

14、 差和偏倚的控制等) 2、分析數(shù)據(jù)的方法(變量的類型、數(shù)據(jù)的分布、研究 目的和因素等) 3、結(jié)論的外推(統(tǒng)計結(jié)論是否適合所有研究對象),1. 采用統(tǒng)計學方法,發(fā)現(xiàn)不確定現(xiàn)象背后隱藏的規(guī)律。 變異(variation)是社會和生物醫(yī)學中的普遍現(xiàn)象。 變異使得實驗或觀察的結(jié)果具有不確定性,如每個人的身高、體重、血壓等各有不同。,一、為什么要學統(tǒng)計學?,,最大值=6.18, 最小值=3.2

15、9, 極差=2.89。 算術(shù)均數(shù)=4.72,標準差=0.57。,案例一:兩個指標診斷疾病的問題路人甲做了一個研究,旨在比較兩個指標(A和B)對肝癌的診斷價值。路人甲以A和B的參考范圍上限作為診斷界值,得出了A和B在該界值下對應(yīng)的診斷敏感性和特異性。結(jié)果表明,A的診斷敏感性為0.80,特異性為0.90;B的診斷敏感性為0.85,特異性為0.87。路人甲很快撰寫論文報道了自己的研究成果,指出B診斷肝癌的敏感性高于A,而特異性低于A。&#

16、160;路人乙是這篇文章的審稿人,當他看見這個結(jié)論后,毫不猶豫地在審稿意見中寫道:就敏感性而言,B高于A;就特異性而言,A高于B。診斷敏感性和特異性與所采用的界值密切相關(guān),作者得出的敏感性和特異性僅僅代表了一個診斷界點下面的診斷效能,無法從全局上反映A和B的診斷價值。文章的結(jié)論到底是想說明A優(yōu)秀還是B優(yōu)秀呢Reject!這個例子說明:統(tǒng)計指標選錯了,統(tǒng)計出來的東西往往難以“自圓其說”。,稿件被退了,路人甲有些許郁悶。經(jīng)過認真學習科研

17、設(shè)計與統(tǒng)計學知識后,路人甲終于明白了一個問題:兩個指標診斷性能的比較是不能比較敏感性和特異性的,而應(yīng)該比較ROC的曲線下面積,因為曲線下面積才是衡量整體診斷效率的最佳指標。路人甲很快繪制了ROC曲線,統(tǒng)計結(jié)果表明,A的曲線下面積為0.80,B的曲線下面積為0.82。路人甲欣喜若狂,趕緊動筆寫論文,并且理直氣壯地給文章定了一個結(jié)論:B的診斷效率是優(yōu)于A的,其理由就是因為B的曲線下面積大于A。 路人丙是這篇文章的審稿人,當他看見

18、這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見中寫道:從表面上看,B的曲線下面積高于A,但是導致這種差異的原因有兩種,一種是隨機誤差,一種是試驗效應(yīng),即B確實是高于A的。你怎么能確定這不是抽樣誤差呢?在統(tǒng)計學上,要確定0.82是否高于0.80,就一定要經(jīng)過統(tǒng)計學檢驗的。又Reject! 這個例子說明:在醫(yī)學科研中,沒有經(jīng)過統(tǒng)計學檢驗的結(jié)論雜志社多半認為是不科學的。,稿件又被退了,路人甲很是郁悶。他吸取了經(jīng)驗教訓,自學了很多統(tǒng)計

19、學理論,終于弄清楚了采用何種方法去比較曲線下面積。接下來的事情就是改稿,然后另選雜志繼續(xù)投稿。路人甲在文稿中特別注明了,曲線下面積是經(jīng)過了統(tǒng)計學檢驗的,B的曲線下面積(0.82)與A的曲線下面積(0.80)之間的差異是有統(tǒng)計學意義的,而且還大搖大擺地在后面加了個括號,寫明P=0.01。路人甲仰天長嘆了一口氣,很鄭重地給自己的研究下了結(jié)論:本研究表明B的診斷效率是優(yōu)于A的。 路人丁是這篇文章的審稿人,當他看見這個結(jié)論后,臉色鐵

20、青,毫不猶豫地在審稿意見寫道:B是常見的診斷指標,其檢測結(jié)果并不對臨床醫(yī)師設(shè)盲,在很大程度上可以檢測影響臨床醫(yī)師對疾病的診斷。A是新進發(fā)現(xiàn)的診斷指標,其結(jié)果完全對臨床醫(yī)師設(shè)盲,不可能影響醫(yī)生的診斷。所以作者的結(jié)論(B比A優(yōu)秀)是不可靠的。再說得通俗點,如果把A和B分別理解成法庭上的原稿和被告,那B無疑既充當了辯護律師,又充當了法官的角色。在這種情況下,A輸?shù)袅斯偎臼鞘终5?。如果換一個公平的、獨立的法官來斷案,B能否勝出就不好說了。再

21、一次Reject! 這個例子說明:實(試)驗設(shè)計有缺陷,即便是統(tǒng)計學方法準確也于事無補。,稿件又一次被退了,路人甲的心情極度郁悶。思來想去,決定把實驗重做一遍,讓A和B在一個公平的環(huán)境中比較(為便于描述,此處忽略醫(yī)學倫理學問題)。在新開展的研究中,A和B都是對臨床醫(yī)生設(shè)盲的,不可能影響金標準。這下A和B的比較結(jié)果應(yīng)該比較可靠了吧,路人甲又仰天長嘆了一口氣,感覺自己如釋重負了??蒲刑垓v人了,太不容易了!統(tǒng)計結(jié)果很快出來,A的

22、曲線下面積是0.80,B的曲線下面積則變成了0.77,經(jīng)過統(tǒng)計學檢驗后發(fā)現(xiàn),A的診斷效能確實是高于B的。整個研究的試驗設(shè)計滴水不漏,統(tǒng)計學過程天衣無縫,我就不信還有人敢拒這篇稿件,路人甲心中開始暗喜。,路人戊是這篇文章的審稿人,當他看見這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見寫道:A和B的檢測并不矛盾,他們之間的關(guān)系不應(yīng)該是競爭關(guān)系,而應(yīng)該是合作關(guān)系。讀者最關(guān)心的問題顯然不是A和B“孰強孰弱”的問題,雖然這個問題有一定的專業(yè)價值。如果

23、我是坐診醫(yī)生,我會說:A和B誰強誰弱關(guān)我什么事?總之來一個病人我就A和B都檢測,我的患者都不差錢!作者的研究重點應(yīng)該是明確A和B能否互補,聯(lián)合使用是否能有助于提高診斷準確性的問題,而非A和B“孰強孰弱”的問題。簡單地說,就是明確1+1是否大于1的問題。還是被Reject!(作者吐血),這個例子說明:研究方向錯了,即使是無懈可擊的實(試)驗設(shè)計和天衣無縫的統(tǒng)計方法,也是無濟于事。,這四個例子說明:醫(yī)學科研是很痛苦的,不重視統(tǒng)計學和科研設(shè)計

24、,會走很多彎路的。,2. 用統(tǒng)計學思維方式考慮有關(guān)醫(yī)學研究中的問題 “陽性”結(jié)果是否是虛假聯(lián)系? 某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效? 以前的許多研究表明,血清甘油三酯的含量與冠心病危險性有關(guān),即甘油三酯的含量越高,患冠心病的危險性就越大。有的醫(yī)生以此篩選危險人群?,冠心病,甘油三酯,膽固醇+ 高密度脂蛋白,,,,,,,虛假聯(lián)系,案例二,如何看待統(tǒng)計學結(jié)果路人甲經(jīng)歷數(shù)十年的

25、研究,動用了各種高精尖的研究手段,發(fā)現(xiàn)了一個新的蛋白(命名為蛋白A)。在肝癌患者中展開的研究表明,蛋白A和甲胎蛋白(AFP)有很好的相關(guān)性,其相關(guān)程度之好,幾乎可以用“一塌糊涂”來形容,相關(guān)系數(shù)達到了0.99(P<0.0001)。路人甲欣喜若狂,盡管蛋白A的檢測過程還十分繁瑣,檢測費用還十分高,但是路人甲還是把持不住內(nèi)心的激動,日夜兼程地撰寫論文,宣稱自己找到了一個新的肝癌標志物。 路人乙是這篇文章的審稿人,當他看見這

26、個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見寫道:統(tǒng)計結(jié)果表明蛋白A和AFP的相關(guān)性十分明顯。如果是這樣,在臨床實踐中,通過檢測AFP完全就可以得知蛋白A的濃度了,蛋白A在肝癌中的臨床價值完全可以被AFP代替,還不說蛋白A的檢測過程繁瑣,費用太高的問題,你說蛋白A還有什么價值? Reject!,這個例子說明:統(tǒng)計學陽性的結(jié)果未必是“好結(jié)果”。,,如:當專業(yè)上有一定聯(lián)系的兩個變量之間的變化呈“S型”或“倒S型”曲線趨勢時,若錯誤地用直線方程去

27、描述,從統(tǒng)計學角度看效果也很好,但在專業(yè)上是解釋不通的。再比如,某兩個統(tǒng)計量(如均值、率等)之間的差別在統(tǒng)計學上有顯著性意義,有時在專業(yè)上并無實用價值。如某種新的降壓藥,平均降低血壓 2 mmHg,若樣本含量較大,誤差又較小,統(tǒng)計檢驗可能會得到“P<0.05”的結(jié)果,但在臨床上卻認為此新藥的療效沒有多大提高。另外,在運用統(tǒng)計學中,稍有不慎都可能犯這樣或那樣的錯誤。因此,統(tǒng)計結(jié)論的可靠性仍需通過實踐去檢驗。所以,應(yīng)當牢記:運用統(tǒng)計學時

28、必須結(jié)合醫(yī)學實際,才能真正發(fā)揮統(tǒng)計學應(yīng)有的作用。,有統(tǒng)計學(差異)意義,并不代表有生物學、臨床意義,案例三,降糖藥的研究、學生自殺事件某醫(yī)生長期從事降糖藥的研究,最近他發(fā)現(xiàn)了一種藥物,可以降低患者的血糖。為了評價該藥的降糖效果,路人甲費盡心機地設(shè)計了一個看似完美的隨機對照試驗(RCT),為了保證結(jié)果可靠,路人甲嚴格遵守RCT設(shè)計準則,包括隨機、雙盲、安慰劑對照等措施。研究結(jié)果表明,實驗組和對照組在接受藥物治療前血糖濃度的均值都是10m

29、mol/L,差異無統(tǒng)計學意義,表明兩組研究對象的基線特征具有可比性。對照組未經(jīng)任何藥物治療(為便于描述,此處忽略醫(yī)學倫理學問題),血糖濃度還是10mmol/L;實驗組經(jīng)過藥物干預后,血糖濃度變成了9mmol/L,統(tǒng)計學檢驗結(jié)果表明,實驗組和對照組治療后的血糖濃度的差異是有統(tǒng)計學意義的(P<0.01)。路人甲趕緊撰寫論文,并毫不客氣地給研究下了個結(jié)論:該藥可以降低患者血糖。,路人乙是這篇文章的審稿人,當他看見這個結(jié)論后,臉色鐵青,毫

30、不猶豫地在審稿意見寫道:卻要確實可以降低血糖,但是一個只能降低1mmol/L的降糖藥有何臨床價值?Reject! 這個例子說明:有統(tǒng)計學意義不一定有專業(yè)意義。,某CDC做了一個調(diào)查,同處一地的A和B兩所中學,各有1000名學生,過去的一年,A校有5名學生自殺(自殺率為0.5%),B校沒有學生自殺(自殺率為0%)。統(tǒng)計學結(jié)果表明,兩校自殺率的差異無統(tǒng)計學意義(P=0.07,F(xiàn)isher確切概率法)。于是寫論文得出結(jié)論:A和B

31、兩校的自殺率是沒有統(tǒng)計學上的差異,A校5名學生自殺純屬小概率事件。路人乙是這篇文章的審稿人,當他看見這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見寫道:5個鮮活的生命就這樣沒有了,5個家庭就這樣毀了,你卻告訴我這純屬小概率事件,你就不怕“人神共憤”嗎?Reject! 這個故事說明:有專業(yè)意義不一定有統(tǒng)計學意義。,這兩個故事說明:統(tǒng)計學只是方法學,醫(yī)學科研中需要借助統(tǒng)計學方法來發(fā)現(xiàn)事物的規(guī)律性,但不能死磕統(tǒng)計。,例:某醫(yī)生用一種

32、新的治療某病的療法(簡稱治療組),用現(xiàn)在公認的療法作為對照(簡稱對照組),經(jīng)臨床試驗,對照組和治療組的療效分別為P1=75%與P2=95%。問:能認為這兩個有效率之間的差別有顯著性意義嗎?答:這兩個有效率之間的差別可能有統(tǒng)計學意義,也可能沒有統(tǒng)計學意義。因為其結(jié)論不僅取決于二者之差的絕對值大小,更主要的是取決于隨機誤差的大小和樣本大小,千萬不可輕率地作出統(tǒng)計推斷?,F(xiàn)假定這兩個有效率分別來自下列甲、乙、丙三批實驗的結(jié)果,則具有下列3種不同

33、的統(tǒng)計檢驗結(jié)果。,“陰性”結(jié)果是否是樣本含量不足? 有人曾對發(fā)表在Lancet, N Engl J Med,JAMA等著名醫(yī)學雜志上的71篇陰性結(jié)果的論文作過分析,發(fā)現(xiàn)其中有62篇( 93%)可能是由于樣本含量不足造成的假陰性。,表1、兩個有效率的比較,甲實驗中,P1與P2之間的差別無統(tǒng)計學意義(校正χ2 =1.765,P>0.05)乙實驗中,P1與P2之間的差別有統(tǒng)計學意義(χ2=6.275,0.01<P<0.

34、05);丙實驗中,P1與P2之間的差別也有統(tǒng)計學意義(χ2=9.412,P<0.01)。,案例四:路人甲發(fā)明了兩套診斷肺癌的方案,分別命名為A和B。為了明確這兩種方到底誰“更勝一籌”,路人甲找了100個肺癌患者和100個疑似肺癌患者(結(jié)核、肺炎等),分別用A、B兩套方案去進行鑒別診斷。在200個研究對象中(100個肺癌和100個非肺癌),方案A正確了100例,準確率50%,方案B僅僅正確了50例,準確率僅為25%??ǚ綑z驗結(jié)果:方案A

35、和B準確率之間的差異有統(tǒng)計學意義(P<0.01)。很明顯,方案A的準確性要高于方案B。路人甲趕緊發(fā)表論文,指出:方案A診斷肺癌的準確性優(yōu)于方案B。路人乙是這篇文章的審稿人,當他看見這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見寫道:如果我(審稿人本人)是坐診醫(yī)生,他就會反著看方案B的結(jié)果,凡是方案B認為是肺癌的,他就認為病人不是肺癌;反之亦然。這樣下來,200個病人中,方案B應(yīng)該能正確識別150個人,準確率為75%,統(tǒng)計學結(jié)果表明,

36、方案B的準確率(75%)是高于方案A(50%)的,所以真實的情況是方案B優(yōu)于方案A。實際上,當面對這200名患者的時候,隨便到城隍廟找個瞎子來“算命(猜患者是否患?。?,按照統(tǒng)計學理論,準確率也應(yīng)該是50%,方案A的價值可以說是“一無是處”。Reject!,這個例子說明:統(tǒng)計學陰性的結(jié)果未必是“壞結(jié)果”。,3. 保證你的研究論文能通過統(tǒng)計學審查 據(jù)國外60~80年代對不同醫(yī)學雜志發(fā)表論文的調(diào)查,有統(tǒng)計錯誤的論文的百分比最高

37、達72%,最低也有20%。 國內(nèi)1984年對《中華醫(yī)學雜志》、《中華內(nèi)科雜志》、《中華外科雜志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文的調(diào)查結(jié)果,相對數(shù)誤用為11.2%,抽樣方法誤用15.9%,統(tǒng)計圖表誤用11.7%。某研究者1996年對4586篇論文統(tǒng)計(中華醫(yī)學會系列雜志僅占6.9%),數(shù)據(jù)分析方法誤用達55.7%。,JAMA,新英格蘭醫(yī)學雜志(NEJM)、英國醫(yī)學雜志、中華醫(yī)學會雜志對來稿都有統(tǒng)計學要求

38、或統(tǒng)計學指導。 國際生物醫(yī)學雜志編輯協(xié)會在其《生物醫(yī)學期刊投稿的統(tǒng)一要求》中也包含了統(tǒng)計學要求。 Uniform Requirements for Manuscripts Submitted to Biomedical Journals http:// www.acponline.org,《中華醫(yī)學雜志》對來稿中統(tǒng)計學處理的有關(guān)要求1.統(tǒng)計研究設(shè)計:應(yīng)交代統(tǒng)計研究設(shè)計的名稱和主要做法

39、。如調(diào)查設(shè)計(分為前瞻性、回顧性或橫斷面調(diào)查研究);實驗設(shè)計(應(yīng)交代具體的設(shè)計類型,如自身配對設(shè)計、成組設(shè)計、交叉設(shè)計、析因設(shè)計、正交設(shè)計等);臨床試驗設(shè)計(應(yīng)交代屬于第幾期臨床試驗,采用了何種盲法措施等)。主要做法應(yīng)圍繞4個基本原則(隨機、對照、重復、均衡)概要說明,尤其要交代如何控制重要非試驗因素的干擾和影響。2.資料的表達與描述:用x 和s表達近似服從正態(tài)分布的定量資料,用M(Q )表達呈偏態(tài)分布的定量資料;用統(tǒng)計表時,要合理安

40、排縱橫標目,并將數(shù)據(jù)的含義表達清楚;用統(tǒng)計圖時,所用統(tǒng)計圖的類型應(yīng)與資料性質(zhì)相匹配,并使數(shù)軸上刻度值的標法符合數(shù)學原則;用相對數(shù)時,分母不宜小于2O,要注意區(qū)分百分率與百分比。3.統(tǒng)計分析方法的選擇:對于定量資料,應(yīng)根據(jù)所采用的設(shè)計類型、資料所具備的條件和分析目的,選用合適的統(tǒng)計分析方法,不應(yīng)盲目套用t檢驗和單因素方差分析;對于定性資料,應(yīng)根據(jù)所采用的設(shè)計類型、定性變量的性質(zhì)和頻數(shù)所具備的條件以及分析目的,選用合適的統(tǒng)計分析方法,不應(yīng)

41、盲目套用χ2 檢驗。對于回歸分析,應(yīng)結(jié)合專業(yè)知識和散布圖,選用合適的回歸類型,不應(yīng)盲目套用簡單直線回歸分析,對具有重復實驗數(shù)據(jù)的回歸分析資料,不應(yīng)簡單化處理;對于多因素、多指標資料,要在一元分析的基礎(chǔ)上,盡可能運用多元統(tǒng)計分析方法,以便對因素之間的交互作用和多指標之間的內(nèi)在聯(lián)系進行全面、合理的解釋和評價。4.統(tǒng)計結(jié)果的解釋和表達:當P<0.05(或P<0.01)時,應(yīng)說明對比組之間的差異有統(tǒng)計學意義,而不應(yīng)說對比組之間具有

42、顯著性(或非常顯著性)的差別;應(yīng)寫明所用統(tǒng)計分析方法的具體名稱(如:成組設(shè)計資料的t檢驗、兩因素析因設(shè)計資料的方差分析、多個均數(shù)之間兩兩比較的q檢驗等),統(tǒng)計量的具體值(如t=3.45,X2=4.68,F(xiàn)=6.79等)應(yīng)盡可能給出具體的P值(如P=0.0238);當涉及到總體參數(shù)(如總體均數(shù) 總體率等)時,在給出顯著性檢驗結(jié)果的同時,再給出95%置信區(qū)間。,還是那個AFP與蛋白A的例子。路人甲發(fā)現(xiàn)蛋白A和甲胎蛋白(AFP)之間有很好的相

43、關(guān)性,也開始撰寫論文,但是他的結(jié)論并不是“蛋白A是診斷肝癌的標記物”。他認為,既然蛋白A與AFP之間有很強的相關(guān)性,那提示AFP和蛋白A之間可能存在十分密切的“調(diào)節(jié)”或者“被調(diào)節(jié)”關(guān)系。最終,路人甲圍繞“蛋白A與AFP之間的調(diào)節(jié)或者被調(diào)節(jié)關(guān)系”做了很多分子生物學試驗,指出蛋白A是調(diào)節(jié)AFP表達的唯一(注意“唯一”這兩個字)因子,因此二者之間才會呈現(xiàn)如此強烈的相關(guān)性。這是一項基礎(chǔ)研究,雖然未能直截了當?shù)氐刂赋龅鞍譇的臨床價值,但是這個研究

44、形象生動地講述了一個完整的分子生物學事件,豐富了我們對于肝癌發(fā)生與發(fā)展分子機制的認識。最終,論文“堂而皇之”地accept了。 這個例子說明:同一統(tǒng)計學結(jié)果,從不同的專業(yè)角度去解釋,結(jié)論是完全不同的。以上所有案例說明:對統(tǒng)計學結(jié)果的解讀一定要結(jié)合專業(yè)!從專業(yè)中來,到專業(yè)中去!,4. 獲得循證醫(yī)學證據(jù)的主要手段“良好愿望的醫(yī)學”(well-meaning medicine)轉(zhuǎn)入“以證據(jù)為基礎(chǔ)的醫(yī)學” (evidence

45、-based medicine,EBM)需要有統(tǒng)計學方法的支持。 全世界的醫(yī)學期刊每年大約刊登600萬學術(shù)論文,但能作為可靠“證據(jù)”的論文并不多。,二、 醫(yī)學科研的基本要素,醫(yī)學科研由三個基本部分組成,即處理因素(study factor)、受試對象(study object)和實驗效應(yīng)(experimental effect)。例如,觀察流甲丙脯酸對腎性高血壓患者的療效。其中,疏甲丙脯酸為處理因素,腎性高血壓患者為受試對象,

46、動脈壓變化為試驗效應(yīng)。通常將這三個組成部分稱為醫(yī)學科研的基本要素。如何正確選擇三個要素,是科研設(shè)計的關(guān)鍵問題。,Study factor,,Study object,,Experimental effect,,,,1、醫(yī)學研究設(shè)計的基本原理:,降壓藥,高血壓病人,血壓值,,,T,,,s,e,T+S=e,基本模式:,T+s1=e1=20mmHg,O+s2=e2=5mmHg,,T-O=e1-e2=20-5,T,,e=15mmHg,,,處

47、理因素的作用被單獨的顯示,統(tǒng)計分析的思維: 在排除或控制了一些可能影響實驗效應(yīng)的因素后,以概率為基礎(chǔ)計算其差異是否為隨機誤差(偶然性結(jié)果),從而推斷處理因素(或暴露)的效應(yīng)是否不為零。,,,,處理效應(yīng),(暴露),(目標人群),(發(fā)病風險),,,處理組:,對照組:,研究假說:處理效應(yīng)不為零統(tǒng)計假設(shè):處理效應(yīng)為零,醫(yī)學科研類型由于不同的科研目的,有多種不同的分類方法。如,按科技活動類型分為基礎(chǔ)研究、應(yīng)用研究和開發(fā)研

48、究(發(fā)展研究);按照醫(yī)學中各專業(yè)的屬性,可分為:基礎(chǔ)醫(yī)學科研、臨床醫(yī)學科研、預防醫(yī)學科研、社會醫(yī)學科研(包括衛(wèi)生事業(yè)管理學研究和醫(yī)學心理學科)。 一般來說,醫(yī)學科研的分類,常按設(shè)計類型的不同,分為以下幾種基本類型。(圖1-1),2 、 醫(yī)學研究設(shè)計的4個基本原則,重復、隨機、對照、均衡是實驗設(shè)計的4個基本原則,在實驗設(shè)計中務(wù)必要嚴格遵守。否則,實驗研究結(jié)果的可靠性將大受影響。所謂重復,就是實驗因素各水平組合下要有足夠的樣本含量。

49、因為統(tǒng)計學研究的是隨機現(xiàn)象的變化規(guī)律性,重復次數(shù)少,內(nèi)在規(guī)律表現(xiàn)不出來。在統(tǒng)計學上可根據(jù)設(shè)計類型選用相應(yīng)的樣本含量估算公式進行計算。所謂隨機,就是每一個實驗單位都有同等的機會被分配到任何一個組中去,分組的結(jié)果不受人為因素的干擾和影響。在統(tǒng)計學上有許多實現(xiàn)隨機化的具體方法,應(yīng)當嚴格實施。千萬不可用“隨便”取代隨機。,所謂對照,就是要設(shè)立參照物。因為沒有對比,就無法鑒別優(yōu)劣。例如,要考察一種新的抗癌藥的療效如何,必須設(shè)立一個對照組。在對照

50、組里的癌癥患者,可以什么抗癌藥都不用(稱為空白對照,在臨床上應(yīng)當慎用這種對照),亦可以用現(xiàn)在公認的最好抗癌藥作為對照藥(稱為標準對照)。在研究干預措施的效果時,直接觀察到的往往是多種因素的效應(yīng)交織在一起的綜合作用,而合理的對照能成功地將措施的真實效應(yīng)客觀、充分地識別出來,使研究者得以做出正確評價。一般來說,設(shè)立對照可以最大可能地避免下列因素或現(xiàn)象對臨床試驗研究結(jié)果的影響:①不能預知的結(jié)局(unpredictable outcome

51、),由于人類認識的局限性,干預效應(yīng)受一些目前未被認識的潛在未知因素的影響。②向均數(shù)回歸(regression to the mean)在臨床實踐中,有些極端的臨床癥狀或體征有向均數(shù)回歸的現(xiàn)象。所謂均衡,就是要設(shè)法使各條件(即實驗因素的各水平組合)下的受試對象受到非實驗因素的干擾和影響的機會和數(shù)量基本相等。這樣一來,由各組受試對象反映出來的實驗效應(yīng)才能較為客觀地體現(xiàn)出實驗因素取不同水平時所產(chǎn)生的效果。,三、統(tǒng)計分析的意義:,有些論文

52、中的資料十分豐富,既有多因素又有多指標。遺憾的是有些作者未對資料作統(tǒng)計分析就作出了結(jié)論;有些雖然作了統(tǒng)計分析,但一般僅作單因素分析,并且,所選用的分析方法還不完全得當。由于統(tǒng)計軟件日趨普及,人們可以利用科學的統(tǒng)計分析方法,對同一份資料進行更深入的的分析,這有助于更好地發(fā)掘資料中所蘊藏的信息,揭示資料間的相互關(guān)系和內(nèi)在規(guī)律性。對于同一份實際資料,由于研究的目的、觀察的角度不同,所選用的統(tǒng)計處理方法也會不盡相同。用多種統(tǒng)計分析方法對資料進行

53、多層次、多側(cè)面的綜合處理,盡量挖掘各方面的信息是十分必要的,也是完全可能的。,對資料作統(tǒng)計分析時,可從以下幾個方面考慮如何合理選擇各種統(tǒng)計分析方法。其一,資料類型與描述統(tǒng)計量的選擇。資料一般可分為定量與定性兩大類,定量資料可細分為計量和計數(shù)兩種;定性資料可細分為有序和無序(名義)兩種。描述定量資料常用的統(tǒng)計指標有:平均指標、變異指標、分位數(shù)等;描述定性資料常用的統(tǒng)計指標有絕對數(shù)和相對數(shù)等。,按變量測量的精確程度由低到高,將數(shù)據(jù)分類為

54、:名義數(shù)據(jù)(如性別、婚姻狀況)、有序變量(如療效,類別間差別大小難以度量)、區(qū)間變量(如攝氏體溫,類別間差別有實際意義)、比變量(如身高,除具有區(qū)間變量的特征外,還具有真實意義的零點。攝氏溫度的零點為水結(jié)冰時溫度,并非絕對意義的零點,所以它不屬于比變量),其二,資料類型與區(qū)間估計的選擇。常用于定量資料的區(qū)間估計方法有個體值的容許區(qū)間(醫(yī)學上亦稱“正常值范圍”)及總體均值(或其他特定參數(shù))的可信區(qū)間;常用于定性資料的區(qū)間估

55、計方法是總體率的可信區(qū)間。其三,資料類型與統(tǒng)計分析方法的選擇。一般來說,當分組變量為定性變量,指標(或結(jié)果)變量為定量變量時,常用的統(tǒng)計分析方法有t檢驗、Z檢驗、方差分析(亦稱F檢驗)和秩和檢驗等;當分組變量和指標(或結(jié)果)變量均為定性變量(包括由定量變量轉(zhuǎn)化而產(chǎn)生的)時,常用的統(tǒng)計分析方法有卡方檢驗、秩和檢驗、Ridit分析、線性趨勢檢驗等。其四,處理多因素多元資料的常見統(tǒng)計分析方法有多元回歸分析、多元方差和協(xié)方差分析、聚類分析、

56、主成分分析、因子分析、典型相關(guān)分析等。,四、資料統(tǒng)計分析中的錯誤:,在對實際資料進行分析時,從統(tǒng)計分析的角度看,常見的錯誤是:對資料未作統(tǒng)計處理就下結(jié)論;多元(或多因素)的資料用一元(或單因素)統(tǒng)計分析方法處理,導致資料的利用率低,不能反映資料的整體情況,不能很好地揭示變量之間的交互作用和內(nèi)在聯(lián)系。,當暴露變量為一個分類變量時,為單因素設(shè)計,常見的設(shè)計類型有單組設(shè)計、兩組的成組設(shè)計和配對設(shè)計及多組的完全隨機設(shè)計。若滿足參數(shù)檢驗條件,分別

57、選用單樣本t檢驗、成組兩樣本t檢驗、配對t檢驗及單因素多水平方差分析(one-way ANOVA);若不滿足參數(shù)檢驗條件,分別選用ilcoxon秩和檢驗(或Mann-Whitney U檢驗)、Wilcoxon符號秩和檢驗或Kruskal-Wallis H檢驗。 常見錯誤在做檢驗前,不對結(jié)局變量的分布和方差齊性進行檢驗,在不滿足參數(shù)檢驗的前提條件下對定量資料盲目套用參數(shù)檢驗方法。 錯誤舉例,某項研究評價治療前后膝關(guān)節(jié)功能(表1),

58、從結(jié)果來看,部分指標的標準差是均數(shù)的2倍,提示呈偏態(tài)分布,而原作者用單因素方差分析檢驗治療前后的功能得分。正確做法是,選用非參數(shù)檢驗的辦法,這個研究是自身配對設(shè)計,可選用Wilcoxon符號秩和檢驗,或?qū)Y(jié)局變量進行變換,滿足參數(shù)檢驗的要求。,,用Pearson卡方檢驗分析有序結(jié)局變量的數(shù)據(jù)?,某項研究探討原發(fā)性肝癌肝動脈碘油化療栓塞(TACE)和三維適形放療(3DCRT)綜合治療價值(見表5)。原文將不同水平的療效進行了合并,

59、采用Pearson卡方檢驗比較兩組的有效率分別為71%和45%,P值為0.0097,這樣合并沒有充分利用資料的有序信息;而若用2×C表卡方檢驗,P值為0.0827,沒有考慮療效的遞減關(guān)系。所以,應(yīng)選用CMH卡方檢驗行平均得分差的分析結(jié)果,P值為0.0160,(或用Ridit檢驗)才能做出正確的評價。,重復測量的數(shù)據(jù)用單因素分析:,某研究探討重型顱腦創(chuàng)傷患者硫酸鎂治療與患者血清丙二醛(MDA)含量及預后關(guān)系。治療組和對照組

60、患者分別在入院時、用藥后24、48和72小時抽取靜脈血,檢測MDA濃度(表3)。原文采用成組t檢驗在不同時間點進行兩組比較,割裂了整體設(shè)計,沒有考慮到對于同一觀測對象,不同時間點上的數(shù)據(jù)是不獨立的。該研究可選用重復測量設(shè)計的方差分析。對于較復雜的重復測量設(shè)計資料,可選擇混合模型(Mixedmodel)或廣義估計方程(GEE)等方法進行分析。,不能充分利用數(shù)據(jù)的信息,缺乏深入分析(浙江預防醫(yī)學2012 年第24 卷第4期),男童行

61、為因子均數(shù)比較( x ± s ),女童行為因子均數(shù)比較( x ± s ),作者分別對男童和女童的每項因子作了t檢驗,沒有很好的利用數(shù)據(jù)中隱藏的分布信息,另外,多次重復t檢驗會增加I型錯誤的概率。,對于這類數(shù)據(jù)可以考慮采用輪廓分析(Profile Analysis)方法:1、平行檢驗2、相合檢驗3、水平檢驗,筆誤?統(tǒng)計學知識的缺乏?或雜志社審稿的錯誤?,,,,五、多變量分析與單變量分析 多變量分析是

62、對m個反應(yīng)變量進行一次假設(shè)檢驗(Hotelling T2檢驗或MANOVA),對組間差別作出推斷。在大多數(shù)情況下,多變量假設(shè)檢驗結(jié)論與對m個反應(yīng)變量進行m次單變量假設(shè)檢驗(t檢驗或ANOVA)的結(jié)論是一致的,即多變量假設(shè)檢驗拒絕H0,m次單變量假設(shè)檢驗至少有一次拒絕H0,SPSS、SAS等統(tǒng)計軟件也是先給出多變量假設(shè)檢驗結(jié)果,再給出單變量假設(shè)檢驗結(jié)果,作為多變量分析的補充。,例: 某婦幼保健院將孕婦隨機分兩組,一組接受孕期保健教育,另

63、一組作為對照。表14-3是同一日出生的13名順產(chǎn)嬰兒的體重和身長,問孕期保健教育對嬰兒生長發(fā)育有無促進作用? 表中用兩個指標反映嬰兒的生長發(fā)育狀況,通過孕期保健教育組和對照組嬰兒樣本均數(shù)比較,推論兩組總體均數(shù)μ1和μ2是否相等,進而得出孕期保健教育對嬰兒體格發(fā)育有無影響的結(jié)論。,體重:t=2.35,p=0.038 身高:t=1.99,p=0.071,理論上單變量假設(shè)檢驗不能代替多變量假設(shè)檢驗,主要理由: ①m次單變量

64、假設(shè)檢驗增加假陽性錯誤的概率,設(shè)每次單變量假設(shè)檢驗的檢驗水準定為a,做完m次檢驗I類錯誤的概率增加為am=1-(1-a)m。 ②單變量假設(shè)檢驗只說明某一變量在數(shù)軸分布上的組間差別,不能反映多個變量在平面或空間上的差別,兩者的意義不同,各自說明各自的問題,不能相互代替。如表14-8的兩組數(shù)據(jù),分別對兩組新生兒出生時的體重與身長做單變量t檢驗:體重t=2.35,p=0.038,身長t=1.99,p=0.071,結(jié)論不明確。但多變量

65、的Hotelling T2檢驗:T2=9.87,F(xiàn)=4 .58,P=0.03,拒絕H0:μ1= μ2,兩組在平面分布上差別如圖所示。,二組的平面分布,,,二組的空間分布,,,六、充分利用現(xiàn)有的臨床或體檢數(shù)據(jù)1、描述性研究: 臨床或體檢資料描述性研究包括體檢人群的健康現(xiàn)況分布、疾病的篩檢、生態(tài)學比較等 。2、分析性研究: 分析性研究可利用監(jiān)測或體檢數(shù)據(jù)所蘊藏的信息再分析研究,以提高研究證據(jù)的強度主要包括病例對照研究

66、和隊列研究。病例對照研究資料的特點是回顧性資料、產(chǎn)生偏倚的可能性較大。隊列研究資料屬前瞻性,沒有回憶性偏倚,但存在失訪偏倚,與病例對照研究相比偏倚較少。隊列研究可直接估計危險度指標等 。,圖1 病例對照研究原理示意圖,,調(diào)查方向:收集回顧性資料,比較 人數(shù) 暴露 疾病,病例,對照,,,,,+,-,+,-,a,c

67、,b,d,OR:(a/c)/(b/d)=ad/bc(反映暴露與疾病關(guān)聯(lián)大小與方向的指標),脂肪肝,對照組,暴露因素,,ALT 甘油三酯高密度脂蛋白,ALT 甘油三酯高密度脂蛋白,,,,,,,正常,正常,異常,異常,結(jié)局,,脂肪肝的病例-對照研究(一果多因),表2 脂肪肝Logistic回歸分析的結(jié)果,從表1看出,各參數(shù)估計值的Wald χ2檢驗,均有P<0.05,都有統(tǒng)計顯著性。且三者的OR值分別為1.030、1.819和

68、0.246。,,,,,目標人群 未患某研究 疾病,代表性樣本,,,Yes,No,Yes,No,,,,暴露組,非暴露組,,,時間順序,,,,,是否暴露某個危險因子,,結(jié)局(疾?。?圖2 隊列研究的結(jié)構(gòu)模式圖,,,,,時間順序,過去,現(xiàn)在,將來,,,,,歷史性隊列,雙向性隊列,前瞻性隊列,回顧性收集已有的歷史資料,回顧性收集已有的歷史資料,繼續(xù)前瞻性收集資料,前瞻性收集資料,圖3 隊列研究類型示意圖,Thank you for

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論