論文的格式:如何閱讀醫學論文(一)
時間:2022-11-17 11:44:00
導語:論文的格式:如何閱讀醫學論文(一)一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
關鍵詞:醫學論文
把握你的方向——判斷論文的實質對“垃圾”論文的認識當學生們了解到某些(甚至可能是大多數)發表的論文應當扔進垃圾箱,肯定不能用于指導臨床實踐時1,他們通常感到很驚訝。
本文第一個框圖內列出了論文被有審稿程序的雜志退稿的某些常見原因。目前醫學雜志上發表的論文大多數都或多或少按標準的IMRAD格式撰寫:即前言(作者為什么決定進行這項研究)、方法(作者如何進行這項研究,怎樣分析所得到的結果)、結果(作者發現了什么)及討論(得到的結果有什么意義)。如果你要判斷一篇論文是否值得閱讀,你應該審查這篇論文方法學部分的科研設計,而不是審查該研究假設的重要性、研究結果的可能影響或討論的深入程度。
嚴格評價許多循證醫學的教科書2-6和JAMA雜志上發表的Sackett及其同事撰寫的醫學文獻使用指南7-21,都詳細介紹過對科研方法的質量進行評價(嚴格評價)的方法。如果你是一名有經驗的雜志讀者,這些作者提供的結構式審查單絕大部分具有自明性。如果你不是這樣,則請試著回答下列基本的問題。
本文要點醫學雜志發表的許多論文在方法學方面有潛在的嚴重缺陷當判斷某篇論文是否有效并與臨床實踐有關時,首先確定該論文闡述了什么臨床問題闡述有關藥物治療或其它醫療干預措施問題時,應該采用雙盲隨機對照臨床試驗闡述有關預后問題時,需要縱斷面的隊列研究;闡述有關病因方面的問題時,需要隊列研究或病例-對照研究病例報告盡管在方法學方面不夠嚴格,但可以很快完成,并可以提醒醫生注意藥物的不良反應
問題1:為什么進行這項研究,作者闡述了什么臨床問題?一篇科研論文的前言部分應當簡明扼要地說明這項研究的背景。例如,“Grommet插入術對兒童是一種常用的操作,因而有人認為并非所有的手術在臨床上都有必要”。在這個說明之后應該接著對已發表的文獻做一簡要的回顧。論文為什么被拒絕發表。研究沒有闡述重要的科學課題。研究不是原始性的(其他人已經作了同樣或類似的研究)。研究并沒有真正檢驗作者所提出的假設。應該進行另一種類型的研究。執行困難(例如,篩選研究對象),使得作者改變原先的研究方案。樣本量太少。研究沒有設對照組或對照不充分。統計學分析方法錯誤或不恰當。作者從研究資料中得出的結論不正確。有明顯的利益沖突(作者之一或贊助者可能通過發表這篇文章獲得經濟利益),并且沒有充分的證據證明沒有偏倚。論文寫作水平太差,不能被理解作者應在文章的前言中明確說明要進行檢驗的假設,否則應該在方法學部分明確說明。如果假設是以否定的方式表示的,如“在最大劑量的碘酰脲治療中加入二甲雙胍不能提高對Ⅱ型糖尿病的控制”,則被稱為無效假設。當一項研究的作者開始進行研究時,他們很少真的相信他們的無效假設。作為普通人,他們通常開始去揭示所研究的兩個方面之間的差異。但科學家采用的方式是,“讓我們假設沒有差異,然后努力去否定這個理論”。如果你遵循KarlPopper的教導,這種假設-推導的方法(建立無效假設,然后進行檢驗)是科研方法的最基本的要素22。
問題2:進行的是什么類型的研究?首先,確定這篇論文是描述一項原始研究,還是一項第二手(或綜合性)研究。原始研究報道第一手的研究資料,而第二手研究是對第一手研究進行匯總并從中得出結論。醫學雜志所發表的絕大多數研究為原始研究,通??煞謩e歸入以下3類:。實驗:在實驗中,實驗措施是在模擬和控制的環境中在動物或志愿者身上進行;。臨床試驗:在臨床試驗中,首先對一組病人給予干預措施,例如藥物治療,然后對這組病人進行隨訪,觀察他們發生了什么情況;。調查:在調查中,研究人員在一組病人、醫務工作者或其他某些人群樣本中進行某些檢測。本文第2個方框顯示了用于描述研究設計的一些常用術語。第二手研究包括:。綜述,可以分為:(非系統性)綜述:總結原始研究;系統性綜述:按一種預先確定的嚴格的方法對原始研究進行總結;匯總分析:對一個以上的研究的數據資料進行綜合。。指南:從原始研究中得出臨床醫生應如何操作的結論。。決策分析:應用原始研究的結果建立概率的樹狀結構,供醫務工作者和病人對臨床治療作選擇24-26。。經濟分析:應用原始研究的結果確定某一項治療措施對資源的應用是否合理。
用于描述臨床研究設計特征的術語組間平行比較——每一組接受一種不同的治療,兩組同時開始進行研究;所得結果用兩組比較進行分析配對比較——接受不同治療的研究對象被進行配對以平衡潛在的混雜因子,如年齡和性別;所得結果用研究對象配對之間的差異進行分析研究對象自身比較——在治療前和治療后對研究對象進行檢查,所得結果用研究對象自身的變化進行分析單盲——研究對象不知道他們接受了哪種治療雙盲——研究對象不知道他們接受了哪種治療,研究者也不知道交叉——每一個研究對象都接受干預和對照治療(順序采用隨機方法),其間經常用無治療的空白期分隔安慰劑對照——對照組研究對象接受安慰劑(無效藥片),安慰劑在外觀和味道上應該與有效藥片一樣。安慰(假)手術也可用于外科臨床試驗因子設計——這種研究可以允許按照預定結果對一種以上各自獨立的變量的作用(無論是分離的還是聯合的)進行研究。例如,2×2因子設計可以檢驗安慰劑、單獨阿司匹林、單獨鏈激酶或阿司匹林加鏈激酶在急性心臟病發作中的作用
問題3:科研設計是否適合于這項研究?對這個問題最佳的闡述方法是考慮這項研究涉及到哪個大概的科研領域。絕大多數研究都是有關下面方框中的一個或多個大概的領域。
大概的科研領域。治療:檢驗藥物治療、外科手術、其它醫療服務方式或其它干預措施的效果。首選的研究設計是隨機對照臨床試驗。診斷:證實某一新的診斷性實驗是否有效(我們能否相信它),是否可靠(我們是否每次都能得到相同的結果)。首選的研究設計是橫斷面調查。在橫斷面調查中,研究對象要接受新的檢驗方法和金標準方法的檢查。
篩選:證實能夠用于大規模人群檢驗并在癥狀發生前期檢查出疾病的檢查方法的價值。首選的研究設計是橫斷面調查。預后:確定早期發現的患有某種疾病的病人可能發生什么情況。首選的研究設計是縱斷面隊列研究。病因:確定某種假定有害的物質,如環境污染,是否與疾病的發生有關。首選的研究設計是隊列研究或病例-對照研究,取決于這種疾病的罕見程度,但是,病例報告也能提供關鍵的信息隨機對照臨床試驗在隨機對照臨床試驗中,參加者是按照一種程序(類似于投擲硬幣)被隨機分配到干預組(如藥物)或另一組(如安慰劑治療或另一種不同的藥物)。兩組都被隨訪一個特定的時期,并按開始時所確定的研究結果(死亡、心臟病發作、血清膽固醇水平等)進行分析。一般而言,除了治療措施外,兩組都是相同的。因此,從理論上說,研究結果的任何差異都歸因于治療措施。有一些比較治療組和對照組的臨床試驗并非隨機試驗。隨機分配在這些試驗中或許是不可能、不現實的或是不道德的——例如,比較嬰兒在家中出生和醫院中出生的結果。更常見的是,缺乏經驗的研究者比較一組(如病房A中的病人)和另一組(如病房B中的病人)。應用這樣的設計,根本不可能在統計學的水平上對兩組間進行合理的比較?;卮鹬T如下列問題應該用隨機對照臨床試驗:。對某一特定的疾病,所研究的這種藥物是否比安慰劑或另一種藥物效果好?。對某一特定的疾病,宣傳頁是否比口頭建議能更好地幫助病人對治療方法作出明智的選擇。但應該記住,隨機試驗有一些缺點(見框圖)27。還應該記住,隨機試驗的結果在適用性方面有所限制,這是因為排除標準(確定哪些病人不應該進入研究的原則)的偏倚;納入標準的偏倚(從不能代表這種疾病的某一人群中選擇研究對象);拒絕給予某些組群的病人知情同意的機會以便納入該研究28;僅僅分析預先確定的“客觀”的終點結果,而可能排除了干預措施質量的重要方面;以及發表偏倚(選擇性發表陽性結果的研究論文)29。目前,醫學雜志報道隨機對照臨床試驗有一個推薦格式30,如果你在撰寫這方面的論文,應該盡力遵循它的要求。
隨機對照臨床試驗設計優點。允許在一個精確選定的病人組群中(如50~60歲的絕經婦女),對某一單獨的變量(如藥物治療與安慰劑的效果對比)進行嚴格的評價。前瞻性設計(資料來自開始研究以后發生的病例)。應用假設-推導進行推理(尋求否定,而非證實本身的假設)。通過比較基線指標相同的兩組來消除潛在的偏倚(但請參見下文)。允許做匯總分析(在后期對許多相似的臨床試驗的數字結果聯合分析)缺點昂貴并且耗時,因此,在實踐中:。許多隨機對照臨床試驗,或者從未作過,或者研究的病人太少,或者進行的研究時間太短。絕大多數隨機對照臨床試驗是由大研究機構(大學或政府主辦)或藥廠提供資助,最終由這些單位來確定研究日程。經常使用替代的終點指標而非臨床測量結果,可導致“潛在的偏倚”,尤其是:。隨機化不理想(見上述)。沒有對所有合格的病人進行隨機化分配(臨床醫生在臨床試驗中只讓那些他們認為可能對干預措施反應好的病人參加)。未由資料評價人員將病人的隨機化狀況進行盲法分析隊列研究在隊列研究中,根據暴露于某種特定物質(如一種疫苗、一種藥物或一種環境毒素)的不同,選擇兩組(或更多組)人群,然后隨訪,觀察每一組有多少人發生了某一種特定的疾病或其它后果。在隊列研究中隨訪的時間通常以年(有時10年)來計算,因為許多疾病,尤其是癌癥發病需要這樣長的時間。值得注意的是,隨機對照臨床試驗通常是從已經患有某種疾病的病人開始研究,但絕大多數隊列研究是從研究對象開始,這些研究對象可能發病,也可能不發玻有一種特殊類型的隊列研究可用于確定疾病的預后(患有疾病的人可能發生什么后果)。一組已經被診斷為患有某種疾病的早期病人,或在篩選檢查中有陽性結果的病人被收集起來(起始隊列),然后反復進行隨訪,以觀察不同結果的發病率(每年發生的新病例)和病程。世界上最著名的隊列研究是由AustinBradfordHill爵士、RichardDoll爵士及后來的RichardPeto進行的。這項研究為最初的兩位作者贏得了爵位。他們隨訪了40000名英國醫生,將他們分為4個隊列(非吸煙者、輕度吸煙者、中度吸煙者及重度吸煙者),應用全病因死亡率(任何死亡)和特異病因死亡率(某一種疾病導致的死亡)作為觀察結果。在1964年發表的10年初步報告中,顯示吸煙者無論肺癌死亡率還是全病因死亡率都大幅度增加,并且有“劑量-反應”相關關系(吸煙越多,患肺癌的機率越大)。他們走過了很長的一段路31,最終證實吸煙和健康損害的聯系是病因性的,而非偶然性的。這項重要研究的20年和40年的結果(對那些1951年收集并且沒有死亡的研究對象的隨訪率達到驚人的94%),不僅表明了吸煙的危害性,也表明了從一個執行良好的隊列研究中所獲得的證據的重要作用32,33。回答下列臨床問題應該用隊列研究:。高血壓隨著時間的推移會變好嗎?。早產兒在以后的生長發育和學習成績方面會發生什么情況?病例-對照研究在病例-對照研究中,患有某種特定疾病的病人被識別并與對照組(患有某些其它疾病的病人、總人口、鄰居或親屬)進行“配對”。
然后收集過去暴露于某種疾病的可能致病因子的資料(例如,通過查找這些人的病例記錄,或讓他們回憶過去的病史)。同隊列研究一樣,病例-對照研究通常研究疾病的病因(什么導致了疾?。羌膊〉闹委?。病例-對照研究在證據等級中排位比較靠下(見下文),但這種設計對罕見疾病的研究經常是唯一的選擇。在病例-對照研究中,主要的困難和潛在的偏倚是準確判定誰是“病例”,因為只要將一個研究對象錯誤分配,就可以嚴重影響結果。另外,這種設計不能表明因果關系——病例-對照研究中A與B有關系并不能證明A引起了B?;卮鹣铝信R床問題應該用病例-對照研究:。俯臥睡眠姿勢增加小床死亡(嬰兒突然死亡綜合征)的危險性嗎?百日咳疫苗導致腦損害嗎?高架電纜能引起白血病嗎?橫斷面調查我們可能都被要求過參加某一項調查,甚至只是有人問我們最喜歡哪種牌子的牙膏。流行病學家進行的調查與此做法相同:對某一有代表性的研究對象樣本(或病人)進行訪問,通過檢查或研究以獲得對某一特定臨床問題的答案。在橫斷面研究中,資料是在一個單一的時間內收集的,但可以回顧性地追溯過去的經歷,如研究以前的病例記錄以調查過去5年中病人的血壓被記錄過多少次。橫斷面調查應該用于回答下列臨床問題:3歲兒童的“正常”身高是多少?精神科護士對嚴重抑郁癥患者使用電驚厥療法有多大信心?有半數糖尿病病人沒有被診斷出來,是真的嗎?病例報告病例報告是以故事的方式描述單獨一個病人的病史:“B夫人是一位54歲的秘書,她于1995年6月開始胸部疼痛…”。病例報告經常綜合到一起形成病例系列。在病例系列中,一個以上患有某種疾病的病人的病史被加以描述,以闡述這種疾病在某個方面的表現、疾病的治療,或目前更常見的,闡述對治療的不良反應。盡管傳統認為這種類型的研究提供的證據是“快速而含混”的,但病例報告可以傳遞大量的在臨床試驗或調查中可能丟失的信息。
值得紀念的病例報告范例一位醫生在他的醫院里觀察到兩個新生兒缺少肢體(海豹肢畸形)。這兩位母親在妊娠早期都服用過一種新的藥物(反應停)。這位醫生希望盡快地提醒所有同行注意這種藥物引起損害的可能性證據的等級當對臨床干預措施作決策時,根據不同類型的原始研究所具有的相對權重進行標準記數法(“證據的等級”),可將這些研究排成下列順序36:(1)系統綜述和匯總分析(2)有明確結果的隨機對照臨床試驗(可信性區間與臨床顯著性效果的閾值不重疊)(3)不具有明確結果的隨機對照臨床試驗(估計有臨床顯著性效果,但可信性區間與臨床顯著性效果的閾值重疊)(4)隊列研究(5)病例-對照研究(6)橫斷面調查(7)病例