综述分析好方法：Meta 分析

互联网2012-10-12

15744

科学研究应建立于许多实验结果的重复之上,除了少数新发现外,单个实验结果很难对科学的发展作出极为显著的贡献。所以为了阐明某一主题,在许多科学领域有众多研究者在对不同的实验对象或对同一对象在不同的实验环境中进行实验,在医学界,如胎教对婴儿智力的影响,吸烟与肺癌的相关程度等,都曾有大量的临床或调查实验对这些大众所关心的问题进行统计分析研究,但结果不尽相同。

面对如此多结果不一的独立研究,作为决策者该相信哪一个分析结果呢? 于是当大量独立实验出现时,就会有人对这些独立实验进行综合,即综述。综述是对同一主题不同实验结果的总结,也是对过去实验的概括、提炼,要从独立实验中排除随机误差,提炼出本质的内容,同时也要从中发现问题,为将来这一主题的研究指明方向,为解决问题的决策者提供科学依据。所以好的综述必须有好的方法来作后盾。Meta 分析正是这样一种好的综合方法。

一. Meta 分析的发展历程

(一).萌芽阶段

Meta 分析方法是当今比较流行的一种对同一主题下多个独立实验结果进行综合的统计方法。也有人用总观评述(overview ) 、数量评论( quantitative re2view) 、数量综合(quantitative synthesis) 这些名称来代表这一方法。

它的起源可追朔到1904 年,英国统计学家基于样本大小对5 个估计值进行平均,对英国军事实验进行综合分析,以检验当时所用的intestinalfever 疫苗与死亡率的相关程度(疫苗是否有效) ,可以说这是Meta 分析的雏形。30 年代, Tuppett 、Fisher 和Yates 三位统计学家提出了结合概论统计检验,也有许多Meta 分析学者认为Meta 分析直接根源于此。

(二).缓慢发展阶段

从40 年代到70 年代中期,Meta 分析在缓慢发展,其中Mantel 和Haenszel 创建的Mantel - Haenszel 法和Cochran 发展的Cochran 法分别为以后的Peto 法和D - L法提供了基础;这一阶段只是零星地出现了一些分析方法,真正的应用实例较少。

(三).真正兴起阶段

1976 年美国教育学家Glass 在研究心理疗法的有效性时才正式将这种定量综合法命名为Meta 分析,也真正揭开了Meta分析革命的开端,并创造了效应值(effectsize) 。社会科学(包括教育学、心理学和社会决策学等) 很快接受了Meta 分析,80年代初期,在社会科学领域有关书籍和软件也相继问世。不久临床医学发现了这一方法,于是Meta 分析在医学领域又开始了它的使命。虽然直到80 年代末期,在医学界才出现了有关的专门书籍,但是它在医学中的应用却发展迅猛。作者通过MEDL INE(美国医学国家图书馆数据库)以Meta - analysis 为主题词进行检索,发现从1976 到1998 年,有关Meta 分析的论文急剧增加。

由于医学领域广阔,与教育学、心理学相比,如流行病学、大众健康学等学科又有其独特性,于是促使医学统计学者不断发展新的Meta 分析方法来满足医学领域的需要。DerSimonian 和Laird 改进了Cochran 法,构造了随机效应模型,打破了Meta 分析中传统的假设,引进了研究间方差权重, 使其更符合事实。Hedges 提出了小样方的校正方法。最初的Meta 分析并未考虑所结合研究的质量问题,后来有些分析家又提出了定性Meta 分析(qualitative meta - analysis) ,即在综合时要考虑各研究的质量。所以Milos 把前阶段的Meta 分析称作典型或数量Meta 分析(classic meta - analysis orquantitative meta - analysis) 。

90 年代,生态学家们又把它引入了生态领域,虽然它在生态学中的应用还很少,仅有少数几篇文章,却引起了生态学界的高度重视。Gurevitch 发展了混合效应模型,1997 年又提出了适合生态学的重取样检验法, 并发行了她的MetaWin 软件。可以说Meta 分析在生态学领域的应用正方兴未艾。但遗憾的是,Meta 分析在中国学术界才暂露头角,1993 年赵宁等首次把它介绍进了中国医学界,1997 年郭春彦等在《心理学报》发表了有关文章,他们都将Meta 分析翻译成元分析。彭少麟等把这一方法引入了中国生态学界并进行应用。

根据我们的理解及有关科学术语翻译家的意见,元分析并不是Meta分析最好的中文对等词,相反,台湾一些学者所用的“整合分析”显得更确切。可以说Meta 分析对绝大部分中国学者来说还是个陌生的名词,也尚未进入真正的应用时期,故它在我国医学、教育心理学和生态学等领域的应用前景很广阔。

二. Meta-analysis基本概念

Meta-analysis方法的思想可追溯到20世纪30年代,最初应用于教育学、心理学等社会科学领域是在60年代,70年代初Ligh和Smith提出了可以由不同研究结果汇总原始数据进行综合分析,1976年由Glass首次命名Meta-analysis。Meta-analysis一词的意思是more comprehensive,即更加全面的综合或超常规。

国内译为元分析或荟萃分析。这些名称都表示这样一个概念:即对以往的研究结果进行系统的定量分析。Glass对Meta-analysis提出的定义是:以综合已有的发现为目的,对单个研究结果的集合的统计学分析方法。Sacks等提出的定义是:对以往的研究结果进行统计学的合并和严谨的综述方法。罗湘等认为Meta-analysis方法是依靠搜集已有或未发表的具有某一可比特性的文献,应用特定的设计和统计学方法进行分析与综合评价,使有可能对具有不同设计方法及不同病例数的研究结果进行综合比较。

Meta-analysis方法应用到医学有关的文章第1篇发表于1955年。作者综合了15份单独研究结果,对1 000余名不同疾病患者服用安慰剂的疗效进行分析,得出了安慰剂具有35 %疗效的结论。近十多年来,Meta-analysis在医学领域应用范围日益广泛,在诊断、治疗、危险度评价、干预措施、预防对策等方面起着独特的作用,甚至有人提出在进行文献综述时,应尽量采用Meta-analysis方法以取代传统的描述性的方法,从而可以得到1个最后的可以信赖的结论,因此,有人称之为分析的分析或叫“结果流行病学”,亦有人称Meta-analysis是更高1级逻辑形式的研究。

(三). Meta 分析的过程

(1) 　Meta 分析的目的

目前Meta 分析主要应用在对照实验(研究) 的综合中。其目的是通过综合独立研究来提高统计学能力,降低II 型错误;当独立研究结果出现矛盾时,解决这种不确定性,弥补单个研究的不足;提高对效应大小的总体估计能力;比较不同研究特点下的分析结果,回答一些独立研究并未提出的问题并为将来的研究指明道路。

(2) 　现代Meta 分析的过程

Meta 分析决不仅仅是一个数学分析过程,它本身也是一项研究,需要认真设计。主要步骤如下。

1 　提出所要解决的问题并制定搜集、选择文献的标准　

明确指出所要解决的问题是后面几步的基础,如Gurevitch 在提出要检验野外实验中生物相互竞争对生物量的影响程度,首先,将综述文献定于野外实验、竞争和生物这几个关键词上,即实验大背景为野外实验,不包括室内模拟实验。实验对象为植物,影响因素为种间竞争,测量结果为植物生物量。选择文献的标准根据所解决问题来定,既要考虑到文献的全面,又要照顾到计算的可能。

2 　搜集文献　

这是一项非常繁重且关键的工作。最初的Meta 分析中只搜集已发表文献,后来Meta 分析家们通过调查发现已发表的文献往往不能代表所有研究的真实结果,因为在统计学检验中显著性较小的研究较显著性较大的研究更易于发表。所以后来的综述者为了能搜集到全面的文献,通过各种途径来最大可能地收集已发表的和未发表文献(包括正式期刊中的论文、会议论文、摘要以及各种私人交换资料等) 。文献检索中要联机检索与手检相结合,并重视所得文献的参考文献。对一些基本内容符合要求,报道不详者,可通过与作者联系获取分析所必须信息,这一点需要科研工作者具有良好的合作精神。

3 　标定各研究的特点,并对其进行分类　要结合独立研究,综述者必须对各研究作充分的了解,目前正规的做法是先将各研究的实验设计,包括取样是否随机、研究背景、研究方法、样本大小、结果测量、统计分析方法等罗列出来,然后一般根据研究背景将所有研究分为几级别或类 (class) ,以作比较。

4 　定量测度研究特点　研究特点的不同会影响实验结果,也即各研究的质量不同,如果在分析时对这些质量不等的研究给予相同的结合标准,必然会导致分析结果的不准确,为了克服这一问题,分析家们提出了定性Meta 分析,即先对前面所罗列的研究特点按重要程度进行打分,然后指定两位分析者按照评分标准对所有的研究进行盲打分,即事先将各研究的作者、所在出版物名及发表日期全部隐藏起来进行评分,如果二位的评分结果相似性高,则接受此评分标准,然后取二人的平均值;如果二位的评分结果一致性较差,则重新制定标准。

5 　结合研究结果并结合研究特点来分析结果　也有人称这一步为定量Meta分析,以相对于定性Meta 分析。目前已发展出多种Meta 分析方法。但它们的基本思想是一致的,那就是先提出假设,构造一个综合统计量,然后计算各研究的结合统计量,并用其在定性Meta 分析中所得分数去权重它的综合统计量;计算各级别研究中的加权平均综合统计量(在平均过程中,要根据其各结合统计量的方差进行权重) ;做各级别中研究间统计量的异质性检验。

Meta 方法的不同主要在于结合统计量和统计假设的不同。根据结合统计量的不同可将Meta 分析方法主要分为三类:第一类的综合统计量为效应值,它适合于测量结果为连续数据的独立研究,目前主要应用于社会科学(教育学、心理学等) 、临床医学和生态学中,它可反映一个程序或现象的效应大小和方向,它的计算公式为:d = ( Xe - Xc) / S , 其中Xe 为实验组平均值, Xc 为对照组平均值, S 最初为对照组标准差,以后多用两组共同标准差。

但不幸的是,许多文献中并不报道标准均值,省略掉了。于是Glass 提出了以最终统计量t2值、F2值或确切的P2值来转换成值。第二类主要应用于流行病学、病因学、大众健康学等医学领域中,综合统计量为相对风险度或风险度比(relative risk、risk ratio)Pe/ Pc 或风险度差( risk difference) Pe -Pc , Pe 为实验组中的风险度, Pc 为对照组中的危险度,它适合于测量结果为二元数据的独立研究。第三类为80 年代末在医学领域中发展出的回归方法,其结合统计量为药量- 反应斜率( dose - reponseslope) ,由回归方法得出的,它适合于测量结果为分类数据的独立研究;根据统计假设的不同可将Meta 分析方法分为两类:固定效应模型和随机效应模型,前者假设所有研究享有共同的真实效应大小,后者假设所有研究的真实效应大小不同,具体体现在计算所有研究平均效应的权重上,当前在医学中常用的固定效应模型为Mantel2Haenszel 法和由其改进的Peto 法,O2E 法是典型的随机效应模型。由于随机效应模型比较符合实际,得到了Meta分析家们的认可,正被广泛应用开来。

Meta 分析一个重要的目的就是要比较不同研究特点下的分析结果,如Gure2vitch 在研究竞争对生物生物量的影响时,对几个级别间的效应大小做了比较。Matthew 在做饮酒与女性乳腺发病率关系的Meta 分析时,对不同的日饮酒量与病发关系作了对比。各级别差异可用x2 来检验。

Meta 分析还对所有研究间或各级别内研究间的异质性进行检验,一般都用x2检验法,以验证假设的正确与否。

6 　报告分析结果　包括评估效应,指出研究中实验设计、数据分析等的不足并通过综合为将来这一主题的研究指明方向。最近有人用图表法来报告Meta 分析结果。

一、选题和立题

（一）形成需要解决的临床问题：

系统评价可以解决下列临床问题:

1.病因学和危险因素研究;

2.治疗手段的有效性研究;

3.诊断方法评价;

4.预后估计;

5.病人费用和效益分析等。

进行系统评价的最初阶段就应对要解决的问题进行精确描述,包括人群类型(疾病确切分型、分期) 、治疗手段或暴露因素的种类、预期结果等,合理选择进行评价的指标。

（二）指标的选择直接影响文献检索的准确性和敏感性，关系到制定检索策略。

（三）制定纳入排除标准。

二、文献检索

（一）检索策略的制定

这是关键，要求查全和查准。推荐Mesh联合free word检索。

（二）文献检索，获取摘要和全文

国内的有维普全文VIP，CNKI，万方数据库，外文的有medline ,SD，OVID等。

（三）文献管理

强烈推荐使用endnote，procite，noteexpress等文献管理软件进行检索和管理文献。

查找文献全文的途径：

在这里，讲一下找文献的过程，以请后来的战友们参考（不包括网上有电子全文的）：

1.查找免费全文：

（1）在pubmed center中看有无免费全文。有的时候虽然没有显示free full text，但是点击进去看全文链接也有提供免费全文的。我就碰到几次。

（2）在google中搜一下。

少数情况下，NCBI没有提供全文的，google有可能会找到，使用“学术搜索”。本人虽然没能在google中找到一篇所需的文献，但发现了一篇非常重要的综述，里面包含了所有我需要的文献（当然不是数据），但起码提供了一个信息，所需要的文献也就这么多了，因为老外的综述也只包含了这么多的内容。这样，到底找多少文献，找什么文献，心里就更有底了。

（3）免费医学全文杂志网站。Www.freemedicaljournals.com。提供很过超过收费期的免费全文。

2.图书馆查馆藏目录：

包括到本校的，当然方便，使用pubmed的linkout看文献收录的数据库，就知道本校的是否有全文。其它国内高校象复旦、北大、清华等医学院的全文数据库都很全，基本上都有权限。上海的就有华东地区联目、查国内各医学院校的图书馆联目。这里给出几个：

（1）中国高等院校医药图书馆协会的地址：http://server14.library.imicams.ac.cn/xiehui/chengyuan.htm，进入左侧的“现刊联目”，可以看到有“现刊联目查询”和“过刊联目查询”，当然，查询结果不可全信，里面有许多错误。本人最难找的两篇文章全部给出了错误的信息（后来电话联系证实的）。

(2)再给出两个比较好的图书馆索要文献的email地址（有偿服务），但可以先提供文献，后汇钱，当然做为我们，一定要讲信誉吆。一是解放军医学图书馆信息部：xxbmlpla@sina.com，电话：01066932429；

（3）二是复旦大学医科图书馆（原上医）：ill@shmu.edu.cn，联系人，周月琴，王蔚之，郑荣，电话，021-54237822，需下载文献传递申请表（http://202.120.76.225/ill.doc）。其他的图书馆要么要求先交开户费，比如协和（500元），要么嫌麻烦，虽然网上讲过可提供有偿服务，在这里我就不一一列出了。

3.请DXY战友帮忙，在馆藏文献互助站中发帖，注意格式正确，最好提供linkout的多个数据库的全文链接，此时为帮助的人着想，就是帮助自己。自己也同时帮助别人查文献，一来互相帮助，我为人人，人人为我。二则通过帮助别人可以积分，同时学会如何发帖和下载全文，我就感觉通过帮助别人收获很大，自己积分越高，获助的速度和机会也就相应增加。现在不少免费的网络空间（我常用爱存www.isload.com.cn），比发邮件简便很多。所以如果你求助以后，要及时去“我的论坛”中查看帖子，有的很快就把下载链接发过来了，不要一味只看邮箱。

4.实在不行，给作者发email。这里给出一个查作者email的方法，先在NCBI中查出原文献作者的所有文章，注意不要只限于第一作者，display，abstract, 并尽可能显示多的篇数，100，200，500。然后在网页内查找“＠”，一般在＠前的字母会与人名有些地方相似。再根据地址来确定是否是同一作者。

5.查找杂志的网址，给主编发信求取全文。这里我就不讲查找的方法了，DXY中有许多帖子。我的一篇全文就是这样得到的。

6.向国外大学里的朋友求助。国外大学的图书馆一般会通过馆际互借来查找非馆藏文献，且获得率非常高。我的三篇文献是通过这一途径得到的。

如果还是找不到，那就……我也没辙了，还有朋友如有其他的方法，不妨来这里交流。难度不小吧，比起做实验来如何？

三、对文献的质量评价和数据收集

（一）研究的质量评价

对某一试验研究的质量评价主要是评价试验结果是否有效,结果是什么该结果是否适用于当地人群。下面一系列问题可以帮助研究者进行系统的质量评价:

①该研究的试验设计是否明确,包括研究人群、治疗手段和结果判定方法;

②试验对象是否随机分组;

③病人的随访率是否理想及每组病人是否经过统计分析;

④受试对象、研究人员及其它研究参与者是否在研究过程中实行“盲法”;

⑤各组病人的年龄、性别、职业等是否相似;

⑥除进行研究的治疗手段不同外,其它的治疗是否一致;

⑦治疗作用大小;

⑧治疗效果的评价是否准确;

⑨试验结果是否适用于当地的人群,种族差异是否影响试验结果;

⑩是否描述了所有重要的治疗结果;

治疗取得的效益是否超过了治疗的危险性和费用。系统评价者应根据上述标准进行判断,不满足标准的文献应剔除或区别对待(数据合并方法不同) ,以保证系统评价的有效性。

(二)、数据收集

研究者应设计一个适合本研究的数据收集表格。许多电子表格制作软件如Excel 、Access ,和数据库系统软件如FoxPro 等,可以用于表格的制作。表格中应包括分组情况、每组样本数和研究效应的测量指标。根据研究目的不同，测量指标可以是率差、比数(odds) 、相对危险度( relative risk ,包括RR 和OR) 。各研究间作用测量指标不一致,需转化为统一指标。常用的统一指标是作用大小( Effect Size , ES) ,ES 是两比较组间作用差值除以对照组或合并组的标准差。ES 无单位是其优点。

(三)、数据分析

系统评价过程中,对上述数据进行定量统计合并的流行病学方法称为Meta分析(Meta analysis) 。Meta 意思是more comprehensive ,即更加全面综合。

通过 Meta分析可以达到以下目的:

1. 提高统计检验效能; 2.评价结果一致性,解决单个研究间的矛盾;3.改进对作用效应的估计; 4.解决以往单个研究未明确的新问题。

统计分析的指标

（一）、异质性检验

1.检验原理：

meta 分析的原理首先是假定各个不同研究都是来自非同一个总体(H0:各个不同样本来自不同总体，存在异质性,备择假设H1，如果p>0.1，拒绝H0,接受H1,，即来自同一总体)这样就要求不同研究间的统计量应该接近总体参数真实值,所以各个不同文献研究结果是比较接近,就是要符合同质性,这时候将所有文献的效应值合并可以采用固定效应模型的有些算法,如倒方差法,mantel haenszel 法,peto法等.

2.分类：

异质性检验，包括三个方面：临床异质性，统计学异质性和方法学异质性，作meta分析首先应当保证临床同质性，比如研究的设计类型、实验目的、干预措施等相同，否则就要进入亚组分析，或者取消合并，在满足临床同质性的前提下（非常重要，不能一味追求统计学同质性，首先考虑专业和临床同质性），我们进一步观测统计学同质性。

临床异质性较大时不能行meta分析,随机效应模型也不行.只能行描述性

系统综述（systemic reviews,SR）或分成亚组消除临床异质性.解决临床异质后再考虑统计学异质性的问题.

如果各个文献研究间结果不存在异质性（p>0.1），选用固定效应模型（fixed model），这时其实选用随即效应模型的结果与固定效应模型相同；如果不符合同质性要求,即异质性检验有显著性意义(p<0.1),这时候固定效应模型的算法来合并效应值就是有偏倚,合并效应值会偏离真实值.所以,异质性存在时候要求采用随机模型,主要是矫正合并效应值的算法,使得结果更加接近无偏估计,即结果更为准确.

此外,这里要说明的是,采用的模型不同,和合并效应值的方法不同，都会导致异质性检验P值存在变动,这个可以从算法原理上证明,不过P值变动不会很大,一般在小数点后第三位的改变.

异质性检验的Q 值在固定模型中采用倒方差法和Mantel-haenszel法中也会不同。

随机效应模型是不需要假定各个研究来自同一个总体为前提，本来就是对总体参数的近似无偏估计，这个与固定模型不一样（必须要同质为基础），所以随机模型来作异质性检验简直是“画蛇添足”，无奈之举！

因此，随机模型异质性检验是否有统计学意义都是可以用，而固定模型必须要求无异质性。可以证明和实践，如果无异质性存在的时候，随机模型退化为固定，即固定模型的结果于随机模型的合并效应值是相等的

http://www.dxy.cn/bbs/actions/archive/post/5942183_0.html

目前,国内外对meta分析存在异质性,尤其是异质性检验P值很小的时候（具体范围我不清楚，是0.05～0.1吗？请版主补充）,学术界有着不同的争论,很多人认为这个时候做meta分析是没有意义,相当于合并了一些来自不同总体的统计结果,也有人认为,这些异质性的存在可能是由于文献发表的时间,研究的分组,研究对象的特征等因素引起,只要采用亚组分析或meta回归分析可以将异质性进行控制或解释,还是可以进行meta分析,至少运用随机效应模型可以相对无偏的估计总体.这里要强调的是,异质性检验P值较小时候,最好能对异质性来源进行分析和说明。合理进行解释，同时进行亚组分析，相当于分层分析，消除混杂因素造成的偏倚（bias）。

3. 衡量异质性的指标

一个有用的定量衡量异质性的指标是I2，I2 = [(Q - df)/Q] x 100%，此处的Q是卡方检验的统计值，df 是其自由度（Higgins 2003, Higgins 2002)。这个I2值代表了由于异质性而不是抽样误差（机会）导致的效应占总效应估计值的百分率。 I2值大于50％时，可以认为有明显的异质性。

参考http://www.dxy.cn/bbs/actions/archive/post/5937485_0.html

（二）、敏感性分析：

1.敏感性分析的含义：

改变纳入标准（特别是尚有争议的研究）、排除低质量的研究、采用不同统计方法/模型分析同一资料等，观察合并指标（如OR,RR）的变化，如果排除某篇文献对合并RR有明显影响，即认为该文献对合并RR敏感，反之则不敏感，如果文献之间来自同一总体，即不存在异质性，那么文献的敏感性就低，因而敏感性是衡量文献质量（纳入和排除文献的证据）和异质性的重要指标。

敏感性分析主要针对研究特征或类型如方法学质量，通过排除某些低质量的研究、或非盲法研究探讨对总效应的影响。（王吉耀第二版P76中）

“排除某些低质量的研究，再评价，然后前后对比，探讨剔除的试验与该类研究特征或类型对总效应的影响”。（王家良第一版八年制P66、154）

敏感性分析是从文献的质量上来归类，亚组分析主要从文献里分组病例特征分类。

敏感性分析是排除低质量研究后的meta分析，或者纳入排除研究后的meta分析。

亚组分析是根据纳入研究的病人特点适当的进行分层，过多的分层和过少的分层都是不好的。

例如在排除某个低质量研究后，重新估计合并效应量，并与未排除前的Meta分析结果进行比较，探讨该研究对合并效应量影响程度及结果稳健性。若排除后结果未发生大的变化，说明敏感性低，结果较为稳健可信；相反，若排除后得到差别较大甚至截然相反结论，说明敏感性较高，结果的稳健性较低，在解释结果和下结论的时候应非常慎重，提示存在与干预措施效果相关的、重要的、潜在的偏倚因素，需进一步明确争议的来源。

2.衡量方法和措施

其实常用的就是选择不同的统计模型或进行亚组分析，并探讨可能的偏倚来源，慎重下结论。

亚组分析通常是指针对研究对象的某一特征如性别、年龄或疾病的亚型等进行的分析，以探讨这些因素对总效应的影响及影响程度。

而敏感性分析主要针对研究特征或类型如方法学质量，通过排除某些低质量的研究、或非盲法的研究以探讨对总效应的影响。

建议可以看参考王吉耀主编，科学出版社出版的《循证医学与临床实践》。

敏感性分析只有纳入可能低质量文献时才作，请先保证纳入文献的质量！纳入文献的质量评价方法，如果是RCT，可选用JADAD评分。如果病因学研究，我认为使用敏感性分析是评价文献质量（前提是符合纳入标准）的较为可行的方法。

敏感性分析是分析异质性的一种间接方法。

有些系统评价在进行异质性检验时发现没有异质性，这时还需不需要作敏感性分析？

我的看法是需要，因为我觉得异质性也是可以互相抵消的，有时候作出来没有异质性，但经过敏感性分析之后，结果就会有变化。

（三）对入选文献进行偏倚估计

发表偏倚（publication bias)评估（包括作漏斗图，和对漏斗图的对称性作检验）。可以用stata软件进行egger检验。

人是活的，软件是死的，临床是相对的，统计学是绝对的。

四、总结：

（一）结果的解释

Meta-分析结果除要考虑是否有统计学意义外，还应结合专业知识判断结果有无临床意义。若结果仅有统计学意义，但合并效应量小于最小的有临床意义的差值时，结果不可取；若合并效应量有临床意义，但无统计学意义时，不能定论，需进一步收集资料。不能推荐没有Meta-分析证据支持的建议。在无肯定性结论时，应注意区别两种情况，是证据不充分而不能定论，还是有证据表明确实无效。

（二）结果的推论

Meta-分析的结果的外部真实性如何？在推广应用时，应结合该Meta-分析的文献纳入/排除标准，考虑其样本的代表性如何，特别应注意研究对象特征及生物学或文化变异、研究场所、干预措施及研究对象的依从性、有无辅助治疗等方面是否与自己的具体条件一致。理想的Meta-分析应纳入当前所有相关的、高质量的同质研究，无发表性偏倚，并采用合适的模型和正确统计方法。

（三）系统评价的完善与应用

系统评价完成后,还需要在实际工作中不断完善,包括: ①接受临床实践的检验和临床医师的评价; ②接受成本效益评价; ③关注新出现的临床研究,要及时对系统评价进行重新评价。临床医师只有掌握了系统评价的方法,才能为本专业的各种临床问题提供证据,循证医学才能够顺利发展。

Meta 分析的优点和不足

3. 1 　优点

在Meta 分析正式出现之前,已经有两种综合方法。第一种为传统的描述性综述。它有两个基本缺点,首先,它并未用任何系统方法来对所综述内容的原始数据进行收集、综合,而且综述者在综述过程中往往主观性太强,过分依赖自己的实验结果,常反映自己的观点,所以不同的综述者会得出不同的综述结果[37 ] 。第二,综述者并未将文献定量综合,所以当所研究实验数量不断增加时,得出错误结论的机率也随之增加。第二种为数表决法(vote - count2ing、box - score analysis) 。它是最简单的定量综合方法。综述者往往将要综合的实验研究按统计结果的不同分为三类:在一个方向上统计检验显著;在反方向上统计检验显著;统计检验不显著。然后采取投票表决方式,数量最多的一类被认为具有代表性,反映近似真实结果。此方法没有考虑综合的各实验研究的样本大小和效应大小,是一种简单的举手表决法,不具有统计性质,也有失科学性。

与上述两种方法比较,Meta 分析设计较严密,有明确的选择文献标准;系统地考虑了研究的方法、结果测量指标、分类、对象对分析结果的影响;给出了测量指标(结合统计量) ,提供了一种定量估计效应程度的机理,分析结果较前二者客观性强,具有科学性;提高了文献的综合统计能力;现代Meta 分析考虑了独立研究的质量问题。

3. 2 　Meta 分析的不足

目前有关Meta 分析的不足可归纳为:

3. 2. 1 　发表偏见　几乎所有作者及编辑都有更愿意报道统计检验显著结果的趋向,所以综述者被限于在发表物中综合独立研究结果,有可能导致效应大小的高估计。在一项调查中,58 名工作者说他们共做了921 个随机对照实验, 96 个( 10.42 %) 未发表,且正效应结果明显比负效应结果更易于发表 ;再者,已发表论文所用的实验方法也未必一定好于未发表者。为了克服这一缺点,现在Meta 分析者在搜集资料时既包括了已发表物,也包括未发表物。但有人反对这样做。

3. 2. 2 　发表物中缺少综述者所需数据　在实践中,有许多已收集的文献,由于对最初实验结果的有选择性报道、错误的分析、对原始数据描述不完整等原因而不能被利用,大大降低了Meta 分析的综合能力。

3. 2. 3 　不对等比较,也有人称为“桔子与苹果问题”　许多学者指出各研究的对象、结果测量指标不同会影响最终分析结果,好象将桔子与苹果拿来比较一样,很难得出正确的结论。但也有人认为扩大总体概念会提高综合能力, 结论更具实用性。Peto 指出为解决同一问题而进行的实验, 其综合结果具有相同的方向。

3. 2. 4 　综述对象最初数据质量不等　如果在分析时对这些质量不等的研究给予相同的结合标准,必然会导致分析结果的不准确,为了克服这一问题,分析家们提出了定性Meta 分析。

3. 2. 5 　综述者对综合结果的解释有偏见。

3. 2. 6 　不可避免的非随机性选择独立研究　因为统计显著性检验要求样本是从遵循一定分布规律的总体中取样得来,所以非随机选取研究和对同一数据进行多次检验(重复报道部分或全部数据或者用同一作者的多个结果) 都是违反上述假设的。但事实上,前5 个问题是所有综述方法的共同弊病,但在描述性综述和数表决法中它们隐藏了起来,并未直接暴露出来,而在Meta 分析中却把它们显露无遗。我们已经看到这样一个事实,Meta 分析正在逐步努力克服这些问题,而且已经取得了可喜的进展。但是再好的Meta 分析也不能代替独立研究,它们是Meta 分析的基础。综上所述,Meta 分析作为一种结合独立研究的统计学方法,具有传统综述不可比拟的优越性,它在这短短20 年中的迅猛发展是最好的一个见证。

关于丁香通

公司信息

个人用户

企业机构

无忧采购轻松科研

提问

扫一扫

实验小助手

扫码领资料

反馈

TOP

打开小程序