求助各位meta吃鸡大神亚服排行榜，我做亚组分析后异质性比总

点击联系发帖人 时间：2018-02-12 06:04

单组率meta分析

670被浏览31,441分享邀请回答Clinicaltrial.gov的研究）；是否考虑有相关数据的会议论文等。其次，我们得确定是否某个方向的结果被掩盖（如阴性结果的研究未被发表，使得meta分析结果倾向于阳性）。漏斗图可在一定程度上检测这种偏倚是否存在。假如漏斗图发现有发表偏倚，我们还需看这是由小样本研究引起还是由纳入研究质量差所引起，还是无法判断。如果是小样本研究比较多的话，对于使用固定效应模型的meta分析，其实是没有影响的。因为小样本研究在固定效应模型的meta分析中，占比重小，对结果影响小。而使用随机效应模型的meta分析，对于每个研究的权重上，添加了异质性，使得其小样本研究相对于固定效应模型的小样本研究，比重增加，可能会对结果有影响。所以有必要做敏感性分析，看随机效应模型跟固定效应模型的结果是否有显著不同，是的话，随机效应模型的结果就很可能有偏差了。假如是纳入质量比较低的研究偏向了一边，那么用最终的结果很可能是有偏倚的。此时可以做敏感性分析，把低研究质量的研究剔除后，做新的meta分析，与之前的meta分析对比，看低文献质量的研究是否对结果影响很大。是的话，最终结果就不能用包含了低质量研究的meta分析结果了。如果排除了小样本研究及文献研究质量低带来的影响，那么我们在讨论的时候得提到发表偏倚存在，结果应用要谨慎了。2.
真实性首先，我们得确定我们得到的原始研究的数据反映了真实的疗效情况，即需文献质量评价。临床研究如没有满足某些流程（如RCT随机化不佳），会使得我们得到的估计值偏离了临床真实的效果。RCT的评价推荐使用Cochrane Risk of bias工具，而不是Jadad。有研究对165篇RCT进行评价，发现用Jadad时有40篇RCT为高质量研究，用Cochrane工具仅2篇RCT为高质量研究。Jadad不足之处，请见引文（Jo JK et al. Randomized Controlled Trials in Endourology: A Quality
Assessment. Journal of Endourology. 55-1060）或Cochrane
Handbook。这里我们评价的是，是否存在偏倚风险，而不是具体有没有进行该项操作。例如操作者与参与者没有进行盲法，他们都知道Participant用什么药，但是假如我们考察的是死亡率这个指标，因为一般他们都不知道哪个药会影响死亡率，所以在盲法上，这个研究对于死亡率这个结局指标而言是低偏倚风险的。其次，我们发现文献质量不佳时，我们得估计偏倚的大小及方向，估计其对结果的影响。有一些Meta-Meta-Analysis考察不同的偏倚风险对结果影响何如，例如有研究发现，没有使用盲法的比使用了盲法的研究得出的OR值平均要高9%，我们可以估计结果被影响的程度何如。但大多数情况下，我们也只能估计一下影响的方向。最后，我们得确定结果的样本量是否足够得到一个精确的结果，使得我们有信心下结论。完成了Meta分析后，我们得到研究结局的估计值及可信区间。我们可通过可信区间及样本量大小判断研究结果是否精确，即估计值及可信区间是否足以对研究问题下定结论。1. 可信区间是否跨过决策值Meta分析里二分类变量的结局的无效值为1（连续型变量的无效值为0）。Meta分析结果的95%置信区间跨过无效值，此时Meta分析结果不够精确，无以对研究问题下定性结论。因为在系统评价Meta分析里，我们只需要得到定性的结果判断有无，所以用的是无效值。然而我们面对的是临床问题，所以我们的判断更应是有无临床意义。而临床选择何种干预措施，除考虑临床结局外，还得考虑副作用，经济成本，可及性及患者意愿等。以氯吡格雷与阿司匹林为例，假设Meta分析结果发现氯吡格雷比阿司匹林显著减低卒中风险，OR值及其95%置信区间为0.91（0.83,0.99）。按照前面精确性的概念，因为其没有跨过无效值，该结果应该是精确的。然而，因为氯吡格雷比阿司匹林价格昂贵太多，以目前的价格，其相对于阿司匹林降低卒中风险至少0.1（举例）临床人员才愿意推荐氯吡格雷。此时Meta分析的结果包含了决策阈值0.90，所以研究结果仍然为不精确。2. 样本量大小是否合适
小样本量研究可存在抽样误差和不稳定性。小样本量的Meta分析只能分析所针对人群里的部分人群，而这部分人群可能与总人群在基线上，或者结局上会有偏差，即预后不平衡。尽管可信区间告诉我们研究效果的评估为精确，但是样本量不足够大到满足预后平衡，该可信区间不可信，即研究结果仍不精确。另外，有些小样本研究，例如某些研究问题早期的初步研究（Pilot Study），是用以考察大样本研究是否有意义以及将要进行大样本研究时的注意事项。这些小样本研究可能不成熟，会导致研究结果不稳定。尽管利用这些小样本研究得出的Meta分析结果显示为精确，但我们也会怀疑其结果的真实性。我们可以考察系统评价总病例数是否达到具有充分检验效能的常规样本量试验所需要病例数，即考察是否满足最优信息样本量。最优信息样本量是由第一类误差的概率α、第二类误差的概率β、非暴露组发病率以及暴露因素引起的相对危险度估计值四个参数决定的。
计算的网页如下3.
异质性在讲之前，我觉得得先介绍一下异质性这个概念。异质性为纳入研究间的所有差别，而这些差别可以体现在Participant,
Intervention(Comparison), Outcome & Study design这些方面。也有人把这些异质性分类为临床异质性（P,I,O）和方法学异质性（Study Design
& Risk of bias)。这比较直观，只是一个定性的过程。当然，研究间有点小差别是没有关系的，只要不影响我们对结果的判断就没有问题。我们需要一些定量的判断，看Meta分析结果是否被研究之间的差别所影响，我们可以使用统计学的方法估计异质性大小如何，这为统计学异质性。我们得确定我们要合并的数据，是否足够同质，可合并。首先，看纳入文献的基本特征在PICOS上是否有显著差别。差别不大，则可忽略。差别稍大，但我们为了看平均效果，可用随机效应模型；差别特大，我们不应合并。例如，我们发现某种干预措施A与安慰剂相比，对于年轻，中年，老年人有不同的疗效。此时，假如我们考虑的是A对中年人的疗效，那么年轻人，老年人的研究我们就可能需要排除。假如我们考虑的是A对大多数人平均疗效，如果他们之间的差别没有太大，或者方向没有差别（都比安慰剂好，或都比安慰剂差），我们是可以忽略他们的差别，应用随机效应模型，给出A对总体人群的平均作用。假如我们考虑的是A对大多数人平均疗效，那么如果他们之间的疗效方向有差别（有部分比安慰剂好，另一部分比安慰剂差），或者方向一致但差别很大，我们给出的A对总体人群的平均作用是没有意义的。其次，看统计学异质性。使用Q或P值，确定是否有显著异质性。使用I方及T值，评价异质性大小。统计学发现了显著异质性，第一步，确保纳入排除标准及数据提取没有问题。第二步，利用亚组分析，meta回归或敏感性分析，尝试解释异质性。第三步，看纳入的研究异质性有多大，我们该忽视它们之间的差别，还是要剔除某些研究。当然，统计学上没有发现异质性，不代表研究没有异质性。异质性还受精确度影响。所有研究都不精确，95%置信区间都很大，相互覆盖，尽管他们真值有差别，但是统计学是检测不出这些差别的。此时，我们还得根据纳入的文献的基本特征来分析可能存在的异质性。建议感兴趣的童鞋们细读Cochrane
Handbook及Introduction to Meta-Analysis里。关于临床人士怎么看meta分析结果，建议看GRADE证据质量分级。丰富了下内容，精炼了下文字，文绉绉版的文章已发表，这里不再更新了。才疏学浅，勿喷勿喷...15228 条评论分享收藏感谢收起734 条评论分享收藏感谢收起系统评价与Meta分析Systematic Review and Meta-analysis问题的提出对上述结果，是不是难以判断并选择？?有没有一套规范、科学的方法全面收集、认真选择、严格评价和科学分析相关研究资料，得出综合可靠的结论？?目前有，且发展中…系统评价Meta分析什么是系统评价？系统评价是一全新的文献综合评价临床研究方法，其基本过程是以某一具体临床问题为基础，系统、全面地收集全世界所有已发表或未发表的临床研究结果，采用临床流行病学严格评价文献的原则和方法，筛选出符合质量标准的文献，进行定性或定量合成，去粗取精，去伪存真，得出综合可靠的结论。同时，随着新的临床研究结果的出现进行及时的更新。Meta分析Systematic review (SR)Systematic review (SR)“A summary of the medical literature that uses explicit methods to perform a thorough literature search and critical appraisal of individual studies and that uses appropriate statistical techniques to combine these valid studies.”--David Sackett等 2000
什么是Meta 分析？?Meta分析的前身源于1920年Fisher提出的“合并P值”的思想，1955年由Beecher首次提出初步概念。 ?1976年心理学家Glass进一步按照其思想发展为“合并统计量”，即将合并统计量对文献进行综合分析研究的这类方法称之为Meta分析。?20世纪80年代中期开始，Meta分析逐步被引入到临床随机对照试验以及观察性的流行病学研究中。A systematic review that uses quantitative methods to summarize the result.运用定量的方法汇总多个研究结果的系统评价方法。－－－《Evidence-based Mdicine》 2000Meta analysis is statistical technique for assembling the results of several studies in a review into a single numerical estimate.Meta分析是将系统评价中的多个不同结果的同类研究合并为一个量化指标的统计学方法。－－－《The Cochrane Library》Meta分析的应用? 干预措施的评价－－估计预防、治疗、康复的效果和风险 ? 诊断性试验－－提供更为可靠的诊断性试验精确性计算 ? 流行病学－－提供更为可靠的病因，危险因素的估计系统评价与Meta分析的关系?? ?系统评价并非必须对纳入研究进行统计学合并（Meta分析）是否做Meta分析需要视纳入研究是否有足够的相似性 Meta分析也并非一定要做系统评价，因为其本质是一种统计学方法包含有对具同质性的多个研究进行Meta分析的系统评价称为定量系统评价如果纳入研究不具有同质性，则不进行Meta分析，而仅进行描述性的系统评价，此类系统评价称为定性系统评价??循证医学（Meta 分析）中的统计相关内容资料类型?数据资料分为数值（计量）资料和分类（计数和等级）资料两大类，统计指标因而也分为数值资料指标和分类资料指标。统计指标可用于统计描述性分析，也是反映数据资料基本特征的最基本的统计分析方法。使人们准确、全面了解数据资料所包含的信息，以便于在此基础上进一步完成资料的统计分析。如均数，（发病/死亡）率，OR，RR等。?可信区间?可信区间（confidence intervel,CI）按预先给定的概率（1a,常取95%或99%）去估计未知总体参数的可能范围。? 可信区间的计算主要与标准误有关，标准误愈小，抽样误差愈小，可信区间的范围就窄，用样本指标估计总体参数的可靠性就愈好；?可信区间主要用于估计总体参数，从获取的样本数据估计某个指标的总体值，如均数的可信区间可用来估计总体均数，率的可信区间可用来估计总体率。还可以用于假设检验。尤其是试验组与对照组某指标的差值或比值的可信区间，在循证医学中更为常用。 ?通常试验组与对照组某指标的差值或比值的95%可信区间与a为0.05的假设检验等价， 99%可信区间与a为0.01的假设检验等价。分类资料的指标1. EER与CER在循证医学预防和治疗性试验中，率可细分为EER与CER两类。 EER（experimential event rate）―试验组中某事件的发生率,如对某疾病采取某些治疗措施后该疾病的发生率。例如：某医师研究了阿司匹林治疗心肌梗死的效果EER=a／n1 =15 ／125=12%分类资料的指标CER （control event rate）―对照组中某事件的发生率,如对某疾病不采取某些治疗措施的发生率。例如：某医师研究了阿司匹林治疗心肌梗死的效果CER=c／n2 =30／120=25% 当n足够大，如n＞100，且样本率p与1- p均不太小，且np 与n(1-p)均大于5时，可用下式求总体率的1-a可信区间率的可信区间：p±uaSE 率的标准误：SE=√p(1-p) ／n分类资料的指标2. 率差（RD）及可信区间在疾病的病因、治疗及预后试验中，常用发生率来表示某事件的发生强度，两个发生率的差即为率差，也称危险度差（rate difference, risk difference ,RD），其大小可反映试验效应的大小，其可信区间可用于推断两个率有无差别。两率差的可信区间由下式计算：两率差的可信区间：(p1- p2) ±uaSE 两率差的标准误：SE (p1- p2)=√ p1(1- p1) ／n1+ p2(1- p2) ／n2分类资料的指标2. 率差（RD）及可信区间 ?两率差为0时，两组的某事件发生率没有差别，而两个率差的可信区间不包含0（上下限均大于0或上下限均小于0 ），则两个率有差别。 ?反之，两个率差的可信区间包含0，则无统计学意义。分类资料的指标2. 率差（RD）及可信区间前述阿司匹林治疗心肌梗死的效果 CER=25%，EER=12% SE (p1- p2) =0.049 (p1- p2) ±uaSE=（-0.23，-0.03）该例两率差的可信区间为（-0.23，-0.03），上下限均小于0 （不包含0），两率有差别。阿司匹林治疗心肌梗死的病死率EER=12%，对照组的病死率CER=25%。结论：阿司匹林可降低心肌梗死的病死率。分类资料的指标3.相对危险度（RR）及可信区间是前瞻性研究中较常用的指标，它是试验组（暴露组）的某事件发生率p1与对照组（非暴露组）某事件发生率p0之比。用于说明前者是后者的多少倍，也常用来表示暴露与疾病联系的强度及其在病因学上的意义大小。分类资料的指标RR计算的四格表试验组的发生率： p1= a／(a+b)= r1／n1 =EER对照组的发生率： p0= c／(c+d)= r2／n2 =CERRR= p1 ／ p0 =EER／CER如何解释？若p1和p0是死亡率、病死率、患病率等不利结局指标时：? ? ?RR＝1，表示试验因素与结局无关； RR≠1，表示试验因素对结局有影响。当RR＞1时，表示试验因素是结局的有害因素，且RR越大，试验因素对结局的不利影响越大；?当RR＜1时，试验因素是结局的有益因素，且RR越小，试验因素对结局的有益作用就越大；分类资料的指标若p1和p0是有效率、治愈率等有利结局指标时： ?RR＝1时，表示试验因素与结局无关； ?RR≠1表示试验因素对结局有影响。 ?当RR＞1时，表示试验因素是结局的有益因素，且RR越大，试验因素对结局的有益作用就越大； ?当RR＜1时，表示试验因素是结局的有害因素，且RR越小，试验因素对结局的有害作用越大；分类资料的指标?RR的可信区间，应采用自然对数进行计算，即应求RR的自然对数值R （RR）和R（RR）的标准误SER（RR），其计算公式如下：分类资料的指标前述阿司匹林治疗心肌梗死的效果阿司匹林治疗组病死率p1= 15／125 对照组病死率p0= 30／120 其RR和可信区间为：该例RR的95%可信区间为：（0.272，0.846），该区间小于1，可以认为阿司匹林可降低心肌梗死的发生率。分类资料的指标4. OR及可信区间回顾性研究（如病例对照研究）往往无法得到某事件的发生率CER或EER（如死亡率、病死率、发病率），也就无法计算出RR。但当该发生率很低时（如发生率小于或等于5%），可以计算出一个RR的近似值，该近似值称为OR，即比值比（odds ratio）。分类资料的指标OR计算的四格表4. OR及可信区间分类资料的指标4. OR及可信区间分类资料的指标4. OR及可信区间在前瞻性研究中，当所研究疾病的发病率、病死率等发生率较低时(比如P≤5%)，即a和c均较小时，OR 与RR的计算结果非常近似，此时也可用OR估计RR，且该事件发生率越低其近似结果越好。分类资料的指标4. OR及可信区间前述阿司匹林治疗心肌梗死的效果：其OR和可信区间为：该例OR的95%可信区间为：（0.207，0.807），该区间小于1，可以认为阿司匹林可降低心肌梗死。数值资料的指标? 描述数值变量资料平均水平的常用指标有：均数（mean）或称算术平均数（arithmetic mean）中位数（median）几何均数（geometic mean）等； ? 描述数值变量资料离散程度的常用指标有：标准差（standerd deviation）四分位数间距（quartile）变异系数（coefficient of variation）等；数值资料的指标数值资料的指标?目前循证医学中的数值资料统计分析方法主要是建立在正态分布的基础之上，对非正态分布资料的统计分析方法尚在发展和完善中。数值资料的指标?两均数差（MD）及CI两个均数差的CI可用于两个均数的比较，两个均数之差等于0时为无统计学意义。如果两个均数差的CI不包含0（上下限均大于0或上下限均小于0），则两个均数之差有统计学意义；反之，两个均数差的CI包含0，则无统计学意义。??? Meta分析中合并统计量的选择? 计数资料（二分类变量）可选择OR，RR，RD作为合并效应量，用于描述多个研究的合并结果，其结果的解释与单个研究指标相同。? 计量资料（数值变量）可选择WMD，SMD作为合并效应量。 WMD为两均数的差值，消除了多个研究间的绝对值大小的影响，以原单位较好的反映了实验效果。SMD为两均数的差值再除以合并标准差的商，适用于单位不同或均数相差较大的资料的汇总分析。系统评价和Meta分析概述
Meta analysis的原理和基本思想在用样本信息推断总体参数时，是存在抽样误差的，并且抽样误差的大小与样本量的大小有关。统计学用抽样分布的理论来描述样本统计量的变化规律。基本原理?从一个均数为1.5，标准差为0.7的正态总体中进行随机抽样，样本量分别为20，50，100，200，300，500，1000，不同的样本量均进行20次抽样，共得到140个样本。?分别计算每个样本的均数。
基本原理?用方差分析的方法对不同的样本所对应的总体均数是否相等进行检验，方差分析的结果为F=0.862,P=0.878。?说明140个样本对应的总体均数是相同的。?用这140个样本的信息来估计总体的均数和标准差，?=1.501,?=0.699。这样做的结果是提高了估计的精度。基本原理（理想状态）把不同研究者对相同问题进行的研究看作是从同一总体中进行抽样得到的一个随机样本，如果他们都是按照相同的设计得到的研究结果，并且我们可以获得每一项研究的结果，这样就可以根据上面的原理得到一个更为可靠的综合的结果。系统评价的流程（步骤和方法）一、确定题目，撰写方案? 明确研究目的≯干预、诊断措施评价，危险因素研究，卫生决策? 确定题目? 提出的问题应该有清晰明确的定义（PICO_S）≯受试者是什么人?Participants ≯干预措施是什么?Interventions ≯比较的是什么?Comparison ≯临床结局是什么?Outcomes ≯研究设计是什么?Study? 撰写研究方案二、检索文献原则：多途径、多渠道、最大限度收集相关文献C1检索电子数据库(系统评价＆原始研究) C2查阅相关实践指南C3咨询相关领域的专家 C4查阅近期相关会议的文摘 C5问讯医药公司开展的相关研究 C6手检主要的、相关的专业期刊C7检索进行中的临床试验注册库注意未正式发表“灰色文献” （grey literature）―― 可能包含阴性研究结果C8查阅相关系统评价与原始研究的参考文献电子数据库语种中文数据库名称 ① ② ③ ④ ⑤ 中国生物医学文献数据库（CBMDisc）中文生物医学期刊文献数据库（CMCC）中国期刊全文数据库（CNKI）中文科技期刊全文数据库（VIP）万方数据库英文① ② ③ ④ ⑤ ⑥MEDLINE@OVID，《MEDLINE网络数据库》 PubMed《世界医学文献数据库》 EMBASE OVID电子期刊全文数据库 Cochrane Library（CENTRAL） ClinicalTrials.gov（http://www.ClinicalTrials.gov）三、筛选文献根据入选和排除标准进行仔细的筛选挑出合格的研究进行系统评价和Meta分析根据PICO_S严格纳入还要考虑? ? ?? ?发表的时间发表的语言重复发表绘制筛选文献流程图四、评价文献质量?① 内部真实性（internal validity）：指单个研究结果接近真值的程度，即受各种偏倚因素如选择偏倚、实施偏倚、失访偏倚和测量偏倚的影响情况；?② 外部真实性（external validity/generalizability）：指研究结果是否可用于研究对象以外的其他人群，即结果的实用价值与推广应用的条件，主要与研究对象的特征、研究措施的实施方法及条件和结果的选择标准密切相关。偏倚的来源? 治疗、预防、康复等干预措施疗效和安全性的系统评价多数纳入RCT为主， Cochrane协作网推荐采用由相关方法学家、编辑和系统评价员共同制订的“Cochrane偏倚风险评估”工具； ? 2011年修订的诊断试验质量评价工具QUADAS-2包括4个维度，即研究对象选择、诊断试验、金标准及诊断试验和金标准进行的流程和时序，分别从偏倚风险和适用性进行评估；
? 非随机研究的设计方案有多种如非随机对照试验、队列研究和病例-对照研究等，受偏倚影响情况也有差别，因此尚无一种通用的非随机研究偏倚评价工具。? “Newcastle-Ottawa Scale（NOS）”已被Cochrane协作网的非随机研究方法学组用于培训中，只包括8个条目，简单易用，分别针对病例-对照研究和队列研究。五、提取数据在阅读全文提取数据前要精心设计数据提取表，以保证重要、有意义的信息和数据不被遗漏，否则反复修改提取表和反复提取信息会增加不必要的工作量。不同题目的系统评价需要提取的数据信息不尽相同，要充分反映研究问题的独特性，但有些基本信息是一致的。??提取的主要内容：?? ???一般资料(试验名称、第一作者、发表时间、研究地点、出处等) 质量资料(随机、盲法、随访等) 基线资料 (年龄、性别、严重度、病程等) 干预措施资料(治疗方法、剂量、疗程，对照措施等) 结局资料(死亡、残废、事件数等)
Meta分析的常用软件六、分析和报告结果1. 2. 3. 4. 5. 6.计算每个研究的效应量计算每个研究的方差及权重计算合并效应量异质性检验合并效应量的可信区间合并效应量的检验Meta分析的目标?weighted average（加权后的平均值---合并效应量）sum of (effect ? weight ) ?TiWi Weighted average ? ? sum of weights ?Wi?加权平均效应---合并效应量的可信区间1．单个研究的统计量? 根据资料类型选择单个研究的统计量dj：C(1)分类变量可选择的统计量? 比值比，OR (odds ratio) ? 相对危险度，RR (relative Risk) ? 率差（绝对危险度），RD（rate difference）C(2)数值变量可选择加权均数差(WMD)或标准化均数差(SMD)为统计量。? 用于描述单个研究的实验结果，其结果解释与常规统计描述指标相同。常用的统计量（效应量）及其概率分布统计量两个样本均数的差值 OR RR 相关系数 r 取变换取对数 ln(OR) 取对数 ln(RR) 1? r z ? 0.5ln( ) 1? r 相应的分布服从(或近似服从)正态分布近似服从正态分布近似服从正态分布近似服从正态分布服从正态分布 RD 近似服从正态分布线性回归 b 两个率的差值 RD=P1－P2 要求 P1 和 P2 都较大时2．单个研究的方差和权重? 方差：根据资料类型选择单个研究的统计量Ti 的方差Var(Ti) C 方差可用于可信区间的计算和假设检验?权重：反映单个原始研究对效应合并的贡献?合并效应量（加权平均效应）的计算：Weighted average ? sum of (effect ? weight ) ?TiWi ? sum of weights ?Wi3．异质性检验与异质性分析异质性检验（heterogeneity test）?异质性分3类：① 临床异质性（clinical heterogeneity），指不同研究中研究对象、干预措施或暴露因素和结果测量等存在的差异；??② 方法学异质性（methodological heterogeneity），指试验设计和质量在不同研究中存在的差异； ③ 统计学异质性（statistical heterogeneity），指不同研究中效应指标存在的差异，是临床异质性和方法学异质性导致的结果。???统计学异质性（Statistical heterogeneity）不同研究间效应的变异超过了随机误差本身所致的变异。基于数据计算的结果！！！? ??用Chi-square（x2）检验 Wi为第i个研究的权重；Ti为第i个研究的效应量； T 为所有纳入研究的平均效应量。根据P值进行判断Q ? ?Wi (Ti ? T )2??P&0.10认为没有异质性 P&0.1认为有异质性?注意：P值为定性判断，只能说有无异质性，不能反映异质性的大小。?I2：异质性的定量分析Q-df I= Q2?? ??Q is the chi-squared statistic（卡方统计量） df is the degrees of freedom（自由度） I2值从0%至100%，0%时无异质性，I2值越大，异质性越大； I2描述的是：由各研究所致而非抽样误差所引起的变异（异质性）占总变异的百分比。How much is too much heterogeneity？?一般说来，用I2=25%，或50%，或75%将异质性划分为低，中，高；?但不宜机械应用；?I2大于50%可认为有实质性的异质性。Meta分析中异质性的处理方法异质性的处理解释合并检验异质性忽略异质性Meta回归亚组分析随机效应模型有异质性不合并固定效应模型P&0.1 或 25% ＜I2＜50%P&0.1，或 I2≤25%4．多个实验效应的合并? 将多个独立研究的结果合并（或汇总）成某个单一的效应量（ effect size ）或效应尺度（ effectmagnitude ），即用某个指标的合并统计量，以反映多个独立研究的综合效应。合并统计量的两种统计模型?固定效应模型( fixed effect model)：?若多个研究具有同质性（无异质性）时，可使用固定效应模型。?随机效应模型(random effect model )：?若多个研究不具有同质性时，先对异质原因进行处理，若异质性分析与处理后仍无法解决异质性时，可考虑使用随机效应模型。All observed dispersion reflects sampling error, and study weights are assigned with the goal of minimizing this withinstudy error. The summary effect is our estimate of this common effect size.Study weights are assigned with the goal of minimizing both sources of variance. The summary effect is our estimate of the mean of these effects.Meta分析方法一览表资料类型合并统计效应指标 RevMan软件中的统计学模型固定效应模型二分类计数资料比值比（OR） Mantel-Haensze（M-H） inverse variance（IV）随机效应模型D-L法Peto危险比（RR） Mantel-Haensze（M-H） inverse variance（IV） Mantel-Haensze（M-H） inverse variance（IV）D-L法D-L法危险差（RD）连续计量资料权重均数差（WMD）标化均数差（SMD）inverse variance（IV）inverse variance（IV）D-L法D-L法5、合并效应量的检验? 用假设检验 (hypothesis test )的方法检验多个独立研究的总效应量（效应尺度）是否具有统计学意义，其原理与常规的假设检验完全相同。 ? 两种方法：C ①u检验（Z test）②卡方检验（Chi square test）? 根据z或(u)值或卡方值得到该统计量下概率（P）值。C 若P≤0.05，多个研究的合并效应量有统计学意义； C 若P＞0.05，多个研究的合并效应量没有统计学意义。6、合并效应量的可信区间? 可信区间(confidence interval，CI)C 是按一定的概率估计总体参数 (总体均数、总体率)所在的范围(区间) ，如：95% 的CI，是指总体参数在该范围(区间) 的可能性为95%。?可信区间主要用于估计总体参数和假设检验。C 在Meta分析中，常用可信区间进行假设检验，95%的可信区间与?为0.05的假设检验等价，99%的可信区间与?为0.01的假设检验等价。? 此外，森林图即是根据各个独立研究的95%可信区间及合并效应量的的95%可信区间绘制的。Meta分析中的倒方差方法举例介绍
Intervention ControlEvent aiciNo Event bidiTotal n1in2i
(Sir Richard) Peto Method?????very similar to Mantel-Haenszel method (same 2x2 requirement) ? 对于2X2表格数据，结果类似。 computationally somewhat simpler, especially to calculate the confidence interval ? 计算简单，特别是计算可信区间。 may provide biased results under some circumstances in which Mantel-Haenszel would not ? 在某些情况下，可能产生有偏倚的结果。 Best applied to RCT’s and not observational studies 最好用于RCT和非观察性研究。 Peto’s method can only be used to pool odds ratios. 仅仅用于合并OR值。随机效应模型
七、敏感性分析检查一定假设条件下结果稳定性的方法目的发现影响meta分析研究结果的主要因素解决不同研究结果的矛盾性发现产生不同结论的原因结果的阅读研究结果点估计值,其大小代表该研究在 Meta分析中的权重研究结果(线宽表示其95%CI)无效应线各个研究合并后的效应估计))图示结果：常用森林图
Meta分析的报告规范
随机对照试验Meta 分析报告QUOROM声明18 项评价标准标题题目二级标题用结构式摘要目的资料来源明确描述了临床问题列出了资料库和其他信息来源评价依据能鉴定出是否为随机对照试验(RCT) 的Meta分析或系统评价摘要评价方法结果结论描述了选择标准(即对象、干预、结局和研究设计)；详细描述了真实性评价的方法、资料提取、研究特征资料定量综合并足以允许重复纳入与排除的RCT的特征描述,定性、定量的结果(例如点估计值及可信区间) 及亚组分析对主要结果加以描述明确地描述了临床问题,干预的生物学合理性和评价的理由详细介绍信息来源(如资料库、注册库、个人档案、专家信息、机构、手工检索),对检索的限制( 年代、发表状态、发表语言等) 有纳入、排除标准(定义了对象、干预、主要结局和研究设计) 有评价标准和评价过程(例如设盲的情况、质量评价方法及评价结果)引言方法检索选择真实性评价资料提取研究特征提取过程和方法(例如独立完成、或复式进行) 描述了研究设计的类型、对象特征、干预方案、结局定义、研究来源、临床异质性评估主要效应测量指标(例如相对危险度),合并结果的方法(统计学检验与可信区间) ,缺失资料的处理、统计学异质性评价,敏感性分析和亚组分析,发表偏倚的评估提供Meta分析流程性的概括图示描述每一试验的特征(例如年龄、样本量、干预、剂量、疗程、随访期限)资料定量综合结果试验流程图研究特征资料定量综合报告入选的研究的有效性评价,给出各试验的每一处理组主要结局的简单概括性结果,提供按意向性分析(ITT) 原则计算效应大小和可信区间所需要的数据(例如四格表资料、均数和标准差、比例数) 对关键性结果进行概括,根据内外部真实性讨论临床相关性,根据得到的证据总和讨论结果,描述潜在的偏倚(例如发表偏倚),提出将来研究的线索讨论
报告偏倚及其评价报告偏倚纳入研究的完整性是影响系统评价结果和结论准确性的重要因素。??目前，纳入研究的完整性主要通过报告偏倚（reporting bias）来衡量。当一项研究成果的传播受到其自身传播性质和研究结果方向（如阴性结果）的影响导致其发表或未发表时，就产生报告偏倚。?报告偏倚的分类发表偏倚（publication bias）滞后性偏倚（time lag bias）重复发表偏倚（duplicate publication bias）发表位置偏倚（location bias）引用偏倚（citation bias）语言偏倚（language bias）结局报告偏倚（outcome reporting bias）检索文献库偏倚（database bias）纳入标准偏倚（inclusion criteria bias）筛选者偏倚（selector bias）发表偏倚定义具有统计学意义（有效）的研究结果较无统计学意义和无效的结果被报告和发表的可能性更大。产生原因医学文献中发表偏倚的问题相当严重如果Meta分析只是基于已经发表的研究结果，可能会夸大疗效，甚至得到一个虚假的疗效发表偏倚的评价漏斗图分析（funnel plots）敏感性分析（sensitivity analysis）失安全系数（fail-safe number）漏斗图是基于对干预措施效果估计准确性随样本含量增加而提高的假定设计，以每个研究干预措施效果的估计值或其对数为横坐标，以每个研究的样本量大小或标准误的倒数为纵坐标形成的散点图。漏斗图分析一般数量多、精度低的小样本研究的效果估计值广泛分布在图的底部，呈左右对称排列；而数量少、精度高的大样本研究的效果估计值分布偏上，分布范围较窄且逐渐向以合并效应量为中心的位置集中。无发表偏倚时，其图形呈对称的倒漏斗状.针灸治疗中风的49个试验的漏斗图分析（Tang TL, 1999）样本量大的研究结果集如果Meta分中在图形上析中没有偏倚，图形构成一个对称的倒置 “漏斗”；如部一个较窄的范围内果图形呈现明显的不对称，表明偏倚可能样本量小的研究结果通常分散在图形底部很宽的范围内存在漏斗图的解读存在发表偏倚时，如有些小样本且无统计学意义的研究未发表，会导致漏斗图不对称，且图形的底部有缺口。这种情况下，Meta分析计算出的合并效应量倾向于高估干预措施的效果。漏斗图不对称越明显，存在发表偏倚的可能性就越大。发表偏倚不是漏斗图不对称的唯一原因。方法学的质量不同、干预措施效果的异质性、偶然的机会性因素也可导致漏斗图不对称。???敏感性分析?Meta分析检索到一些小样本研究证据时，评价者应考虑进行敏感性分析来观察Meta分析的结果是否会发生改变，以检验是否存在与小样本研究有关的偏倚。?如当排除非多中心试验（多为小样本研究）并进行敏感性分析时，若观察到合并结果的方向改变，提示小样本研究的偏倚较大，此时需谨慎解释结果。失安全系数?失安全系数（fail-safe number）是指推翻当前合并结论或使当前合并结论逆转所需要的结果相反的研究个数。失安全系数越大，说明Meta分析的结果越稳定，结论被推翻的可能性就越小。该方法的优点是简便易行，缺点是当其本身合并效应量无统计学意义时，则不能应用。?发表偏倚的其他检验方法?Begg’s 检验、 Egger’s 检验是常见的应用于 Meta 分析定量评价其“发表偏倚”的统计检验方法。相对于通过定性判断图形是否对称来主观评价“发表偏倚” 的“漏斗图”法，这二种检验方法所得结论更为客观可靠。??Begg’ s检验以标准化的效应估计量和效应估计量的方差是否存在 Kendall’s 相关来判定“发表偏倚”是否存在，若相关性存在，认为 “发表偏倚”存在；反之，不存在。?Egger’s检验以标准化的效应估计量为应变量和效应估计量的精度（标准误的倒数）为自变量建立简单线性回归模型，经假设检验，若截距不等于零，即认为“发表偏倚”存在；反之，不能认为偏倚存在。案例分析
试验组与对照组舒张压改善值的比较计算各研究的效应值、方差和权重d ? X E ? XC2 2 ( N E ? 1) S E ? ( NC ? 1) SC S? N E ? NC ? 21 1 S ? S ?( ? ) N E NC2 d 21 w? 2 Sd各研究结果的效应值、方差和权重?合并效应值（固定效应模型）：Wd ? d ? ?Wi i i其方差为：1 Sd ? ?Wi2异质性检验H0：各研究的效应值相等。 H1：各研究的效应值不相等。计算统计量QQ ? ?Wi (di ? d )2Q=29.694, df =15, p= 0.013。 Q服从自由度为k-1的?2 分布。* W D-L法中权重 i 的计算方法（校正或调整）1 Wi ? 2 Sd ? D*2 其中 S d 为固定效应模型时效应值的方差， D为随机效应部分的方差。?? ?? ? Q ? (k ? 1) D ? max ? ? 2 ? W ? i ?? W ? ?? ? i ?W i ??? ? ? ? ? , 0? ? ? ? ? ? ? ? ?其中Wi为固定效应模型时各研究的权重，Q为异质性检验时的统计量。计算新的合并效应值?随机效应模型的合并效应值d DL ?* W ? i di * W ? i其方差为：Sd2DL1 ? * W ? i各原始研究的效应值、方差、权重、调整后的权重
什么情况下不使用Meta分析? 缺乏相关的和可靠的资料? 切记：进行分析的目的是对最佳证据的概括? 误导的资料比缺乏资料更糟糕? 缺乏合理性(没有实际意义)? 切记：进行分析的目的是帮助人们对医疗保健做决策Meta analysis的局限性? ? ? ?不能纳入全部的相关研究不能提取全部相关数据难以避免发表偏倚用于合并统计的临床终点定义常常不明确对Meta analysis的质疑? ? ??? ? ?One number cannot summarize a research field The file drawer problem invalidates meta-analysis Mixing apples and oranges Garbage in, garbage out Important studies are ignored Meta-analysis can disagree with randomized trials Meta-analyses are performed poorlyMeta-分析的质量评价? ?? ? ?? ?? ? ?文献查全率不高没有列出被排除的试验病人的特征范围、诊断标准和治疗范围不明确对资料的可合并性的检验较差对潜在偏倚的控制和检测不足统计分析不规范缺少对原始研究的质量评价未改变方法进行敏感度分析缺少对发表偏倚的检测缺少对结果应用价值的评估
赞助商链接}

淘宝游戏网