跳过主要内容

仪器变量假设,验证和估算的介绍

一种致编辑的信于2020年3月19日发表

摘要

在经济学中,工具变量法被用来在未测量的混杂存在时推断因果关系。强调与随机化的相似之处可能会增加对流行病学中潜在假设的理解。工具是一个预测暴露的变量,但条件暴露与结果没有独立关联。试验中的随机分配是理想仪器的一个例子,但仪器也可以在具有自然变化现象的观察环境中找到,例如地理变化、与设备的物理距离或医生的偏好。第四个确定假设较少受到关注,但对于估计效果的普遍化至关重要。仪器识别的组编者其中,暴露是伪随机分配的,导致未测量混杂因素的可交换性。基础假设只能部分通过经验测试,并且需要主题知识。未来使用工具的研究应仔细尝试验证所有四个假设,可能与随机性相平行激动。

出身背景

暴露的随机分配确保未测量的混杂可以被视为随机的[1].根据设计,预期测量和未测量的混杂因素在各分配组中平均分布。这会导致互换性,即,如果暴露状态发生逆转,比较两组的最终结果测量不会发生变化[23.].如果与结果风险相关,不符合可能使基于实际接受治疗的分析无效。采用随机分配作为一种工具,可估计每个人都遵守的平均因果效应[4.].

在观察性研究中,因果推断受到缺乏随机暴露分配的挑战[5.].当患者选择接受特定的暴露时,就会出现自我选择。在口服避孕药、绝经后激素治疗、他汀类药物和流感疫苗等领域对这种混淆进行了研究,并将其称为“依从性偏差”[6.]、“预防偏向”[7.]、“健康追随者效应”[8.]和“健康用户效应/偏见”[9.]。预防性干预对健康结果的影响可能被高估,因为选择参与一般性干预的人比未参与的人更健康。当医生或其他卫生专业人员选择特定暴露的患者时,会出现指征混淆[1011].当医生在医生选择最健康的患者治疗时,当医生保留治疗时,暗示令人沮丧的治疗效果导致治疗效果低估了治疗效果。12].健康的用户偏见和暗示的危害是难以应变的偏差,即使在对预后的详尽控制之后也难以排除[13],社会和个人因素[6.].如果可以确定合适的工具,即使存在未测量的混杂因素,也可以估计编辑者之间的因果平均效应。

在经济学中,工具变量法通常被用来估计存在未测量的混杂因素时的因果效应[14].工具最初的概念是结构方程模型和与干扰有关的假设中的外生变量。对于流行病学家来说,通过强调与随机对照,工具变量法和潜在假设可能更容易概念化。本文的目的是回顾工具变量假设和潜在的验证使用有向无环图和介绍两阶段工具回归技术。

三个基本假设

一个工具被定义为一个预测暴露的变量,但条件暴露与结果没有独立的关联。仪器仅仅通过曝光效果来影响结果。试验中的随机分配是理想仪器的一个例子,但在满足所需假设的观测环境中也可能发现自然发生的现象。基本假设在文献中略有不同[4.1214151617181920]但可以识别三个一般假设。数字1描绘了随机指示符的随机对照试验Z., 暴露X和结果y有共同的原因,这代表了影响该关联的不可测量的因素Xy.变量Z.是一种工具,因为它满足以下三个假设:

图1
图1

一项随机对照试验Z., 暴露X,结果y和未测量的因素

  1. 1.

    关联假设:文书Z.对…有因果关系X。

  2. 2.

    排斥限制:Z.影响的结果y只有通过X。

  3. 3.

    盈亏能力假设:Z.和结果没有共同的原因吗y[19].这个假设也被称为独立假设[1518],无知的治疗作业[14,或描述为Z对Y的影响没有混淆[16].

关联在随机对照试验中,假设是不言自明的,分配的任务理想地决定了暴露。虽然由于不服从,分配和治疗不会完全相关,Z.肯定会预测X.这排斥有效的双盲法满足了限制条件,这意味着卫生专业人员和参与者都不知道任务[16].所以,Z.不能直接影响y.此外,盈亏能力假设基本得到了满足,因为随机化预计会导致混合因素在分配组中平均分布[14].

对平均效应的无偏估计Xy可根据以下因素的平均影响进行估算:Z.yZ.X[4.].对二分治疗的通常仪器变量估量是比例:

$$\frac{{E\left[{Y|Z=1}\right]-E[Y|Z=0]}{E\left[{X|Z=1}\right]-E[X|Z=0]}$$

对于连续处理,仪器变量估量是比例:

$$\frac{{Cov\left({Y,Z}\right)}{{Cov\left({X,Z}\right)}$$

直观地,分子对应于分配对结果的因果效应的意图[1619]。分母是对指定暴露的依从性的度量。当不依从性增加时,分母缩小并扩大稀释的治疗意向估计,以估计每个人都遵守的因果效应。在随机对照试验中应用工具变量方法可以考虑不依从性,例如见[2122].

工具变量方法可以扩展到观察性研究,如果关联假设略微改变为更普通的版本:仪器Z.和曝光X是有关联的Z.对…有因果关系X,还是因为XZ.分享一个常见的原因[16].在后一种情况下,未测量的因果仪器U *是被测量的替代或代理工具的常见原因Z.和曝光X,见图。2

图2
图2

一项使用代理仪器的观察研究Z.测量的仪器U *, 暴露X,结果y和未测量的因素

在文献中,可以确定观察性研究中提出的许多不同类型的仪器,例如称为孟德尔随机的遗传因素、基于地理变异或到设施的物理距离获得治疗的机会,以及基于设施或医生治疗变异的治疗偏好[1819]一些作者鼓励利用自然变异[15,而另一些人则警告说,确定有效文书的挑战并非微不足道[1617]Martens和他的同事建立了一个工具层次结构[17,其中最有效的观察工具是由研究人员控制的变量,例如随机鼓励戒烟。其次,可以找到一些自然随机化过程的例子,例如孟德尔随机化,在后代中随机分配等位基因。当既不存在主动随机化也不存在自然随机化时,第三个机会是选择一种自然变异的来源作为工具,并仔细证明假设是满足的。通常,自然变化只会使仪器与曝光之间产生微弱的联系。随着有效随机化的程度减弱,仔细审查的必要性盈亏能力假设增加。此外排斥在没有盲板的情况下,必须仔细考虑限制[17].

根据这三个基本假设,可以确定因果效应的上下限[4.151623].不幸的是,这些界限通常是宽,甚至与预防效果,致病效果或根本没有影响的甚至兼容19].这种宽泛的界限强调了与估计因果效应相关的不确定性。此外,它们还显示了第四个假设需要提供多少“信息”才能获得一个点估计值[24].

第四个识别假设

第四个识别假设与效果同质性有关[1619].在临床环境中,暴露的效果通常是异构的。他汀类药物在高水平胆固醇的患者中比患者比低水平的患者更有效。均匀暴露效应的实例是罕见的,但是已经提出了阑尾切除术的效果作为案例[12].在同质性假设的最极端版本中,暴露的影响X关于结果y每个人都应该是恒定的,这在生物学上是不可能的。一个更弱、更合理的假设是,没有效果的修改Z.X-y暴露和未暴露人群中的因果效应[19].换句话说,在暴露的情况下,因果效应与仪器无关,同样在未发生的因果效果与仪器无关。这种假设并不自然直观,但可以证明通过未测量的混淆来改变X-y效应足以确保该假设不成立[19].在实践中,一些未测量的混杂因素很可能是效应调节剂。

然而,提出了一个不要求效应同质性的替代假设,即单调性没有叛逃者[1925]。这是以限制因果效应估计的普遍性为代价的。想象一个使用二分法工具和二分法暴露的简单情况。如果我们假设我们能够在实际分配和反事实分配下观察暴露值,我们可以识别四个不同的子项分组,见表1[14].在现实生活中,我们只观察到了实际分配下的暴露,因此我们无法在现实生活中区分这些子群体。

表1按分配与暴露相结合的反事实定义的四个子组

从不接受这些人——无论他们被分配到哪个小组——永远不会被暴露。同样,总是人是那个人 - 无论分配 - 总是会被暴露。这编者是在任务完成后暴露的人。编译器也被称为小的[12] 或者CO.-起作用的[4.]受试者。在该亚组中,仪器预计才能实现可互换性。暴露能够遵循任务,因为预后因素并不是弱者或强烈的患者永远不会得到治疗或总是得到治疗。而是治疗取决于仪器即,是一种受控或天然存在的随机变化现象。例如,与在较小的分散的设施中可用的传统治疗相比,一个只在一个中央设施的新治疗可能表现出更好的严重案例结果。轻度病例永远不会被提及中央设施,而严重的病例将始终被提及。既不是温和也不严重的病例可能会根据其与中央设施的物理距离提及。这意味着当比较两名具有类似预后因素的患者时​​,其中一个人在附近居住并且远处的另一个患者时,首先可能会提到中央设施和后者而不是。第一个人居住在远处,另一个附近,他们的暴露状况将被逆转。以这种方式,仪器伪随机地分配可交换组的治疗。 Finally, the group of违抗者是那些与他们的任务相反的人。在前面的例子中,这意味着住在中心设施附近的病人实际上会被转到分散的设施,而如果这个病人住得很远,他就会被转到中心设施。这一组对于第四个识别假设至关重要,即没有反驳者[25].

图中有四个简单的图。3.澄清项目名称之间的联系单调性假设与无异议者的概念[19].无论任务是否为零因果效应,始终服用者和从不服用者都有一个恒定的暴露值Z.在…上X.如果没有违规者,那么唯一的亚群Z.可以影响X是个同体。这是由第三图中的单调增加的图来说明。如果没有存在违规权,则效果Z.在…上y只会产生于编者组。因此,工具变量estimand会将平均因果效应扩大到群体中每个人都是编者的因果效应[15].这种效果估计称为局部平均处理效果(LATE) [141924].这种效应估计的相关性已经受到质疑,因为不能识别成交合物组,因此难以将效应估计转化为决策者的实际相关性的估计[26]。编撰者组以及效果评估将因研究而异,具体取决于拟定的工具[12].然而,需要强有力的难以置信的效应同质假设来估计人群中的平均治疗效果(ATE) [24].

图3
图3

文书效力Z.在接触X在四个亚组

假设的验证

关联假设A.Z.-X关联是经验可验证的,它包含了最常见的工具估计技术的第一步:两阶段最小二乘估计[14151619].第一阶段根据仪器预测暴露的预期值。该关联使用F-统计量r进行评估2或者风险差异。根据经验法则,如果f统计量小于10,则该工具被宣布为弱[19].弱的工具将导致较大的置信区间。这排斥无法从数据核实限制[1619].相反,必须应用主题知识,以排除仪器对暴露的任何直接效果的可能性,见图。4..在随机对照试验中,有效的双盲法确保了这一点。在使用医生偏好作为工具的观察性研究中,如果医生在研究评估中联合使用其他药物和他们的首选治疗,例如,联合使用化疗缓解恶心的药物,则违反了这一假设评估不同治疗方案的副作用。

图4
图4

图形表示排斥限制规定

盈亏能力使用测量的协变量的数据是部分可核解的假设[1519].在所提出的仪器的水平跨越测量混凝剂的分布的列表将揭示潜在的不平衡。然而,无法排除未测量的协变量的混淆。数字5.表明如果直接影响Z..在对照试验中,随机化可确保混杂因素在各任务组中平均分布,但在观察性研究中,必须特别注意拟用的工具,尤其是基于自然变异的研究。在基于物理距离的研究中,另一个因素,如社会经济状况对治疗和结果的影响,也可能影响到到中心设施的距离。在基于偏好的研究中,如果高风险患者根据他们的偏好寻找医生,则高风险患者可能会聚集在具有特定偏好的医生周围[15].显然,这种自我任务将违反仪器的随机性并创造虚假协会。虽然排斥限制和盈亏能力无法从数据中验证假设,提出了伪造无效仪器的不同方法[2027].

图5
图5

图形表示盈亏能力假设

第四种假设单调性没有叛逃者在随机对照试验中被设计排除,因为失明消除了反抗的可能性[15].在观察研究中,验证需要主题知识,并且难以经验测试[1219].当使用医生的偏好作为工具时,包含多个因素的复杂决策过程可能会违反单调性假设[25].以偏好为基础的工具分析可能与治疗计划和医生偏好的调查相补充,以实证评估单调性假设[25].

任何违规行为排斥盈亏能力假设将导致一个有偏差的估计。然而,一个弱的工具将对分子的偏差产生乘数效应,因为它被小的分母放大了[1617].这可能导致工具变量估计比基于实际暴露的传统估计更有偏差。因此,需要仔细考虑可能的违规行为。

直观的估计介绍

最常用的仪器估计技术是两阶段最小二乘估计[1519].第一阶段根据线性模型中的仪器预测暴露的预期值:

$$ e \左[{x | z}右] = \ alpha_ {0} + \ alpha_ {1} z $$

然后,第二阶段根据第一阶段预测的暴露量预测结果:

$$E\left[{Y|Z}\right]=\beta|u{0}+\beta|u{1}E[X|Z]$$

参数\ (\ beta_ {1} \)等同于工具变量估计器。任何用于预测暴露的测量协变量可在第一阶段添加,并在第二阶段再次添加。对这些协变量进行调节将使边际可交换性假设放松为基于协变量的条件可交换性假设[15].

为了直观地理解估计过程,在图2中以视觉呈现常规和仪器线性回归。6.基于假设数据。通常,在传统的回归中,观察到的曝光值构成预测从属变量的独立变量。在乐器回归中,第一阶段显示了基于仪器的曝光的线性预测。在第二阶段中,来自上述拟合线的预测值被用作独立变量而不是观察到的值。实际暴露已被预测的曝光所取代。基于预测值的乐器回归线显示比可能受到未被训练的混杂性影响的传统回归的虚线陡峭的斜率。基本思想是预测值不受困扰的常见未测量原因的影响Xy关系

图6
图6

常规回归(左列)和基于假设数据的两阶段工具回归(右列)Z.,结果y和曝光X

结论

文献中的三种仪器变量方法的基本假设已经表现为文献,但第四个识别假设单调性未来使用仪器的研究应该仔细地验证所有四个假设,可能与随机平行。

参考

  1. 1.

    格陵兰S.随机化、统计和因果推断.流行病学.1990;1:421-9。

    CAS文章PubMed谷歌学者

  2. 2.

    格陵兰州罗宾斯·杰姆。可识别性,交换性和流行病学混杂性。int j流行病。1986; 15:413-9。

    CAS文章PubMed谷歌学者

  3. 3.

    格陵兰S,罗宾斯JM.可识别性、可交换性和混杂性再探讨.传染病透视Innov.2009;6:4。

    文章PubMed公共医学中心谷歌学者

  4. 4.

    格陵兰州S.流行病学家仪器变量引言。int j流行病。2000; 29:722-9。

    CAS文章PubMed谷歌学者

  5. 5.

    Hernán MA, Robins JM。观察性研究(第三章)。见:因果推理,第一部分。2017.25 - 39 p。(即将出版)

  6. 6.

    Petitti DB。冠心病和雌激素替代疗法。依从性偏差能解释观察性研究的结果吗?安论文。1994;4:115-8。

    CAS文章PubMed谷歌学者

  7. 7.

    Barrett Connor E.绝经后雌激素与预防偏倚.安实习医学.1991;115:455-6。

    CAS文章PubMed谷歌学者

  8. 8.

    SIMPSON SH,EURICH DT,MAMUMDAR SR,帕德沃尔RS,Tsuyuki RT,Varney J,等。粘附性与药物治疗和死亡率之间的关系的荟萃分析。BMJ。2006; 333:15。

    文章PubMed公共医学中心谷歌学者

  9. 9.

    Brookhart MA, Patrick AR, Dormuth C, Avorn J, Shrank W, Cadarette SM,等。坚持降脂治疗和使用预防性保健服务:健康用户效应的调查美国流行病学杂志2007;166:348-54。

    文章PubMed谷歌学者

  10. 10

    格陵兰S,Neutra R.医疗技术评估中的混杂控制.国际传染病杂志,1980;9:361-7。

    CAS文章PubMed谷歌学者

  11. 11

    比赛当天艳阳高照操作系统。在预期效果的研究中需要随机化。统计医学。1983;2:267 - 71。

    CAS文章PubMed谷歌学者

  12. 12

    谁是边缘患者?理解治疗效果的工具变量估计。卫生服务研究1998;33(5 Pt 1):1337-60。

    CASPubMed公共医学中心谷歌学者

  13. 13.

    Bosco JLF、Silliman RA、Thwin SS、Geiger AM、Buist DSM、Prout MN等。最顽固的偏见:没有调整方法可以通过观察研究中的指示完全解决混淆。临床流行病学杂志。2010;63:64–74.

    文章PubMed谷歌学者

  14. 14.

    Chgrist JD,Imbens GW,Rubin DB。使用仪器变量识别因果效应。J AM Stat Assoc。1996; 91:444-55。

    文章谷歌学者

  15. 15.

    Rassen JA,Brookhart MA,Glynn RJ,Mittleman MA,Schneeweiss S.工具变量I:工具变量利用非实验数据中的自然变异来估计因果关系.临床流行病学杂志.2009;62:1226–32。

    文章PubMed公共医学中心谷歌学者

  16. 16.

    《因果推断的工具:流行病学家的梦想?流行病学》,2006;17:360–72。

    文章PubMed谷歌学者

  17. 17.

    Martens EP, Pestman WR, de Boer A, Belitser SV, Klungel OH。工具变量:应用与限制。流行病学。2006;17:260-7。

    文章PubMed谷歌学者

  18. 18.

    戴维斯纳姆,史密斯GD,Windmeijer F,Martin RM。仪器变量研究报告和进行的问题:系统审查。流行病学。2013; 24:363-9。

    文章PubMed谷歌学者

  19. 19.

    Hernán MA, Robins JM。工具变量估计。在:因果推理,第二部分。Boca Raton: Chapman & Hall/CRC;2017.53 - 68页(即将出版)

  20. 20

    白驰奇,程杰,小DS。因果推理的工具变量方法。统计医学。2014;33:2297 - 340。

    文章PubMed公共医学中心谷歌学者

  21. 21

    霍梅Ø, Løberg M, Kalager M, Bretthauer M, Hernán MA, Aas E,等。软性乙状结肠镜筛查对结直肠癌发病率和死亡率的影响。《美国医学协会杂志》上。2014; 312:606。

    CAS文章PubMed公共医学中心谷歌学者

  22. 22

    Swanson Sa,HolmeØ,Løbergm,kalager m,Bretthauer M,Hoff G等人。随机试验中的每协同作用有限:对结直肠癌筛选的应用。试验。2015; 16:541。

    文章PubMed公共医学中心谷歌学者

  23. 23

    Davies NM,Smith GD,Windmeijer F,Martin RM.COX-2选择性非甾体抗炎药与胃肠道并发症和心肌梗死的风险.流行病学.2013;24:352-62。

    文章PubMed谷歌学者

  24. 24

    Swanson SA,Hernán MA.评论:如何报告工具变量分析(欢迎建议).流行病学.2013;24:370–4。

    文章PubMed谷歌学者

  25. 25.

    Swanson SA,Miller M,Robins JM,Hernán MA.偏好工具单调性条件的定义和评估.流行病学.2015;26:414-20。

    文章PubMed公共医学中心谷歌学者

  26. 26.

    Swanson Sa,HernánMa。全球思考,在全球范围内行事:流行病学家对乐器变量估计的看法。stat sci。2014; 29:371-4。

    文章PubMed公共医学中心谷歌学者

  27. 27.

    格利莫尔·MM,切特根·切特根·EJ,罗宾斯·JM。可信的孟德尔随机研究:评估工具变量假设的方法。美国流行病学杂志。2012;175:332–9。

    文章PubMed公共医学中心谷歌学者

下载参考资料

确认

作者感谢Timothy L. Lash和Henrik Støvring对初稿的深刻审查。

利益争夺

提交人声明,她没有相互竞争的利益。

数据和材料的可用性

不适用。

同意出版物

不适用。

伦理批准和同意参加

不适用。

基金

奥胡斯大学资助了这项研究,并没有参与研究设计、数据收集、分析或手稿起草的任何部分。

出版商说明

亚搏体育官方电话Springer自然仍然是关于发表地图和机构附属机构的司法管辖权索赔中立。

作者信息

隶属关系

作者

通讯作者

对应于Mette丽丝Lousdal

权利和权限

开放存取本文根据Creative Commons attection 4.0国际许可的条款分发(http://creativecommons.org/licenses/by/4.0/),它允许在任何媒体上无限制地使用、分发和复制,前提是你给予原作者和来源适当的荣誉,提供一个到知识共享许可协议的链接,并指出是否作出了更改。创作共用及公共领域专用豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条中提供的数据,除非另有说明。

再版和权限

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

Lousdal,M.L.工具变量假设、验证和估计简介。紧急情况的主题论文15,1(2018)。https://doi.org/10.1186/s12982-018-0069-7

下载引用

关键词

  • 乐器变量
  • 单调性
  • 因果推理
  • 无边无际的混淆
  • 随机化
  • 可交换性
Baidu