跳过主要内容gydF4y2Ba

详细解释和图解布林德-瓦哈卡分解方法及其在健康不平等中的应用gydF4y2Ba

摘要gydF4y2Ba

本文介绍了用于解释任意两组健康结果不平等的Blinder-Oaxaca分解方法。为了理解不等式的各个方面,可以使用多元回归模型将不等式分解为影响因素。因此,该方法可以表明两组之间的平均预测结果的差异在多大程度上是由于可观察特征水平的差异(可接受和公平)。假设两组具有相同的特征,其余的不平等可能是由于特征的不同影响,可能是歧视,以及模型中未包括的未观察到的因素。因此,利用分解方法可以确定每个特定因素对缓和当前不平等的贡献。因此,可以为决策者提供更详细的资料,特别是关于可改变因素的资料。文中对该方法进行了详细的理论描述,并给出了原理图。在下面,对模型的一些批评进行了回顾,并表示了一些用于执行该方法的统计命令。并给出了该方法在健康不平等问题中的应用实例。gydF4y2Ba

介绍gydF4y2Ba

不平等是人类生活中最明显的事实之一,指的是影响个人生活方式的差异。尽管不平等的含义很简单,但它的复杂性阻碍了对其定义的共识。因此,不平等一直是众多研究项目的主题。这个概念通常是根据个人的不同需要和条件来定义的。因此,这是与接受特别服务的人的条件和特点有关,而不是与提供特别服务的人有关[gydF4y2Ba1gydF4y2Ba].gydF4y2Ba

在某些情况下,不平等可以和不平等互换使用。什么程度的不平等应该被认为是不平等,这取决于不公平[gydF4y2Ba2gydF4y2Ba].gydF4y2Ba

歧视与不公平感一起,指的是属于某一特定群体决定了该群体偏好或不偏好的情况[gydF4y2Ba3.gydF4y2Ba].尽管具有相同的能力和特点,但每一组的个人所获得的福利和服务不同,这与该组与其他组的具体地位有关。gydF4y2Ba

在公共保健领域,不平等是指在个人或群体的健康状况中可见的差异、异同和差距,它被间接用作衡量健康不平等的工具。换句话说,不平等的一个例子是具有相同特征的群体中存在的系统性的、可避免的不平等[gydF4y2Ba4gydF4y2Ba].gydF4y2Ba

尽管全球健康和卫生状况总体有所改善,但近几个世纪来,不平等性加剧。这一问题可以通过确定促成因素不可避免地得到缓解。然而,在卫生部门实现公平是有关当局面临的一项重大挑战(2,5)。尽管对卫生部门和医学领域的差异进行了大量调查,但很少有研究关注如何减少这种差异[gydF4y2Ba5gydF4y2Ba].制定、设计和实施减少卫生不平等的有效干预措施的第一步是调查造成不平等的因素和原因[gydF4y2Ba6gydF4y2Ba].gydF4y2Ba

为此,为了理解不等式的各个方面,可以使用多元回归模型将不等式分解为其组成部分。1973年,Blinder [gydF4y2Ba7gydF4y2Ba]和瓦哈卡州[gydF4y2Ba8gydF4y2Ba]提出了一种新的方法来检验劳动力市场中与种族/性别工资不平等和歧视有关的因素。该方法可用于解释任何两组人群健康结果的不平等。gydF4y2Ba

该方法的目的是解释两组间平均结果的差异有多少是由于观察特征水平的组间差异(可接受且公平),又有多少是由于歧视,但也可能是观察到的特征的差异效应(回归系数大小的组间差异)以及其他未知的相关因素造成的。事实上,尽管个体特征相同,但不平等的存在可能源于影响结果的未知因素。因此,结果的差异可以通过减轻对比组中相关因素水平的差异来调整。其余的将涉及无法测量、无法观察的因素[gydF4y2Ba9gydF4y2Ba,gydF4y2Ba10gydF4y2Ba].因此,该方法可用于识别各因素对不等式的贡献。gydF4y2Ba

主要内容gydF4y2Ba

Blinder-Oaxaca(B-O)分解法gydF4y2Ba

有时,分解两组(组1和组2)之间特定连续结果的平均差异是必要的,以确定导致差异的因素。为此,可以采用多元回归模型。在统计度量方面,这种特殊的分解方法可以被认为是t检验和多元回归模型的组合。假设结果值(gydF4y2BaYgydF4y2Ba)由K个变量(gydF4y2BaxgydF4y2Ba1gydF4y2Ba,……gydF4y2BaxgydF4y2BakgydF4y2Ba)的线性回归模型中,组的平均预测结果gydF4y2BaggydF4y2Ba(1和2)可以表示为:gydF4y2Ba

$ $ \眉题{Y} ^ {g} = \ beta_ {0} ^ {g} + \ mathop \总和\ limits_ {j = 1} ^ {k} \ beta_ {j} ^ {g} \眉题{x} _ {j} ^ {g} $ $gydF4y2Ba

在哪里gydF4y2Ba\(\眉题{x} _ {j} \)gydF4y2Ba每个预测器的平均值是和吗gydF4y2Baβ\ (\ \)gydF4y2Ba为估计的回归系数。gydF4y2Ba

因此,两组(1和2)结果的平均差值为:gydF4y2Ba

$ $ \三角洲\眉题{Y} = \离开({\ beta_ {0} ^ {1} - \ beta_{0} ^{2}} \右)+ \ mathop \总和\ limits_ {j = 1} ^ {k} (\ beta_ {j} ^{1} \眉题{x} _ {j} ^ {1} - \ beta_ {j} ^{2} \眉题{x} _ {j} ^ {2}) $ $gydF4y2Ba
(1)gydF4y2Ba

结果的平均差值为不同分量效应之和,包括:(1)各可观察变量水平的平均差值(gydF4y2Ba\(间{j} \)gydF4y2Ba);(2)差异效应(gydF4y2Ba\ (\ beta_ {j} \)gydF4y2Ba(3)基本差异,包括模型中未包含的未知变量的影响。一个值得问的问题是“每个模型组件对这种差异的贡献有多大?”gydF4y2Ba

为了回答这个问题,我们交替假设两组的解释变量水平和回归系数相同,以达到每个组成部分的净效果。实际上,我们采用了一种反事实的方法,将一组方程的系数和变量水平替换为另一组的相应值(参考)。因此,当该组得到参考的预测值和回归系数时,就得到了该组平均结果的预期变化。在这个过程中,可以估计每个组件的贡献[gydF4y2Ba9gydF4y2Ba,gydF4y2Ba11gydF4y2Ba].gydF4y2Ba

如果选择第1组(或其结果)作为参考,则考虑第2组预测因子水平和回归系数的预期变化及其结果的变化。gydF4y2Ba

从第2组的角度出发,可以将第1组独有的等式重新表述为:gydF4y2Ba

$ ${对齐}\ \开始眉题{Y} ^ {1} & = \ beta_ {0} ^ {1} + \ mathop \总和\ limits_ {j = 1} ^ {k} \ beta_ {j} ^{1} \眉题{x} _ {j} ^ {1 } \\ & = \ beta_ {0} ^ {1} + \ mathop \ \和limits_ {j = 1} ^ {k} \[{\离开beta_ {j} ^ {2} + (\ beta_ {j} ^ {1} - \ beta_ {j} ^{2}} \右)]\ mathop \总和\ limits_ {j = 1} ^ {k} \[{\离开眉题{x} _ {j} ^{2} +左({\ \眉题{x} _ {j} ^ {1} -\眉题{x} _ {j} ^{2}} \右)}\ ] \\ & = \ beta_ {0} ^ {1} + \ mathop \ \和limits_ {j = 1} ^ {k} \ beta_ {j} ^{2} \眉题{x} _ {j} ^ {2} + \ mathop \ \和limits_ {j = 1} ^ {k} \ beta_ {j} ^{2} \离开({\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^{2}} \右)+ \ mathop \总和\ limits_ {j = 1} ^ {k} \眉题{x} _ {j} ^ {2} (\ beta_ {j} ^ {1} - \ beta_ {j} ^ {2}) + \ mathop \总和k \ limits_ {j = 1} ^{} \离开({\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^{2}} \) \离开({\ beta_ {j} ^ {1} - \ beta_ {j} ^{2}} \) \ \ \{对齐}$ $gydF4y2Ba

上式包括gydF4y2Ba\ (\ beta_ {j} ^ {1} = \ beta_ {j} ^ {2} + (\ beta_ {j} ^ {1} - \ beta_ {j} ^ {2}) \)gydF4y2Ba和gydF4y2Ba\(\眉题{x} _ {j} ^{1} = \眉题{x} _ {j} ^{2} + \离开({\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^ {2}} \) \)gydF4y2Ba,可在Eq。gydF4y2Ba1gydF4y2Ba将结果的均值差分解为如下4个分量:gydF4y2Ba

figureagydF4y2Ba

本式中所示的分解是从组2的角度出发,选取组1作为参考。gydF4y2Ba

据此,可以将预测差异(D)分解为4个分量(B、E、C、I);换句话说,可以估计出各组分在差异中的贡献:gydF4y2Ba

  1. 1.gydF4y2Ba

    第一个成分(B)归因于基本差异。它包括未考虑的不可观测变量的影响(即未包含在模型中)。gydF4y2Ba

  2. 2.gydF4y2Ba

    第二个分量(E)表示当组2的平均预测结果满足组1(文献)的协变量水平时的变化:gydF4y2Ba

    $ $ \ mathop \总和\ limits_ {j = 1} ^ {k} \ beta_ {j} ^{2}(\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^ {2}) = \ mathop \ \和limits_ {j = 1} ^ {k} \离开({\ beta_ {j} ^{2} \眉题{x} _ {j} ^ {1} - \ beta_ {j} ^{2} \眉题{x} _ {j} ^{2}} \右)$ $gydF4y2Ba

    换句话说,部分差异(D)即由可观察的解释变量水平上的群体差异所解释的(被解释成分)。这部分被称为“禀赋效应”。gydF4y2Ba

  3. 3.gydF4y2Ba

    第三个成分(C)是差异的一部分,表示当组2满足另一组回归系数时,组2的平均预测结果的变化:gydF4y2Ba

    $ $ \ mathop \总和\ limits_ {j = 1} ^ {k} \眉题{x} _ {j} ^{2} \离开({\ beta_ {j} ^ {1} - \ beta_ {j} ^{2}} \右)= \ mathop \总和\ limits_ {j = 1} ^ {k} \离开({\ beta_ {j} ^{1} \眉题{x} _ {j} ^ {2} - \ beta_ {j} ^{2} \眉题{x} _ {j} ^{2}} \右)$ $gydF4y2Ba

    它涉及部分差异(D)造成的差异的影响,可观察的变量对结果在两个比较组。它不能用可观察的解释变量(无法解释的成分)的水平来解释。这部分差异被称为“系数效应”。gydF4y2Ba

  4. 4.gydF4y2Ba

    第四个组成部分(I)涉及由于禀赋和系数差异的同时效应而产生的相互作用[gydF4y2Ba11gydF4y2Ba,gydF4y2Ba12gydF4y2Ba].gydF4y2Ba

图形gydF4y2Ba1gydF4y2Ba图中以组1作为参考时,从组2的角度示意图显示组间差异对平均预测结果的分解(Eq. 2)gydF4y2Ba

图1gydF4y2Ba
图1gydF4y2Ba

以组1为参照(从组2的角度)分解组间平均预测结果差异(交互模型)gydF4y2Ba

同样,当选择Group 2作为参考时,均值预测结果的预期变化可以从Group 1的角度表示为:gydF4y2Ba

figurebgydF4y2Ba

为达到上述Eq. 3,将第2组的协变量水平和回归系数从第1组的角度重新表述为gydF4y2Ba

$ $ {\ upbeta} _{{\文本{j}}} ^ {2 } \, = \,\ upbeta _{{\文本{j}}} ^{1} - \离开({{\ upbeta} _{{\文本{j}}} ^ {1}, {\ upbeta} _{{\文本{j}}} ^{2}} \右)$ $gydF4y2Ba
$ $ \眉题{x} _ {j} ^{2} = \眉题{x} _ {j} ^{1} - \离开({\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^{2}} \右)$ $gydF4y2Ba

然后替换公式1中的相应值。因此,公式3中的差值(D)可以分解为4个分区(B、E、C和I):第一个分量(B)和第四个分量(I)与以下公式2中表示的相同因子相关。第二个分量(E)然而,如果该组具有第2组(参考)的协变量水平,则测量第1组平均预测结果的预期变化:gydF4y2Ba

$ $ \ mathop \总和\ limits_ {j = 1} ^ {k} \ beta_ {j} ^{1}(\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^ {2}) = \ mathop \ \和limits_ {j = 1} ^ {k} \离开({\ beta_ {j} ^{1} \眉题{x} _ {j} ^ {1} - \ beta_ {j} ^{1} \眉题{x} _ {j} ^{2}} \右)$ $gydF4y2Ba

第三个成分(C)同样是测量组1的平均预测结果在满足组2回归系数时的预期变化的差异的一部分:gydF4y2Ba

$ $ \ mathop \总和\ limits_ {j = 1} ^ {k} \眉题{x} _ {j} ^{1} \离开({\ beta_ {j} ^ {1} - \ beta_ {j} ^{2}} \右)= \ mathop \总和\ limits_ {j = 1} ^ {k} \离开({\ beta_ {j} ^{1} \眉题{x} _ {j} ^ {1} - \ beta_ {j} ^{2} \眉题{x} _ {j} ^{1}} \右)$ $gydF4y2Ba

图形gydF4y2Ba2gydF4y2Ba示意图描述了选择组2作为参考的分解条件。gydF4y2Ba

图2gydF4y2Ba
figure2gydF4y2Ba

选择第2组作为参考的差异分解(交互模型)(从第1组的角度)gydF4y2Ba

在方程式。gydF4y2Ba2gydF4y2Ba和gydF4y2Ba3.gydF4y2Ba(无花果。gydF4y2Ba1gydF4y2Ba和gydF4y2Ba2gydF4y2Ba)第一个组成部分(B)gydF4y2Ba\(\left({\beta{0}^{1}-\beta{0}^{2}}\right)\)gydF4y2Ba,表示两组之间无法用观察到的协变量(X)解释的差异。事实上,这种差异是由于未观察到的变量造成的。另一方面,系数成分(C部分)也无法用这些差异来解释。然后,我们可以将这两部分(B和C)合并成无法解释的部分(U),得到三次分解,gydF4y2Ba

$ $ \三角洲\眉题{Y} = \ mathop \总和\ limits_ {j = 1} ^ {k} \ beta_ {j} ^{2}(\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^ {2}) + \ mathop \总和\ limits_ {j = 1} ^ {k} \眉题{x} _ {j} ^{2} \离开({\ beta_ {j} ^ {1} - \ beta_ {j} ^{2}} \右)+ \ mathop \总和\ limits_ {j = 1} ^ {k}(\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^{2}) \离开({\ beta_ {j} ^ {1} - \ beta_ {j} ^ {2}}\右)$ $gydF4y2Ba
(4)gydF4y2Ba
figurecgydF4y2Ba

换句话说,如果我们假设没有相关的不可观察的解释变量,那么方程4和5中总未解释部分(U)将等于方程中的C分量。gydF4y2Ba2gydF4y2Ba和gydF4y2Ba3.gydF4y2Ba.gydF4y2Ba

在这种方法中,平均预测结果(D)的差异包含三个部分(E、U和I):第一部分(E)由协变量水平的差异解释,第二部分(U)由所有这些协变量(未解释部分)的差异效应产生,第三部分(I)涉及由协变量水平及其系数的同时组差异引起的相互作用。gydF4y2Ba

到目前为止,我们假设1组或2组中的一个有最好的可实现的结果,而另一组应该达到这个结果。另一种方法是,我们假设存在一个非歧视性条件(由非歧视性系数向量标记),两组都应达到这个条件。因此,这种方法需要定义非歧视性条件或参考系数。有时,甚至这种非歧视性条件也可能是一个比较组的情况(我们可以称之为参考系数)。gydF4y2Ba

假设gydF4y2Ba\ \(β^ {*}\)gydF4y2Ba非歧视性条件或参考系数,整体方程的分解gydF4y2Baδ\ \(\眉题{Y} \)gydF4y2Ba将:。gydF4y2Ba

算gydF4y2Ba

通过这种方式,结果差异被分解为两个组成部分(双重分解)。第一个组成部分是由观察到的特征水平差异解释的群体差异部分。这也被称为“禀赋效应”.第二个部分是指由于结构差异造成的间隙部分gydF4y2Ba\ ({\ upbeta} \)gydF4y2Ba这是非歧视性的gydF4y2Ba\ ({\ upbeta} ^ {*} \)gydF4y2Ba.它还捕捉到不可观察变量水平的差异,以及它们的差异(区别)效应。这个分量决定了差异中无法解释的部分。如果所有未观测到的协变量都在模型中并被测量,它只包含gydF4y2Ba\ ({\ upbeta} \)gydF4y2Ba年代gydF4y2Ba与non-discriminatinggydF4y2Ba\ ({\ upbeta} ^ {*} \)gydF4y2Ba.这部分有时被认为是“歧视效应”。gydF4y2Ba

\ ({\ upbeta} ^ {*} \)gydF4y2Ba之间总是gydF4y2Ba\ ({\ upbeta} ^ {{1}} \)gydF4y2Ba和gydF4y2Ba\ ({\ upbeta} ^ {2} \)gydF4y2Ba,或等于两者或其中之一。然后,我们有gydF4y2Ba\ ({\ upbeta} ^{{1}} \通用电气{\ upbeta} ^{*} \通用电气{\ upbeta} ^ {{2}} \)gydF4y2Ba或gydF4y2Ba\ ({\ upbeta} ^ {{1}} \ le {\ upbeta} ^ {*} \ le {\ upbeta} ^ {{2}} \)gydF4y2Ba.gydF4y2Ba

如果gydF4y2Ba\ ({\ upbeta} ^ {{1}} > {\ upbeta }^{{*}} > {\ upbeta} ^ {{2}} \)gydF4y2Ba我们有正面歧视,有利于“第一组”,负面歧视,反对“第二组”gydF4y2Ba\ ({\ upbeta} ^ {{1}} {< \ upbeta }^{*} { < \ upbeta} ^ {{2}} \)gydF4y2Ba,那么我们有“支持”第二组的积极歧视和“反对”第一组的消极歧视。gydF4y2Ba

也有一个案例,其中一个群体经历了歧视和非歧视gydF4y2Ba\ ({\ upbeta} ^ {*} \)gydF4y2Ba就是另一组的系数。在这种情况下,gydF4y2Ba\ ({\ upbeta} ^ {{1}} {= \ upbeta }^{*} {> \ upbeta} ^ {{2}} \)gydF4y2Ba或gydF4y2Ba\ ({\ upbeta} ^ {{1}} > {\ upbeta }^{*} { = \ upbeta} ^ {{2}} \)gydF4y2Ba.如果我们更换gydF4y2Ba\ ({\ upbeta} ^ {*} \)gydF4y2Ba与gydF4y2Ba\ ({\ upbeta} ^ {1} \)gydF4y2Ba在Eq. 6中,我们达到了Eq。gydF4y2Ba7gydF4y2Ba如果我们替换gydF4y2Ba\ ({\ upbeta} ^ {*} \)gydF4y2Ba与gydF4y2Ba\ ({\ upbeta} ^ {2} \)gydF4y2Ba我们达到Eq. 8gydF4y2Ba

$ $ \三角洲\眉题{Y} = \ mathop \总和\ limits_ {j = 1} ^ {k} \ beta_ {j} ^{1}(\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^ {2}) + \ mathop \总和\ limits_ {j = 1} ^ {k} \眉题{x} _ {j} ^{2} \离开({\ beta_ {j} ^ {1} - \ beta_ {j} ^{2}} \右)$ $gydF4y2Ba
(7)gydF4y2Ba
(8)gydF4y2Ba

.gydF4y2Ba

因此,我们对平均预测结果的差异进行了双重分解(D):gydF4y2Ba

  1. 1.gydF4y2Ba

    未解释成分(Uc):这与三次分解的U部分(Eq。gydF4y2Ba4gydF4y2Ba和gydF4y2Ba5gydF4y2Ba).它源于可观察变量的微分效应,也源于微分效应(gydF4y2Ba\ ({\ upbeta} \)gydF4y2Ba)和不可观测变量的水平。这就决定了缺口中无法解释的部分。gydF4y2Ba

  2. 2.gydF4y2Ba

    解释组件(Ec):这部分是E和三倍的我部分分解(方程式4和5)。虽然这组件叫做解释组件在双重的分解在许多文本但部分(交互部分)实际上是同时协变量的系数和水平两组的差异。因此,如果有人想要粗略解释的成分,三次分解可以提供这个粗略解释的部分[gydF4y2Ba11gydF4y2Ba,gydF4y2Ba13gydF4y2Ba].gydF4y2Ba

因此,方程式。gydF4y2Ba7gydF4y2Ba和gydF4y2Ba8gydF4y2Ba可以被认为是等式的一种特殊形式。gydF4y2Ba4gydF4y2Ba和gydF4y2Ba5gydF4y2Ba,组件gydF4y2BaEgydF4y2Ba和gydF4y2Ba我gydF4y2Ba集成。因此:gydF4y2Ba

上周$$\0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 \ \ \ \ \总总总总总总\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \教师教师教师教师教师\ \ \ \{j}{1}-\beta{j}{2}}\right)=\mathop\sum\limits{j=1}{k}\beta{j}{1}(\overline{x}{j}{1}-\overline{x}{j}{2})$$gydF4y2Ba

和gydF4y2Ba

$ $ \ mathop \总和\ limits_ {j = 1} ^ {k} \ beta_ {j} ^{1}(\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^ {2}) - \ mathop \总和\ limits_ {j = 1} ^ {k}(\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^{2}) \离开({\ beta_ {j} ^ {1} - \ beta_ {j} ^{2}} \右)= \ mathop \总和\ limits_ {j = 1} ^ {k} \ beta_ {j} ^{2}(\眉题{x} _ {j} ^{1} - \眉题{x} _ {j} ^ {2}) $ $gydF4y2Ba

数据gydF4y2Ba3.gydF4y2Ba和gydF4y2Ba4gydF4y2Ba图示地演示了分别选择第1组和第2组系数作为参考的分解条件。gydF4y2Ba

图3gydF4y2Ba
图3gydF4y2Ba

使用组1系数作为参考分解结果差异gydF4y2Ba

图4gydF4y2Ba
装具gydF4y2Ba

使用组2系数作为参考分解结果差异gydF4y2Ba

不清楚应该选择哪个回归系数作为参考(eq . 7和8),这被称为“指数问题”[gydF4y2Ba9gydF4y2Ba,gydF4y2Ba14gydF4y2Ba,gydF4y2Ba15gydF4y2Ba,gydF4y2Ba16gydF4y2Ba,gydF4y2Ba17gydF4y2Ba,gydF4y2Ba18gydF4y2Ba].雷蒙(gydF4y2Ba19gydF4y2Ba]建议使用两组的平均回归系数(gydF4y2Ba\(frac{{upbeta _i^1 + upbeta _i^2}}{2}\)gydF4y2Ba),而棉花[gydF4y2Ba15gydF4y2Ba表示各分组规模加权系数之和(gydF4y2Ba\ \(压裂{{n ^ {1} {\ upbeta} _{{\文本{我}}}^ {1}+ n ^ {2} {\ upbeta} _{{\文本{我}}}^{2}}}{{\文本{n}}} \)gydF4y2Ba)gydF4y2Ba\ ({\ upbeta} _{{\文本{j}}} ^ {*} \)gydF4y2Ba.在这方面,Neumark建议使用来自两个组的合并模型的回归系数作为非歧视性条件的估计[gydF4y2Ba16gydF4y2Ba,gydF4y2Ba17gydF4y2Ba].gydF4y2Ba

B-O分解方法的非线性扩展gydF4y2Ba

虽然提出的B-O分解的主要应用是基于线性回归模型,但包括Yun和Fairlie在内的几位研究人员提出了一种非线性的分解[gydF4y2Ba14gydF4y2Ba,gydF4y2Ba20.gydF4y2Ba,gydF4y2Ba21gydF4y2Ba,gydF4y2Ba22gydF4y2Ba],该方法已广泛用于消除卫生部门的不平等现象[gydF4y2Ba23gydF4y2Ba,gydF4y2Ba24gydF4y2Ba,gydF4y2Ba25gydF4y2Ba,gydF4y2Ba26gydF4y2Ba,gydF4y2Ba27gydF4y2Ba].gydF4y2Ba

如前所述,响应变量Y均值上两组差异的原始B-O分解可表示为:gydF4y2Ba

$ $ \三角洲\眉题{Y} =[β\ ^{1}\离开({\眉题{X} ^{1} - \眉题{X} ^{2}} \右)左\]+ \[\眉题{X} ^{2} \离开({\β^{1}-β\ ^{2}}\右))$ $gydF4y2Ba

在哪里gydF4y2Ba\(\眉题{X} \)gydF4y2Ba行向量是解释变量和的平均值吗gydF4y2Baβ\ (\ \)gydF4y2Ba是每组1和2的系数估计向量。在这种情况下,第1组的系数估计,gydF4y2Ba\ \(β^ {1}\)gydF4y2Ba,被假定为参考。根据费尔利(gydF4y2Ba28gydF4y2Ba,非线性方程的分解,gydF4y2Ba\(Y = F\left({X\ β} \right)\)gydF4y2Ba可以表示为:gydF4y2Ba

figurefgydF4y2Ba

在哪里gydF4y2BaNgydF4y2BaggydF4y2Bag组的样本量是(1还是2)和gydF4y2Baδ{\(\ \眉题{\文本{Y}}} \)gydF4y2Ba表示两组间“平均预测结果概率”的差异gydF4y2Ba1gydF4y2Ba和NgydF4y2Ba2gydF4y2Ba个体。使用此分解的替代表达式是因为在Y的非线性变换中,gydF4y2Ba\(\眉题{Y} \)gydF4y2Ba并不一定等于gydF4y2Ba\(F\left({\overline{X}\ β}\ right)\)gydF4y2Ba.原来的B-O分解是Eq. 9的一个特例,其中gydF4y2Ba(F\left({X_{i} \ β} \right) = X_{i} \ β \)gydF4y2Ba[gydF4y2Ba28gydF4y2Ba].gydF4y2Ba

类似地,分解的另一个表达式是:gydF4y2Ba

$ $ \三角洲\眉题{Y} =左\[{\压裂{1}{{N ^ {1}}} \ mathop \ \和limits_ {i = 1} ^ {{N ^ {1}}} F \离开({\β^{2}间{我}^{1}}\右)- \压裂{1}{{N ^ {2}}} \ mathop \ \和limits_ {i = 1} ^ {{N ^ {2}}} F \离开({\β^{2}间{我}^{2}}\右)}\右]+左\[{\压裂{1}{{N ^ {1}}} \ mathop \ \和limits_ {i = 1} ^ {{N ^ {1}}} F \离开({\β^{1}间{我}^{1}}\右)——{} \压裂{1}{{N ^ {1}}} \ mathop \ \和limits_ {i = 1} ^ {{N ^ {1}}} F \离开({\β^{2}间{我}^{1}}\右)}\]$ $gydF4y2Ba
(10)gydF4y2Ba

其中以第2组的系数估计向量为参考。gydF4y2Ba

详细分解gydF4y2Ba

在详细的分解中,可以确定每个因素(X变量)对每个解释和未解释组件的相对贡献。这可以通过将一组的变量水平/系数依次替换为另一组的变量水平/系数,同时保持模型中的其他变量不变来实现。gydF4y2Ba

基于线性回归的分解;详细的分解并不是一项复杂的任务,因为每个组件都是简单地通过对每个预测器对每个组件的贡献进行求和得到的。然而,在非线性方法中,执行详细的分解是不直接的。换句话说,原始(线性)方法在非线性分解模型中的应用存在一些影响结果的概念问题[gydF4y2Ba28gydF4y2Ba,gydF4y2Ba29gydF4y2Ba,gydF4y2Ba30.gydF4y2Ba,gydF4y2Ba31gydF4y2Ba].第一个问题被称为“识别问题”,即对于作为预测器的名义(类别)变量,分解估计依赖于基类(省略)的选择。Yun提出的一个解决方案[gydF4y2Ba30.gydF4y2Ba,就是计算归一化效果。这相当于在改变参照组的同时,平均一组虚拟变量的系数效应。gydF4y2Ba

另一个问题是“路径依赖”。与线性模型不同,非线性分解对分解过程中所包含的变量的顺序也很敏感(路径依赖)[gydF4y2Ba22gydF4y2Ba,gydF4y2Ba28gydF4y2Ba,gydF4y2Ba29gydF4y2Ba,gydF4y2Ba32gydF4y2Ba].Fairlie提出了一个解决这个问题的方法,即在分解的重复过程中随机排序变量。这个程序需要两个比较组的个体一对一的匹配,因此在两个组中应该有相同数量的个体gydF4y2Ba\ \(左({{\文本{N}} ^{1} ={\文本{N}} ^{2}} \右){}\)gydF4y2Ba.否则(通常是这样),就会从多数群体1中随机选取一个子样本(通常等于少数群体2的样本量),然后根据每个人的反应变量的预测概率进行匹配。事实上,每一组的个体观察结果都会根据预测概率分别进行排列,然后再根据排名进行匹配。这个程序将匹配两个组的个体特征。因此,匹配的观察(一对一)将决定每个因素对结果差异的贡献。因此,选择多个子样本(如100次或1000次),以均值估计作为最终估计[gydF4y2Ba14gydF4y2Ba,gydF4y2Ba24gydF4y2Ba,gydF4y2Ba28gydF4y2Ba,gydF4y2Ba33gydF4y2Ba].使用logit系数估计(gydF4y2Ba\ \(β^ {*}\)gydF4y2Ba),从合并样本或适当的参照组,独立贡献gydF4y2Ba文本\ ({\ {X}} _{{\文本{J}}} \)gydF4y2Ba对差距可表示为:gydF4y2Ba

$ $ \压裂{1}{{N ^ {2}}} \ mathop \ \和limits_ {i = 1} ^ {{N ^ {2}}} F \离开({间{他}^ {1}\ beta_ {j} ^ {*} + \ mathop \总和\ limits_ {j \ ne}间{他}^ {1}\ beta_ {j} ^{*}} \右)- F \离开({间{他}^ {2}\ beta_ {j} ^ {*} + \ mathop \总和\ limits_ {j \ ne}间{他}^ {1}\ beta_ {j} ^{*}} \右)$ $gydF4y2Ba

或gydF4y2Ba

$ $ \压裂{1}{{N ^ {2}}} \ mathop \ \和limits_ {i = 1} ^ {{N ^ {2}}} F \离开({间{他}^ {2}\ beta_ {j} ^ {*} + \ mathop \总和\ limits_ {j \ ne}间{他}^ {1}\ beta_ {j} ^{*}} \右)- F \离开({间{他}^ {2}\ beta_ {j} ^ {*} + \ mathop \总和\ limits_ {j \ ne}间{他}^ {2}\ beta_ {j} ^{*}} \右)$ $gydF4y2Ba

克服这个问题的一个更简单的策略是使用权重[gydF4y2Ba22gydF4y2Ba,gydF4y2Ba34gydF4y2Ba,gydF4y2Ba35gydF4y2Ba].根据尹[gydF4y2Ba22gydF4y2Ba,使用权值进行详细分解,可表示为:gydF4y2Ba

$ $ \眉题{Y} ^{1} - \眉题{Y} ^ {2} = \ \ nolimits_总和{{{文本\ {k}} = 1}} ^{{\文本{k}}} {{{W} \文本}_{{{文本\ {X}} _{{\文本{k}}}}} ^{\三角洲}\离开[{\眉题{{{文本\ {F}} \离开({X ^ {1} {\ upbeta} ^{1}} \右)}}- \眉题{{{文本\ {F}} \离开({X ^ {2} {\ upbeta} ^{1}} \右)}}}\右]+ \总和\ nolimits_{{{文本\ {k}} = 1}} ^{{\文本{k}}}{{\文本{W}} _ {{{\ upbeta} _{{\文本{k}}}}} ^{\三角洲}\离开[{\眉题{{{文本\ {F}} \离开({x ^ {2} {\ upbeta} ^{1}} \右)}}- \眉题{{{文本\ {F}} \离开({x ^ {2} {\ upbeta} ^{2}} \右)}}}\右]}}$ $gydF4y2Ba
(11)gydF4y2Ba
$ ${\文本{如果}}\ \ nolimits_总和{{{文本\ {k}} = 1}} ^{{\文本{k}}}{{\文本{W}} _{{{文本\ {X}} _{{\文本{k}}}}} ^{\三角洲}=}\ \ nolimits_总和{{{文本\ {k}} = 1}} ^{{\文本{k}}}{{\文本{W}} _{{{文本\ {X}} _{{\文本{k}}}}} ^{\三角洲}= 1}$ $gydF4y2Ba

在哪里gydF4y2Ba文本\ ({\ {W}} _{{{文本\ {X}} _{{\文本{k}}}}} ^{\三角洲}\)gydF4y2Ba和gydF4y2Ba文本\ ({\ {W}} _ {{{\ upbeta} _{{\文本{k}}}}} ^{\三角洲}\)gydF4y2Ba表示的权重gydF4y2BaKgydF4y2Ba分别对不等式的解释分量和未解释分量进行线性化时的第Th变量[gydF4y2Ba22gydF4y2Ba,gydF4y2Ba32gydF4y2Ba]:gydF4y2Ba

$ ${\文本{W}} _{{{文本\ {X}} _{{\文本{k}}}}} ^{\三角洲}= \压裂{{{\ upbeta} _{{\文本{k}}} ^{1} \离开({{\眉题{\文本{X}}} _{{\文本{k}}} ^{1},{\眉题{\文本{X}}} _{{\文本{k}}} ^{2}} \右)}}{{\ mathop \总和\ nolimits_{{{文本\ {k}} = 1}} ^{{\文本{k}}} {\ upbeta} _{{\文本{k}}} ^{1} \离开({{\眉题{\文本{X}}} _{{\文本{k}}} ^ {1} -{\眉题{\文本{X}}} _{{\文本{k}}} ^{2}} \右)}}$ $gydF4y2Ba
$ ${\文本{W}} _ {{{\ upbeta} _{{\文本{k}}}}} ^{\三角洲}= \压裂{{{\眉题{\文本{X}}} _{{\文本{k}}} ^{1} \离开({{\ upbeta} _{{\文本{k}}} ^ {1} - {\ upbeta} _{{\文本{k}}} ^{2}} \右)}}{{\ mathop \总和\ nolimits_{{{文本\ {k}} = 1}} ^{{\文本{k}}}{\眉题{\文本{X}}} _{{\文本{k}}} ^{1} \离开({{\ upbeta} _{{\文本{k}}} ^ {1} - {\ upbeta} _{{\文本{k}}} ^ {2}}\右)}}$ $gydF4y2Ba

Fairlie方法主要关注不等式中被解释的部分,而不计算各因素的差异效应对未被解释部分的贡献[gydF4y2Ba14gydF4y2Ba].然而,这可以通过Power等人提出的实用技术实现。[gydF4y2Ba32gydF4y2Ba].gydF4y2Ba

分解在相关软件中的实现gydF4y2Ba

Stata的Oaxaca命令包可用[gydF4y2Ba9gydF4y2Ba)、R (gydF4y2Ba36gydF4y2Ba]和SAS宏% BO_decomp [gydF4y2Ba37gydF4y2Ba进行盲法-瓦哈卡分解。此外,Stata提供了几个开发的包,用于实现各种形式的Blinder-Oaxaca分解成非线性模型,包括fairlie [gydF4y2Ba38gydF4y2Ba], gdecomp [gydF4y2Ba39gydF4y2Ba], mvdcmp [gydF4y2Ba32gydF4y2Ba和nldecompose [gydF4y2Ba40gydF4y2Ba)(表gydF4y2Ba1gydF4y2Ba).gydF4y2Ba

表1分解两组结果差异的不同Stata命令包gydF4y2Ba

结论gydF4y2Ba

B-O分解模型的缺点gydF4y2Ba

B-O分解方法受到了一些批评,主要集中在模型规范和模型解释变量的选择上[gydF4y2Ba11gydF4y2Ba,gydF4y2Ba30.gydF4y2Ba,gydF4y2Ba41gydF4y2Ba].gydF4y2Ba

分解不考虑结果在每组个体之间的不同分布[gydF4y2Ba3.gydF4y2Ba].它只提供了两组间平均预测结果差异的信息,该差异与粗差异不同,以至于两组间其他协变量的分布不同。gydF4y2Ba

分解估计值也因参照组的选择而异。通常没有令人信服的理由去选择最好的团队。gydF4y2Ba

由于未知因素,这两个组没有可比性,因此估计受选择偏差的影响。此外,不同组别的测量误差会使结果产生偏差。因此,在估计系数时就会出现效率低下的情况,从而导致“无法解释”的成分[gydF4y2Ba3.gydF4y2Ba].此外,如果结果模型中存在一些描述错误,结果模型的残差平均值不为零,那么还会存在另一个未解释的部分,即平均观测结果的差异与平均预测结果的差异之间的差异。gydF4y2Ba

正如我们之前提到的,无法解释的部分有时被称为歧视部分。但要使该部分成为确切的歧视性部分,则结果的所有决定因素都应存在于模型中,否则该歧视性部分可能被高估或低估。忽略变量或信息偏差可能是这种过高/过低估计的一些原因[gydF4y2Ba15gydF4y2Ba].gydF4y2Ba

B-O法在健康问题中的应用gydF4y2Ba

这种B-O分解方法可以用来解释任何两个群体的健康结果不平等,这两个群体是根据种族、性别、社会经济地位等来定义的。利用该方法可以将不等式分解为两个一般分量;第一个因素可以用两个比较组间观察到的相关因素或特征的水平(分布或平均值)的差异来解释。第二个代表了不能用这种差异来解释的不平等的其余部分。事实上,尽管个人特征相同,但不平等的存在可能源于影响健康结果的未知或无法衡量的因素。它也可能是由于观察到的特征的“差异效应”(组间回归系数大小的差异)。每个组件都可以分解为更小的组件,这取决于特征(变量)的数量,可能会造成不平等(详细分解)。gydF4y2Ba

从统计上看,分解模型中的“差异效应”来源于相关因素与群体指标的相互作用效应,可以从两方面进行解释;一个取决于变量本身的性质,指的是两个比较组中的解释变量的“行为反应”,比如不同的健康行为和/或不同的个人倾向于该行为。一个例子是不同社区或不同社会群体吸烟或决定开始吸烟的可能性。这种差异可能是由于这些社区的文化、环境或态度差异[gydF4y2Ba42gydF4y2Ba].另一种则受到外部影响,原因是两组人在相关因素(特征)方面存在歧视,如获得保健服务的机会不平等和教育质量不同,而这些因素反过来又导致两组人的结果不同。例如,如果我们假设教育水平是影响健康行为的唯一已知因素,那么尽管教育水平相同,健康行为的群体差异可能是由于教育质量不同。这可以归因于在缺乏教育质量信息的情况下,教育对健康行为的“差异效应”。gydF4y2Ba

因此,除了个人和社会因素对健康的影响外,宏观政策、社会和经济规划不平等甚至不公平也起着至关重要的作用[gydF4y2Ba5gydF4y2Ba].假设在人口的不同子群体中,个人和社会特征保持不变,由于政府政策和计划的不同,预计不平等将持续存在。这意味着具有特定特征的群体接受的保健方案不同,甚至质量也不同。因此,不平等的条件是由一个社区的物质、文化、社会和经济地位所决定的,从而产生不同的、在某些情况下是不公平的机会。gydF4y2Ba

综上所述,上述分解方法可应用于健康科学领域,以确定各不均匀分布因素的贡献以及它们对差距的不同影响。因此,可以指出,在假定其他因素不变的情况下,平均结果在多大程度上根据每个因素的变化而变化。此外,它将决定造成不平等的未知因素的总体份额。实际上,在假设观测因素的分布保持相同的情况下,会估计残差[gydF4y2Ba43gydF4y2Ba].gydF4y2Ba

结果表明,将分解方法应用于健康不平等,可以识别各特定因素对当前不平等的相对贡献。因此,可以为政府规划者和政策制定者提供更详细的信息,特别是关于可改变因素的信息[gydF4y2Ba23gydF4y2Ba,gydF4y2Ba44gydF4y2Ba].gydF4y2Ba

应用的例子gydF4y2Ba

我们使用2011年STEPS伊朗非传染性疾病风险因素调查的可用数据说明了Blinder- Oaxaca分解模型。该调查是一项基于人群的研究,根据世卫组织非传染性疾病风险因素监测的逐步方法[gydF4y2Ba45gydF4y2Ba,gydF4y2Ba46gydF4y2Ba].gydF4y2Ba

主要结果是城市和农村成年人之间的肥胖和超重风险(居住地:0 =城市,1 =农村)。一组变量包括年龄(年龄),性别(1男2女),社会经济地位(SES)和身体活动(metmwcat:每周至少600 MET-minutes)被认为是预测因素。分解分析在Stata统计软件(v.14)中进行,使用Yun描述的更新的Oaxaca包[gydF4y2Ba22gydF4y2Ba].该包包含了处理路径依赖和识别问题的方法[gydF4y2Ba28gydF4y2Ba,gydF4y2Ba29gydF4y2Ba,gydF4y2Ba30.gydF4y2Ba]分析对象为15-69岁的成年人。gydF4y2Ba

三重(交互)分解类型gydF4y2Ba

我们使用Blinder-Oaxaca分解线性模型来分解预测的城乡体重指数(bmi)差异。总体和详细的结果在输出中显示gydF4y2Ba3.gydF4y2Ba.gydF4y2Ba

Stata中的“oaxaca”命令从Group 2的角度计算三次分解(Eq。gydF4y2Ba4gydF4y2Ba),除非指定了“threefold(reverse)”、“weight()”或“pooled”。本例中,“three - fold(reverse)”选项从组1的角度表达了三重分解(Eq. 5),即选择组2(即平均BMI较低的农村成年人)作为参考进行分析。如本文所讨论的,对于诸如性别之类的名义预测指标,详细的分解估计取决于基础(省略)类别的选择(识别问题)。一个解决方案是根据“标准化”效应(性别:标准化(性别?))进行分解,识别代表名义预测器的虚拟变量集,并转换系数,使结果与基线的选择保持不变[gydF4y2Ba30.gydF4y2Ba].gydF4y2Ba

在我们的样本中,城市成年人的平均预测BMI为26.4,农村成年人为25.24,BMI差异为1.156。总体而言,只有17.5%(0.202/1.156)的差异是由于预测因子(禀赋)的分布不同造成的。其中,SES的贡献最大(0.158/1.156 = 13.72%)。也就是说,缩小农村和城市成年人的社会经济地位差距将导致差距缩小约14%。此外,约25%(0.43/1.24)的差异归因于模型中输入的协变量的差异效应(系数效应),包括未知因素的一般效应(_cons)。该组件指定了差异中无法解释的部分。年龄的差异效应(0.916/1.156 = 79.2%)对这部分差异的影响最大,其次是体力活动(metmwcat)和社会经济地位(SES)。社会经济地位的负贡献意味着消除社会经济地位的城乡差异会扩大社会经济地位的差距。而“交互部分”是指禀赋与系数效应相互作用所解释的缺口。gydF4y2Ba

同样,预测的城乡差异超重和肥胖流行率(bmicat)已经使用非线性模型的B-O分解进行了分解。结果显示在Output中gydF4y2Ba1gydF4y2Ba. 如图所示,与城市成年人(46.89%)相比,控制年龄、社会经济地位、性别和体力活动,城市成年人(57.34%)的患病率仍然显著高于城市成年人(46.89%)。分解结果表明,不同的SES水平和年龄差异效应对差异的贡献最大。gydF4y2Ba

输出1gydF4y2Ba
figure5gydF4y2Ba

以农村成年人(组2)为参照的非线性模型的Blinder-Oaxaca分解(从组1的角度)gydF4y2Ba

Stata中的“oaxaca”命令也支持二进制结果的非线性分解。“logit”导致二元结果的非线性分解,使用Yun描述的加权方法进行计算[gydF4y2Ba22gydF4y2Ba].gydF4y2Ba

三倍分解结果表明,城市成年人的平均预测BMI普遍高于农村成年人,因此城市成年人的肥胖和超重患病率更高。这是由于导致肥胖的环境促进了与肥胖相关的行为,如不健康的饮食和缺乏体育活动。与这一发现一致的是,在许多发展中国家,城市化及其相关的生活方式改变被认为是肥胖和超重的重要风险因素。然而,Trivedi等人的研究并非如此。[gydF4y2Ba47gydF4y2Ba].gydF4y2Ba

在调整了一些与肥胖相关的因素后,这种差距仍在持续,这需要进一步的调查,这表明,城乡居民之间的很大一部分差异还受到其他未知因素的驱动。此外,研究结果表明,年龄对肥胖和超重风险的影响在农村和城市成年人中是不同的。更准确地说,随着年龄的增长,城市成年人的肥胖风险高于农村成年人。这与世卫组织的报告一致,该报告讨论了在发展中国家,仍保持传统生活方式的农村成年人体重随着年龄增长很少[gydF4y2Ba48gydF4y2Ba].因此,需要有效的方案来帮助城市老年人减少肥胖和不健康生活方式的高风险。gydF4y2Ba

总的来说,降低肥胖风险的政策不仅需要考虑农村/城市成年人,还需要考虑它如何与相关因素相互作用,使一些亚群体比其他更容易受到伤害。一般来说,在健康不平等中应用分解方法可以识别每个特定因素在调节不平等中的相对贡献。因此,可以为政府规划者和政策制定者提供更详细的信息,特别是关于可改变因素的信息[gydF4y2Ba23gydF4y2Ba,gydF4y2Ba44gydF4y2Ba].gydF4y2Ba

双重(区分)分解类型gydF4y2Ba

在鉴别文献中常用的一种替代分解是双重分解(等式6、7和8)。在Stata的“Oaxaca”命令中,可以执行这种分解,其中“weight()”或“pooled”指定参考系数的选择。gydF4y2Ba

使用“weight(0)”选项后的结果将显示在输出中gydF4y2Ba2gydF4y2Ba.这表明,来自组2(农村成年人)模型的系数被用作参考(非歧视性)。相反,“权重(1)”以第1组系数为标准。在我们的研究中,首选BMI平均值较低的农村成年人(第二组)作为参考。gydF4y2Ba

从产出可以明显看出gydF4y2Ba2gydF4y2Ba,“未解释的”组件与三重分解的“系数”组件完全相似(OutputgydF4y2Ba3.gydF4y2Ba).这一成分常被用来衡量歧视,但它也包含了未观察到的预测因素中的群体差异的影响。要使该部分成为准确的判别部分,则结果的所有决定因素都应存在于模型中,否则该部分可能会被高估或低估。gydF4y2Ba

输出2gydF4y2Ba
figure6gydF4y2Ba

利用来自农村成人模型的系数作为参考系数对线性模型进行双重(鉴别)盲-瓦哈卡分解gydF4y2Ba

输出3gydF4y2Ba
figure7gydF4y2Ba

以农村成年人(组2)为参照的线性模型的Blinder-Oaxaca分解(从组1的角度)gydF4y2Ba

如图所示,观测协变量(解释分量)水平的差异占总差异的75%(0.867/1.156)。这个组件是三次分解的“禀赋”和“交互”部分的组合(OutputgydF4y2Ba3.gydF4y2Ba).虽然这个分量在很多文本中被称为二元分解中的解释分量,但其中的一部分(交互部分)实际上是两组系数和协变量水平的同时差。因此,如果有人想要粗略解释的组件,三次分解可以提供这个粗略解释的部分。gydF4y2Ba

在输出gydF4y2Ba4gydF4y2Ba,“pooled”指定所有案例中来自pooled模型的系数用于分解。结果还表明,社会经济地位的不同和年龄的差异效应对差异的贡献最大。然而,它清楚地表明,分解估计的变化取决于参考群体的选择(指标问题)。通常没有令人信服的理由去选择最好的团队。gydF4y2Ba

输出4gydF4y2Ba
figure8gydF4y2Ba

线性模型的双重(判别)盲Oaxaca分解,使用两组上的混合模型的系数作为参考系数gydF4y2Ba

另外,对于非线性模型可以要求双重分解。在输出gydF4y2Ba5gydF4y2Ba,预测的城乡差异超重和肥胖流行率(bmicat)已使用Blinder-Oaxaca分解非线性模型进行分解。gydF4y2Ba

输出5gydF4y2Ba
figure9gydF4y2Ba

利用来自农村成人模型的系数作为参考系数的非线性模型的双重(鉴别)盲-瓦哈卡分解gydF4y2Ba

二元结果的另一种非线性分解命令可用作“fairlie”[gydF4y2Ba14gydF4y2Ba].gydF4y2Ba

主要结果是农村和城市成年人之间肥胖和超重比例(bmicat)的差异(居住:必须编码为0和1)。因此,该技术将农村/城市差异分解为“平均预测结果概率”。然而,它主要关注不平等的解释部分,而没有计算每个因素对未解释部分的差异效应的贡献[gydF4y2Ba14gydF4y2Ba].gydF4y2Ba

非线性模型的主要问题是对分解过程中所包含变量的顺序(路径依赖)敏感。fairlie技术通过在分解的重复过程中随机排序变量来解决问题[gydF4y2Ba28gydF4y2Ba].gydF4y2Ba

“ro”选项使变量的顺序在分析中被随机化。Reps(#)定义分解复制的数量。因此,选择多数群体(等于少数群体的样本量)的多个随机子样本(如100或1000次),以均值估计作为最终估计[gydF4y2Ba14gydF4y2Ba,gydF4y2Ba24gydF4y2Ba,gydF4y2Ba28gydF4y2Ba,gydF4y2Ba33gydF4y2Ba].gydF4y2Ba

Ref(#)指定用于分解的参考系数。" ref(1) "表明使用的系数来自组= = 1模型(农村成年人)。它相当于双重Blinder-Oaxaca分解模型中的“权重(0)”。gydF4y2Ba

输出gydF4y2Ba5gydF4y2Ba和gydF4y2Ba6gydF4y2Ba报告通过两种分解方法,非线性Blinder-Oaxaca技术和fairlie技术估算了超重和肥胖患病率的城乡差距。与控制年龄、社会经济地位、性别和体育活动的城市成年人相比,城市成年人的患病率仍然显著较高。这与上述所有报告是一致的。在这些预测因子中,大约72%(0.0753/0.104)的差异可以由农村/城市差异解释。其中,SES贡献最大。gydF4y2Ba

输出6gydF4y2Ba
图10gydF4y2Ba

Fairlie分解模型采用农村成人模型的系数作为参考系数gydF4y2Ba

数据和材料的可用性gydF4y2Ba

不适用。gydF4y2Ba

缩写gydF4y2Ba

这:gydF4y2Ba

Blinder-Oaxaca分解方法gydF4y2Ba

加州大学:gydF4y2Ba

原因不明的组件gydF4y2Ba

电子商务:gydF4y2Ba

解释组件gydF4y2Ba

体重指数:gydF4y2Ba

身体质量指数gydF4y2Ba

SES:gydF4y2Ba

社会经济地位gydF4y2Ba

参考文献gydF4y2Ba

  1. 1.gydF4y2Ba

    英国卫生保健使用的不平等与不平等:一项实证调查。中华医学杂志。2005;60(6):1251-66。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  2. 2.gydF4y2Ba

    定义健康中的公平。中华流行病学杂志。2003;57(4):254-8。gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  3. 3.gydF4y2Ba

    Ospino CG, Vasquez PR, Narvaez NB。瓦哈卡-布林德工资分解:方法、批评和应用。一个文献综述。resta de Economía del Caribe. 2010; 5:237-74。gydF4y2Ba

    谷歌学者gydF4y2Ba

  4. 4.gydF4y2Ba

    Kawachi I,Subramanian SV,Almeida Filho N.《健康不平等词汇表》。J流行病和社区卫生。2002;56(9):647–52.gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  5. 5.gydF4y2Ba

    格雷厄姆,H.和M.P.凯利,《健康不平等:概念、框架和政策》。2004年:伦敦卫生发展局。gydF4y2Ba

  6. 6.gydF4y2Ba

    世界卫生组织,卫生不平等监测手册,特别关注低收入和中等收入国家。2013.可以从:gydF4y2Bahttps://www.who.int/docs/default-source/gho-documents/health-equity/handbook-on-health-inequality-monitoring/handbook-on-health-inequality-monitoring.pdf?sfvrsn=d27f8211_2gydF4y2Ba.gydF4y2Ba

  7. 7.gydF4y2Ba

    布林德。工资歧视:简化形式和结构估算。J Hum Resources. 1973; 8:436-55。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  8. 8.gydF4y2Ba

    瓦哈卡州:城市劳动力市场的男女工资差异。国际经济Rev. 1973; 14:693-709。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  9. 9.gydF4y2Ba

    线性回归模型的Blinder-Oaxaca分解。基因组学杂志。2008;8(4):453-79。gydF4y2Ba

    谷歌学者gydF4y2Ba

  10. 10.gydF4y2Ba

    利用家庭调查数据分析卫生公平:技术及其实施指南。世界银行出版物,2008年。gydF4y2Ba

  11. 11.gydF4y2Ba

    分解群体之间的差异:衡量歧视的警告。社会学方法1984;12(3):323-43。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  12. 12.gydF4y2Ba

    Daymont TN, Andrisani PJ。工作偏好、大学专业和收入的性别差距。J Hum Resources. 1984; 19:408-28。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  13. 13.gydF4y2Ba

    《布林德-瓦哈卡分解技术》国际社会科学百科全书。2021年6月17日从百科全书检索到:gydF4y2Bahttps://www.encyclopedia.com/social-sciences/applied-and-social-sciences-magazines/blinder-oaxaca-decomposition-techniquegydF4y2Ba.于2021年7月23日通过。gydF4y2Ba

  14. 14.gydF4y2Ba

    费尔利RW光碟。将Blinder-Oaxaca分解技术扩展到logit和probit模型。经济与社会科学学报。2005;30(4):305-16。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  15. 15gydF4y2Ba

    论工资差异的分解。Rev Economics Statistics. 1988; 70:236-43。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  16. 16gydF4y2Ba

    Neumark D.《雇主的歧视行为与工资歧视的估计》,Hum资源杂志,1988;23:279-95。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  17. 17.gydF4y2Ba

    歧视与工资差异的分解。J计量经济学。1994;61(1):5 - 21日。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  18. 18.gydF4y2Ba

    女人落后于男人吗?性别差距动态的匹配样本分析。性别差距动态匹配样本分析(2016年5月21日),2016年。gydF4y2Ba

  19. 19.gydF4y2Ba

    《劳动力市场对西班牙裔和黑人的歧视》,经济统计版,1983年;65:570–9。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  20. 20.gydF4y2Ba

    费尔利RW光碟。非裔美国人没有自己的企业:自我雇佣的动态分析。法律经济学。1999;17(1):80-108。gydF4y2Ba

    谷歌学者gydF4y2Ba

  21. 21.gydF4y2Ba

    基于非线性模型的Blinder-Oaxaca分解。旅行社。2008, 92(2): 197 - 206。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  22. 22.gydF4y2Ba

    Yun xm。在第一时间分解差异。经济学博士。2004;82(2):275 - 80。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  23. 23.gydF4y2Ba

    南非体重不足和肥胖的种族和性别差异分析。经济Hum Biol. 2014; 15:23-40。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  24. 24.gydF4y2Ba

    等。应用非线性Blinder-Oaxaca分解研究美国抗肥胖药物使用中的种族/民族差异。中国医药科学。2013;9(1):13-26。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  25. 25.gydF4y2Ba

    刘浩,方H,赵Z。1989-2006年中国城乡儿童健康和营养状况的差异。经济哼生物。2013;11(3):294–309.gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  26. 26.gydF4y2Ba

    爱尔兰产妇在出院时母乳喂养的出生差异。经济社会修订版2014;45(4):455-84。gydF4y2Ba

    谷歌学者gydF4y2Ba

  27. 27gydF4y2Ba

    是什么导致了美国出生体重低的黑人和白人之间的差异?卫生经济学。2012;21(3):301 - 15所示。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  28. 28gydF4y2Ba

    费尔利RW光碟。在logit, probit和其他非线性模型的非线性盲-瓦哈卡分解技术中解决路径依赖和纳入样本权重。加州大学圣克鲁兹分校工作论文,2016。从检索gydF4y2Bahttp://people.ucsc.edu/~rfairlie/decomposition/decomprevisted_v9.docxgydF4y2Ba.gydF4y2Ba

    谷歌学者gydF4y2Ba

  29. 29.gydF4y2Ba

    王志强,等。分解伊朗成年人总的体育活动的性别差异。增加健康。2017;39:e2017044。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  30. 30.gydF4y2Ba

    云女士。详细工资分解中识别问题的简单解决方案。经济学杂志。2005;43(4):766-72。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  31. 31.gydF4y2Ba

    Yun xm。识别问题和详细的瓦哈卡分解:一个通用的解决方案和推论。经济与社会学报。2008;33(1):27-38。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  32. 32.gydF4y2Ba

    权力DA, Yoshioka H, Yun M-S。非线性响应模型的多元分解。占据j . 2011; 11(4): 556 - 76。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  33. 33.gydF4y2Ba

    聂鹏,苏萨-波扎。欧洲老年人的食品不安全:来自欧洲健康、老龄化和退休调查的证据。2016,霍恩海姆大学商学院,经济和社会科学。gydF4y2Ba

  34. 34.gydF4y2Ba

    尼尔森海关。logit模型中的鉴别和详细分解。经济学博士。1998;61(1):115 - 20。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  35. 35.gydF4y2Ba

    甚至我们,麦克弗森·达,《私营部门工会主义的衰落和性别工资差距》,J Hum资源,1993;28:279–96。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  36. 36.gydF4y2Ba

    Hlavac M. Oaxaca: blinder-oaxaca decomposition in r. browser下载本文,2014。gydF4y2Ba

  37. 37.gydF4y2Ba

    Lewis T, Ezoua S. A Simple SAS®Macro to Perform Blinder-Oaxaca Decomposition. 2016;gydF4y2Bahttp://analytics.ncsu.edu/sesug/2016/SD-162_Final_PDF.pdfgydF4y2Ba.gydF4y2Ba

  38. 38.gydF4y2Ba

    Jann B. Fairlie:生成二元结果微分的非线性分解的stata模块。2006.gydF4y2Ba

  39. 39gydF4y2Ba

    非线性模型的边缘效应和扩展Blinder-Oaxaca分解。在2006年英国Stata用户小组会议上。2006.占据用户组。gydF4y2Ba

  40. 40.gydF4y2Ba

    林明明,杨文明,杨文华.非线性回归模型的盲瓦哈卡分解.林分基因组学科学.2008;8(4):480-92。gydF4y2Ba

    谷歌学者gydF4y2Ba

  41. 41.gydF4y2Ba

    Oaxaca RL, Ransom先生详细的工资分解鉴定。经济研究。1999;81(1):154-7。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  42. 42.gydF4y2Ba

    分解美国青少年吸烟的种族差异。经济Hum Biol. 2016; 22:161-76。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  43. 43.gydF4y2Ba

    杜博维茨等。美国健康行为的种族/民族差异:分解分析健康行为杂志2011;35(3):290-304。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  44. 44.gydF4y2Ba

    陈志强,陈志强。经济学中的分解方法。《劳动经济学手册》2011;4:1-102。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  45. 45.gydF4y2Ba

    世卫组织非传染性疾病风险因素监测的逐步方法:国家数据和报告(引用于2021年)。gydF4y2Bahttps://www.who.int/teams/noncommunicable-diseases/surveillance/systems-tools/stepsgydF4y2Ba.2020年5月访问。gydF4y2Ba

  46. 46.gydF4y2Ba

    世卫组织STEPS监测手册,《世卫组织非传染性疾病风险因素逐步监测方法》。最后更新日期:2017年1月26日。gydF4y2Bahttps://www.who.int/ncds/surveillance/steps/STEPS_Manual.pdf?ua=1gydF4y2Ba.2021年5月访问。gydF4y2Ba

  47. 47.gydF4y2Ba

    等。美国农村和城市成年人的肥胖及肥胖相关行为2015.gydF4y2Ba

  48. 48.gydF4y2Ba

    肥胖:预防和管理全球流行病。2000.gydF4y2Ba

下载参考gydF4y2Ba

致谢gydF4y2Ba

作者非常赞赏伊朗卫生和医学教育部非传染性疾病控制中心为应用实例提供的数据。gydF4y2Ba

资金gydF4y2Ba

作者的这项工作没有获得任何资金。gydF4y2Ba

作者信息gydF4y2Ba

从属关系gydF4y2Ba

作者gydF4y2Ba

贡献gydF4y2Ba

第一作者(RE)对最初的想法的概念,手稿的写作和执行分析做出了很大的贡献。第二作者(SSHN)构思了最初的想法,提供了文章的关键修改,并监督了项目。两位作者都阅读并批准了最终的手稿。gydF4y2Ba

相应的作者gydF4y2Ba

对应到gydF4y2Ba赛义德·赛义德·哈什米·纳扎里gydF4y2Ba.gydF4y2Ba

道德声明gydF4y2Ba

伦理批准和同意参与gydF4y2Ba

我们使用了2011年STEPS伊朗非传染性疾病风险因素调查的二手数据。作者证实,这些数据没有识别信息。gydF4y2Ba

同意出版gydF4y2Ba

论文的两位作者都同意发表。gydF4y2Ba

相互竞争的利益gydF4y2Ba

两位作者没有利益冲突。gydF4y2Ba

额外的信息gydF4y2Ba

出版商的注意gydF4y2Ba

亚搏体育官方电话施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。gydF4y2Ba

权利和权限gydF4y2Ba

开放获取gydF4y2Ba本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料都包含在本文的知识共享许可中,除非在该材料的信用额度中另有说明。如果资料不包括在文章的知识共享许可协议中,并且你的预期用途没有被法律规定允许或超过允许用途,你将需要直接从版权所有者获得许可。如欲查阅本许可证副本,请浏览gydF4y2Bahttp://creativecommons.org/licenses/by/4.0/gydF4y2Ba.创作共用及公共领域专用豁免书(gydF4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/gydF4y2Ba)适用于本文提供的数据,除非在数据的信贷额度中另有说明。gydF4y2Ba

再版和权限gydF4y2Ba

关于这篇文章gydF4y2Ba

通过CrossMark验证货币和真实性gydF4y2Ba

引用这篇文章gydF4y2Ba

布林德-瓦哈卡分解方法及其在健康不平等中的应用的详细解释和图形表示。gydF4y2Ba紧急情况的主题论文gydF4y2Ba18日,gydF4y2Ba12(2021)。https://doi.org/10.1186/s12982-021-00100-9gydF4y2Ba

下载引用gydF4y2Ba

关键字gydF4y2Ba

  • 健康不平等gydF4y2Ba
  • 分解方法gydF4y2Ba
  • 促成因素gydF4y2Ba
Baidu