跳过主要内容

在加强管理数据集方面,调查数据的标准多重归并没有比简单的替代表现得更好:英格兰的自我评估健康的例子

摘要

背景

健康调查提供了丰富的信息,但涉及的个人人数相对较少,而且有证据表明,随着应对水平的下降,这些调查的代表性越来越小。常规收集的行政数据提供了更广泛的人口覆盖范围,但通常包含较少的健康主题。我们探讨了从调查数据中对健康变量进行数据组合和多重imputation是否是在一般人群中产生这些变量的一种简单而可靠的方法。

方法

我们使用英国综合住户调查和英国2011年人口普查,这两项调查都包括自我评估的总体健康状况。撇开人口普查自评健康数据不谈,我们利用调查数据将人口普查的自评健康回答相乘,并将其与根据年龄、性别、住房保有权和地理区域定义的576个独特群体的实际人口普查结果进行比较。

结果

与各个组的原始人口普查数据相比,多重估算的糟糕或非常糟糕的自我评估健康的比例,并不比简单地从调查比例得出的比例明显更好。

结论

虽然多重估算有可能利用调查所得的信息来扩充人口数据,但还需要进一步的检验和改进。

背景

许多国家依靠调查来估计卫生措施和与健康有关的接触的流行率和发生率,而这些并不是对全体人口定期收集的。这些估计数对于包括资源规划和监测国家战略的有效性很重要。然而,调查样本很少能代表目标人群。特别是,年龄较大、患病、处境不利或健康行为不良的个人在调查中的代表性往往不足[1,这是一个重要的遗漏,因为在确定卫生和经济政策的优先事项时,这些群体往往是最感兴趣的群体。此外,许多调查规模太小,无法进行子群体分析。随着时间的推移,回应水平不断下降,调查和人口数据之间缺乏一致性的情况越来越严重[2].这一问题的常见解决方案包括使用反概率加权和/或分层后权重,以纠正因抽样设计和/或响应水平而导致的目标人群代表性偏离的基于调查的结果。然而,这种方法往往是有限的,因为权重通常是基于人口特征(通常是年龄和性别)的有限组合。更精细的定制技术已被用于某种效果,从调查中获得优越的总体和子总体水平估计[3.45例如,使用多级模型来估计受访者特征的兴趣的变量,以及受访者生活的区域的变量,这些模型的结果随后由目标群体中建模特征的频率加权[46].虽然这类方法改进了传统的加权方法,包括调查和目标人口共有的更多变数,但它们的使用仍然有限,特别是产生群体水平估计数而不是进一步统计分析所需的个别数据。

与具体的调查相反,行政数据,例如人口普查,往往高度代表目标人口。然而,为了保持高反应水平,减轻参与者负担,并降低成本,只提出了有限的问题[7].例如,许多人口普查不包括吸烟,尽管人们认识到吸烟在决定健康结果方面的重要性[8].因此,对吸烟的影响和旨在减少吸烟的干预措施或政策的影响的估计是基于调查数据,同时伴随的问题是样本较小和没有回应,这意味着结果可能不能代表目标人群,而且某些亚群体和小地理区域的时间趋势和估计,往往是在改善健康和减少不平等方面最感兴趣的那些,是不精确的[9].的确,政府各部门和其他方面都提倡将吸烟纳入英国人口普查,但这一做法尚未被采纳,将来也不大可能纳入[10].因此,需要一种简单,透明和坚固的方法,允许分析代表性数据,例如种群群体,如吸烟或任何其他变量都在内进行。

其中一种方法是利用包含该变量的调查数据,并应用标准多重imputation (MI)技术,将感兴趣的变量输入人口普查[11].这个想法并不新鲜[12,但我们不知道它实际应用的任何实例。因此我们有测试的有效性的方法使用英语的人口普查数据和相应的英语调查,使用通用的例子自我报告健康这是可用在两种数据集,允许直接比较的数据估算与实际调查的人口普查的人口普查数据。这些普查数据被政府、决策者和研究人员广泛用于探索健康的社会经济和地理模式[13]以及通过调查数据可能加强这些措施对改善卫生、经济和社会政策具有巨大潜力。

方法

数据集

人口普查数据集是人口普查微观数据个人保障样本(地区):英格兰和威尔士[14,这是2011年4月人口普查中5%的分层样本,按比例代表了这些国家的人口。这个数据集提供了比标准人口普查表更广泛的变量的匿名个人水平数据,标准人口普查表基于整个人口,通常限于三或四个变量的交叉表格。人口普查中的自我健康评估是基于这样一个问题:“总体上你的健康状况如何?”(非常好,很好,一般,不好,非常坏)”。统计调查数据来自综合住户统计调查[15],结合了一般生活方式调查,生活成本和食品调查以及劳动力/年度人口调查中的核心问题。我们选择了2011年4月至2012年3月的数据集,因为这与人口普查数据和问题措辞类似于2011年人口普查。综合家庭调查中的自我评价的健康是基于问题“您的健康状况如何普遍存在;你会说这是......(非常好,好,公平,坏,还是非常糟糕)?“调查和人口普查数据都从英国数据档案中获取。

两个数据集的总体框架为:

  1. 一个。

    生活在英格兰的人,由于每个国家的人口普查略有不同,而且在如何将自我评估的健康概念与客观健康联系起来方面存在国家差异[16];因此,选择最大的英国国家简化了分析。

  2. b。

    年龄在25-64岁的人作为最高资格被纳入了我们的MI,而拥有正式资格的老年人较少。

  3. c。

    由于调查没有全面覆盖社区设施,那些生活在非社区家庭并被归为常住居民的人(因此不包括经常离家居住的学生和访客)。

构成MI基础的变量被选择为自评健康的预测变量,这些变量在两个数据集中可用并能够协调(见表)1).关键变量(包括在MI中并构成健康模式检查分层基础的变量)是年龄、性别、住房期限和英语地区。辅助变量(包括在MI中但没有在后续分层中)是教育、婚姻状况、出生国家和种族。种族变量见表1为方便起见,是五类摘要;在归因模型中使用的变量将受访者分为18个不同的组。少量缺少协调变量的调查记录被删除,以保持后续估算的简单性;人口普查记录没有遗漏变量,因为这是由人口普查办公室在公布前进行的估算。在归化之前,将协调的数据集合并到一个文件中,并从人口普查记录中删除自评健康变量,留下一个“缺失的”自评健康数据集,从余下的(调查)数据中归化。

表1人口普查和调查数据集中协调关键和辅助归因变量的分布

多重归物

MI是一种灵活的、基于模拟的统计技术,用于处理缺失数据,充分考虑到缺失引起的不确定性[17].与其他方法相比,它很有吸引力,因为它使方差和置信区间的估计相对简单。MI在缺失随机假设下产生多组似然值[18].在这一假设下,我们认为人口普查数据中缺失的自评健康值可以通过人口普查和调查数据中的关键和辅助变量以及调查参与者的自评健康观察得到充分的信息。在这种情况下,人口普查中缺失的自评健康数据来自MI模型,该模型包括所有变量的主要影响,以及关键变量(年龄、性别、住房期限和英国地区)之间的所有可能的交互作用。探索了四种不同的模型:(a)标准logistic回归比较非常坏/坏与一般/好/非常好自我报告的健康状况;(b)泊松回归也是基于二分自评健康,给出风险估计,而不是非常糟糕/糟糕的自我报告健康的几率;(c)在比例优势假设下,考虑每个类别之间的距离相等的五个自评健康排序类别的有序逻辑回归;(d)五类自评健康变量的多项logistic回归,不考虑类别的间隔或顺序。合并数据集中的人口普查记录约占观测数据的90%,因此按照估计数量反映缺失百分比的建议进行了90次估算[19].使用标准技术对输入的数据集进行分析,得出的估计结果和标准误差根据“鲁宾规则”在所有90个数据集上取平均值[11],详情载于附加文件1.在Stata v14中使用mi impute命令执行imputation(和分析)[20.].

评估

先天的(见初步分析计划[21])通过在关键变量的所有576个组合(8岁×2性别类别×4个住宅任期类别×4个住房实体类别×4个住宅保单× 9 English regions) as similar three and four way tables are used to realise census results. For comparison, these were compared with missing census proportions derived directly from the survey (without imputation). Associations between the actual census proportions of bad health and those from MI models (or directly from the survey) were explored graphically and using lines of best fit to these data (weighted according to the size of each age-sex-tenure-region category). Specifically, we considered the extent to which the lines of best fit deviated from the line of equality (y = x) with slope = 1 and intercept = 0, representing (theoretical) perfect agreement. We also considered the strength of the linear association between actual and imputed proportions of bad health using correlation coefficients.

结果

原始的人口普查和调查数据集分别包含2848155和374218条记录,其中139094人(49%)和134717人(36%)是25-64岁的受访者,居住在英格兰,是非公共家庭的常住居民。共有634名(0.5%)受访者在调查数据集中至少有一个关键或辅助变量的值缺失,他们被从分析中删除,在分析数据集中总共有134,083名受访者。人口普查和调查中归责变量的分布情况见表1.这两个数据集的分布情况大致相似,与人口普查的受访者相比,受访者年龄稍大,受教育程度更高,女性的可能性更大,拥有自己的住房,已婚的比例也更高。

关于自评健康问题的普查和调查答复见表2.总体而言,受访者对自己的健康不太乐观,78%的受访者认为自己的健康状况良好或非常好,而普查中83%的受访者认为自己的健康状况良好或非常好。数字1在576个年龄、性别、任期和地区的组合中,显示了调查与人口普查受访者中认为自己健康状况“不好”或“非常不好”的比例的散点图。虚线是等号线,代表人口普查和调查措施之间的完全一致,实线(阴影线)是描述两者之间关联的最佳拟合(95%置信区间)的回归线。这条最佳拟合线的截距和斜率见表3..两组数据中所占比例之间存在较强的线性关系(相关系数= 0.93;表格3.).然而,该调查高估了自认为健康状况较差或非常差的受访者的比例,证据是回归线缺乏对应关系(截距(95%置信区间):0.01 (0.00,0.01);斜率(95%置信区间):0.82(0.79,0.84))和等号线。

表2自评健康在原始人口普查数据与调查数据或推断数据中的总体分布
图1
图1

比较原始人口普查数据与调查数据中自我评价较差或非常差的健康比例

表3 576个组的不良或非常不良的自评健康比例之间的线性关联,比较原始人口普查数据和调查数据

图中给出了乘法输入数据的类似结果。2(表格23.).坏或非常糟糕的自我报告健康的总体分布估算到人口普查从调查数据使用标准的物流或泊松回归非常相似的原始调查数据(6.3%和6.2%的估算人口普查数据与原始调查数据中有6.2%是坏或很糟糕),因此,与原始普查值(5.1%)不同。576个年龄、性别、任期和地区组合的结果(图。2,左上方和右侧)也与原始调查数据的那些非常相似,具有强烈的线性关系,但通常相对于原始人口普查值(Logistic拦截:0.00( - 0.00,000);斜率:0.82(0.79,0.84);相关性:0.95;泊松:0.00( - 0.00,000); 0.80(0.78,0.82); 0.95)。使用序数逻辑回归的自我评价健康的总体分布在原始调查数据中再次比原始人口普查数据(6.2%不好或非常糟糕的自我额定健康状况)更类似于原始调查数据。最初,它似乎为576类的关联更适合原始人口普查数据(截距: - 0.01( - 0.01,0.00);斜率:1.00(0.98,1.03))比来自原始调查数据的斜率。然而,虽然在范围中间的值之间有合理的线性协议,但估算的数据在分布的下端和上端在分布的下端和上端的自我评级健康的比例大幅度高估,并且在实践中,如二次模型在描述算和原始人口普查值之间的关联(图。2左下角)。使用多项logistic回归计算的人口普查数据的结果与原始调查数据非常相似(6.5%的自评健康状况不好或非常差;截距:−0.00(−0.01,−0.00);斜率:0.83 (0.81,0.85);相关性:0.95;无花果。2右下角)。

图2
figure2

比较原始人口普查数据中不良或非常不良的自评健康比例与调查数据推断的数据

讨论

我们的目的是评估将MI应用于综合住户调查的数据是否能提供一种简单、方便和可靠的方法来预测英国人口普查中不良或非常糟糕的自我评估健康的(已知)流行率。我们分析的主要优势是能够根据已知结果测试MI的性能;通常这种交叉验证在估计总体参数的方法评估中是缺失的。我们的结果表明,估计自评健康的分布比普查数据更类似于原始调查,而标准MI几乎没有提供额外的好处。这突出了在开发增强常规数据集的工具时,与已知数据进行比较的重要性。

尽管我们包括了广泛的自我报告健康的预测因素,以及四个关键变量之间所有可能的相互作用,但归因过程不足以完全解释调查和普查人群之间的差异。由于多重归因往往在较高水平的缺失观测中表现不佳,[22在汇集的数据集中,大部分(90%)记录是人口普查记录,这可能部分地解释了我们的应用程序的边际效益。包括辅助变量的额外交互可能会改进模型,但这在我们的标准软件(Stata v14)中是不可能的,可能需要更多的专业软件,这使得它不适合一般应用。通过将机器学习融入到过程中,当前模型的准确性可能会得到提高,从而能够识别出一个最优预测模型,该模型具有丰富的高阶项阵列,超出了选定的双向交互。此外,采用基于广义线性混合模型的方法,允许特定的聚类加权,也可以提高精度。同样,在多个估算模型中加入调查设计权重也可以用来改进基于调查的估计[2324].然而,这些更复杂的方法会限制可访问性。然而,也许最重要的限制是,该方法依赖于两个数据集共有的协调变量。在目前的分析中,变量的选择是基于它们与自我评估健康的已知关联,并基于它们可以在整个人口普查和调查中得到协调,而且目前的模型可能忽略了重要的变量。人口普查等行政数据的优势在于其代表性,但由于需要限制所提问题的数量,这一优势往往受到削弱。因此,数据集之间的可用性和可比性将限制MI可用变量的范围,这可能会限制该方法在某些情况下的实际应用。

有担心的是,基于调查的人口参数估计不足以提供信息,以告知资源规划和政策开发和评估,特别是作为最恶劣,最不利弊,最不健康的生活方式的子人群越来越强化了2].除了限制了调查数据分析结果的通用性之外,最常被遗漏的群体是那些在确定经济和公共卫生政策方面具有最大潜在重要性的群体。许多调查得出并提供一般权重,以便从具有代表性的人口分析中得出数据。然而,这些权重往往仅基于少数人口特征(通常是简单的年龄和性别),其充分正确估计的能力可能有限[2526].对行政数据库和其他“大数据”来源的更多访问,以及这些数据库和“大数据”的更广泛的人口覆盖,为克服这些缺点创造了潜在的机会[2728].然而,这些数据集往往不包括调查所包含的变量的范围或质量,例如,英国人口普查不包括关于吸烟的问题,这就产生了对替代分析方法的需求,以弥补差距。

结论

我们已经探索了一种易于应用和获取的方法,使用MI模型来输入个人级别的数据,便于在进一步建模中使用,从一个调查到一个更大但不太全面的管理数据集。然而,我们的研究结果表明,这种方法的实际应用并不简单。我们不会低估它在增强常规数据集方面的用途。然而,显然需要进一步的工作来探索它的有效性和在这一背景下的应用,特别是,重要的是了解如何识别和发展最佳的归因模型,以及如何选择最有用的调查和变量纳入其中。我们建议遵循我们的示例,将估算的调查值与管理数据中已知的值进行比较,以便更严格地评估不同方法和数据集的性能和有效性。

数据和材料的可用性

在当前的研究中使用和/或分析的数据集可从通信作者在合理的要求。

参考文献

  1. 1.

    Lorant V,Demarest S,Miermans PJ等。测量健康状况的社会经济风险因素的调查误区:调查与人口普查的比较。int j流行病。2007; 36(6):1292-9。

    文章谷歌学术搜索

  2. 2.

    王志强,王志强,王志强,等。对调查对象和非调查对象之间差异趋势估计的影响:世卫组织莫妮卡项目27个群体的结果。欧洲流行病学杂志。2005;20(11):887-98。

    文章谷歌学术搜索

  3. 3.

    王伟,王志强,王志强,等。以非代表性投票预测选举。地理科学进展。2015;31(3):980-91。

    文章谷歌学术搜索

  4. 4。

    预测小区域健康相关行为:吸烟和饮酒指标的比较。社会科学与医学2000;50(7-8):1109-20。

    中科院文章谷歌学术搜索

  5. 5.

    Smith DM, Pearce JR, Harland K.确定性空间微观模拟模型能否为健康行为提供可靠的小范围估计?这是新西兰吸烟盛行的一个例子。健康的地方。2011;17(2):618 - 24。

    文章谷歌学术搜索

  6. 6.

    moong, Altankhuyag G, Barnard S等。《苏格兰吸烟地图集》附录4苏格兰NHS:朴茨茅斯大学;2006.

    谷歌学术搜索

  7. 7.

    国家统计局。2021年的人口普查。评估最初用户对英格兰和威尔士内容的要求。应对咨询。国家统计局人口普查转型计划,2016。

  8. 8.

    王志强,王志强,王志强,等。与吸烟有关的死亡率:对英国男性医生50年的观察。BMJ。2004, 328(7455): 1519。

    文章谷歌学术搜索

  9. 9.

    在多大程度上可以用吸烟来解释苏格兰劳动老年人死亡率和心脏病发病率的不平等现象?相对和绝对方法。卫生的地方。17 2011;(5):1132 - 6。

    文章谷歌学术搜索

  10. 10.

    国家统计局。2021年的人口普查。评估最初用户对英格兰和威尔士内容的要求。健康主题报告。国家统计局人口普查转型计划,2016。

  11. 11.

    鲁宾DB。调查中无回应的多重归责。纽约:威利;1987.

    谷歌学术搜索

  12. 12.

    关于“抽样调查中的加权和预测”的讨论。中国农业科学。2008;60(3-4):168-9。

    文章谷歌学术搜索

  13. 13.

    国家统计局。为什么要进行人口普查。https://www.ons.gov.uk/census/2011census/whywehaveacensus.2018年9月访问。

  14. 14。

    国家统计局。2011年人口普查Microdata个人保护样本(区域):英格兰和威尔士[数据收集]。英国的数据服务。SN:7605. 2014。

  15. 15。

    国家统计局。综合住户调查,2011年4月- 2012年3月[数据收集]。英国的数据服务。SN: 7159。2012.

  16. 16.

    健康自我报告是否存在“苏格兰效应”?2001年英国人口普查的个人水平分析。BMC公共卫生,2006;6:191。

    文章谷歌学术搜索

  17. 17.

    Sterne Jac,White Ir,Carlin JB等人。流行病学与临床研究中缺失数据的多重归责:潜在和陷阱。BMJ。2009; 339:157-60。

    谷歌学术搜索

  18. 18.

    鲁宾DB。推论和缺失的数据。生物统计学。1976;63(3):581 - 90。

    文章谷歌学术搜索

  19. 19.

    White IR, Royston P, Wood AM。链式方程的多元归算:实践中的问题与指导。统计医学。2011;30(4):377 - 99。

    文章谷歌学术搜索

  20. 20.

    StataCorp。占据:释放14。统计软件。大学站:StataCorp LLC;2015.

    谷歌学术搜索

  21. 21.

    Popham enhancing_admin_data_protocol_v1.2.pdf。https://osf.io/pr8kv/.2018年9月访问。

  22. 22.

    分类和连续变量的多级归算的完全条件规范方法。Psychol方法。2018;23:298 - 317。

    文章谷歌学术搜索

  23. 23.

    De Sliva AP, De Silva AM, Lee KJ, Moreno-Betancur M, Simpson J.在具有抽样权的纵向研究中处理缺失值的多种imputation方法:Stata中实施的方法的比较。Biom j . 2020。https://doi.org/10.1002/bimj.201900360

    文章谷歌学术搜索

  24. 24.

    Gray L, Gorman E, White IR, Katikireddi SV, McCartney G, Rutherford L, Leyland AH。利用记录关联、综合观察和模式混合建模纠正健康调查中的不参与偏差。统计方法:29(4):1212-26。

    文章谷歌学术搜索

  25. 25.

    高曼,李丽兰,麦卡特尼等。通过与酒精相关结果的行政数据联系,评估人口抽样健康调查的代表性。流行病学杂志。2014;180(9):941-8。

    文章谷歌学术搜索

  26. 26。

    王志强,王志强,王志强,等。与普通民众相比,受访者的健康状况如何?:使用与调查相关的死亡记录来比较死亡结果。流行病学。2018;29(2):299 - 307。

    文章谷歌学术搜索

  27. 27。

    高曼,李丽兰,麦卡特尼等。使用记录关联对调查的不代表性进行调整:苏格兰剥夺酒精消费的精确估计。上瘾。2017;112(7):1270 - 80。

    文章谷歌学术搜索

  28. 28.

    陈志强,陈志强,陈志强,等。在分类回归模型中二元/分类协变量的群体校准的多重imputation。地中海统计》2018。https://doi.org/10.1002/sim.8004印刷前Epub).

    文章PubMed公共医学中心谷歌学术搜索

下载参考

确认

不适用。

资金

这项工作得到了医学研究理事会(MC_UU_12017/13)和苏格兰政府首席科学家办公室(SPHSU13)的支持。

作者信息

从属关系

作者

贡献

FP对这项研究有最初的想法,是由LG、OM和EW共同开发的。OM和EW进行了数据分析。FP撰写了论文的初稿。所有作者都审阅了最终版本。FP是担保人。所有作者阅读并批准了最终的手稿。

相应的作者

对应到弗兰克·波法

道德声明

伦理批准和同意参与

不适用;辅助数据分析。

同意出版物

不适用。

相互竞争的利益

作者声明他们没有完全的利益。

额外的信息

出版商的注意

亚搏体育官方电话施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。

补充信息

权利和权限

开放获取本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料都包含在本文的知识共享许可中,除非在该材料的信用额度中另有说明。如果资料不包括在文章的知识共享许可协议中,并且你的预期用途没有被法律规定允许或超过允许用途,你将需要直接从版权所有者获得许可。如欲查阅本许可证副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用及公共领域专用豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信贷额度中另有说明。

再版和权限

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

波汉,F,惠特利,E,莫拉迪,O。et al。在加强管理数据集方面,调查数据的标准多重归并没有比简单的替代表现得更好:英格兰的自我评估健康的例子。紧急情况的主题论文18日,9(2021)。https://doi.org/10.1186/s12982-021-00099-z

下载引用

关键字

  • 调查
  • 人口普查
  • 验证
  • 多重归物
Baidu