天天百科

真因果还是假因果(——将基因作为工具变量的健康影响因素研究)

2023-06-02 分类:养生资讯

TIPS:本文共有 2822 个字,阅读大概需要 6 分钟。

真因果还是假因果?——将基因作为工具变量的健康影响因素研究 原创 张韵 定量群学

在前几篇推送中,李毅博士为大家介绍了几篇设计精巧的基因-环境交互分析的研究,这些研究借助基因数据揭示了以往研究中未能发现的社会规律,对丰富相关领域的理论有重要贡献。在今天的推送中,我将从研究方法的角度为大家介绍一种将基因作为工具变量的因果分析方法。希望通过今天的介绍,能让从事社会科学研究的读者发现基因并没有那么艰深莫测,而是一种可以“为我所用”的研究工具。

健康不仅是医学领域的研究问题,也是人口学、社会学所关心的重要议题。这主要是因为健康受复杂的社会环境因素的影响,并且社会政策也需要基于群体健康的实际情况来制定有效方案,为不同群体提供相对公平的健康机会,从而提高社会整体的健康水平。

健康研究中的一大关键问题是因果机制,有效的健康干预有赖于真实的因果机制。但是,如何确立因果关系,这也正是健康研究中的一大困难。健康研究中的因变量和自变量之间很可能存在选择性偏差、反向因果和虚假相关的问题。

譬如,梁玉成(2014)指出健康研究不能忽视死亡带来的选择性偏误。在观察性数据(observational data)中,年龄与中医使用概率之间是倒U型关系——老年人反而使用中医概率较低。而真实情况是,死亡概率高的人偏好使用中医,而在观察样本中只能观察到存活的样本,因此出现了年龄越大中医使用概率越低的选择性偏误。

再譬如,饮酒对于健康的影响在以往研究中尚未得到一致性的结果。有研究表明无论何种剂量的饮酒都是健康风险行为,但也有观察性研究指出适量饮酒有利健康。实际上,饮酒行为和健康之间可能存在反向因果的问题,身体健康状况较好的人没有被限制饮酒,而身体健康状况较差的人更可能会因此戒酒,由此在研究结果出现了饮酒与健康的正向相关性。

除此之外,健康研究中还存在许许多多的混淆因素(confounding factors)。比如我们想要研究饮食对健康的影响,有的小朋友可能每天都要在爸妈的“威逼利诱”下喝一杯牛奶,因为“喝牛奶才会长得高”。所以,我们建立喝牛奶和身高之间的相关关系后发现二者正相关,就真的意味着喝牛奶能长高吗?仔细想想二者之间存在很多混淆因素,譬如每天都有牛奶喝的家庭可能更富有,不仅每天喝牛奶还每天喝高乐高,那么长高其实更有可能是高乐高的功劳(纯属举例,如有雷同实属巧合)。当然,除了高乐高,或许还有其他营养品,此处贫穷限制了我的想象。但即便想象力丰富,也无法穷举所有的混淆因素。即便你疯狂地穷举了所有的混淆因素,结果又可能发现所有营养品都没有用,让你长高的或许只是年龄而已(纯属举例,如有雷同实属巧合)。那么,到底如何才能知道喝牛奶和长得高之间是否存在真正的因果关系呢?

基因数据和Mendelian randomization方法给我们提供了一种可能。相信不少读者已经比较熟悉工具变量法。我们将要介绍的Mendelian randomization实际上就是健康研究中,将基因作为工具变量的一种因果分析方法。

图中X表示我们选择的研究变量(即自变量/行为变量),Y表示健康结果(即因变量/结局变量),U表示混淆因素,Z表示工具变量。

若将喝牛奶的例子套进来,则X表示“喝牛奶”,Y表示“身高”,U表示包括“高乐高”在内的众多混淆因素,Z表示与“喝牛奶”相关的基因。此时有人不禁有些困惑,喝牛奶还有相关基因?有的,生物和基因研究领域的研究者曾发现乳糖不耐受症状的基因型。已知,乳糖不耐受基因与喝牛奶强相关(有乳糖不耐受症状的人会明显少喝或不喝牛奶),并且乳糖不耐受基因与因变量(身高)和混淆因素(高乐高)不相关。因此,如果研究证明了携带乳糖不耐受症状的基因型的人与不携带乳糖不耐受症状的基因型的人在身高上有显著差异,那么可以说明喝牛奶与身高之间存在因果关系。反之,则说明喝牛奶与身高之间的因果关系是假的。通过这个例子,希望大家对Mendelian randomization研究的基本思路和目的有一个较为直观的了解。

实际上,Mendelian randomization 相比传统的随机对照实验(Randomized controlled trials, RCT),其优势在于它是一种自然随机对照实验。尽管随机对照试验是探究因果关系的黄金标准,然而由于现实因素的制约(尤其是伦理问题),健康研究中进行完全随机的对照试验往往是难以实现的。譬如,对于疾病(尤其是重大疾病)的干预治疗,将病人分配到干预组和参照组是不道德的或不现实的(分配到参照组的病人将不接受治疗而这是难以接受的)。同时,由于干预措施(如饮食)和疾病(如认知障碍)的发展时间很长,试验观测需要数十年,所需资源成本和时间成本巨大。

总之,随机对照试验常常是昂贵的,资源密集的,甚至有违伦理的。相比之下,Mendelian randomization则借助基因“轻松”实现了自然随机分组。这是因为根据孟德尔定律,个体获得某一遗传特性的过程是完全随机的,因此用基因作为分组标准,能够达到自然随机的效果。在此值得一提的是,对于基因研究,人们往往会笼统地质疑其伦理问题。但实际上,结合上文的说明可以看出,Mendelian randomization恰恰是利用了基因数据避免了对照实验研究中存在的伦理问题。

下面,我们简单介绍一篇运用Mendelian randomization的实证研究,这篇论文基于Mendelian randomization的方法讨论了肥胖对抑郁的影响:

l 研究背景:

文章的背景部分介绍了肥胖导致抑郁的假说,但以往研究中发现了肥胖和抑郁的相关,二者之间的因果关系并不明了。因此作者用Mendelian randomization的方法来检验肥胖与抑郁之间的因果关系是否成立。

l 研究设计:

该文选取了3222个有效个案纳入研究,因变量为抑郁,自变量为肥胖(body mass index, BMI),工具变量为对肥胖(body mass index, BMI)具有高解释力的基因型。

FTO是被研究发现的对BMI具有最高解释力的单基因,但作者除了利用了FTO基因外,还构建了多基因指数。作者根据Speliotes等人(2010)研究报道的与BMI相关的32个SNPs及其影响系数大小加权,构建了基因变量wGRS。(在单基因的基础上,作者额外构建了多基因指数,是为了加强基因变量的解释力,一定程度上避免工具变量解释力差的“弱工具”的问题)

l 分析步骤:

作者首先在一阶段回归中基于F统计值判断工具变量的强度(若F值大于10则可认为是强工具变量),随后通过工具变量回归方法分析FTO基因以及加权多基因指数wGRS是否通过BMI与抑郁相关。这一分析过程在stata中通过ivprobit的命令即可实现。

l 分析结果:

在probit回归中,肥胖(body mass index, BMI)与抑郁显著正相关(p<0.001);FTO基因和wGRS多基因指数均不直接与抑郁显著相关;将FTO基因和wGRS多基因指数作为BMI的工具变量时,BMI的变化并不能预测抑郁,换句话说即BMI与抑郁相关性不具有统计显著性(FTO基因:p=0.73;wGRS多基因指数:p=62)。

l 结论:

尽管传统的probit回归显示肥胖与抑郁显著正相关,因此有肥胖导致抑郁的假说。但工具变量分析法的结果并未支持这一假说,换句话说,这个假说中的因果关系是不成立的。

最后补充一点,Mendelian randomization应用的一大局限在于,并不是所有的研究变量(或表型,phenotype)都能找到相对应的高解释力的基因(或基因型,genotype)。由于可选的研究变量比较有限,因此目前大多应用在健康研究领域。但随着基因组学的发展以及相关数据的开发,研究变量的范围不断扩大,Mendelian randomization也并不仅用在健康研究,而是可以应用到更多的议题上。

参考文献:

Lawlor D A , Harbord R M , Sterne J , et al. Mendelian randomization: Using genes as instruments for making causal inferences in epidemiology[J]. Statistics in Medicine, 2008, 27(8):1133-1163.

CF Hung, Rivera M , Craddock N , et al. Relationship between obesity and the risk of clinically significant depression: Mendelian randomisation study[J]. British Journal of Psychiatry, 2014, 205(1):24-28.

Speliotes EK, Willer CJ, Berndt SI, et al. Association analyses of 249,796 individuals reveal 18 new loci associated with body mass index[J]. Nature Genetics, 2010, 42: 937-948.

梁玉成. 谁在使用中医和西医?——一项关于死亡风险对医疗偏好影响的研究[J]. 兰州大学学报(社会科学版), 2014(5期):74-87.

作者 | 中山大学副研究员 张韵

原标题:《真因果还是假因果?——将基因作为工具变量的健康影响因素研究》

如果觉得《真因果还是假因果(——将基因作为工具变量的健康影响因素研究)》对你有帮助,请点赞、收藏,并留下你的观点哦!

阅读剩余内容
网友评论
相关阅读
小编推荐