护理科研设计：“队列研究”入门

各位护理老师，大家好！今天我要给大家介绍的是观察性流行病学研究的方法：队列研究。

大家都知道，流行病学研究设计方法有两类：

第一类是观察性研究

第二类是试验性研究

这两种方法的本质区别在于：试验性研究可以人为确定暴露因素----暴露因素也叫研究变量(variable）。

比如：我们将病人随机分为两组，一组进入试验组，一组进入对照组。然后观察试验组和对照组疾病的发生或在研究的结局上是否有显著的差异，借此来推断这个干预因素跟疾病之间的关系。

这样的一种研究设计方法它有什么问题吗？当干预因素是有害的时候（比如说我们要研究铅中毒对于胎儿发育的影响），这个时候就不能采用试验性研究了，因为它不符合伦理学要求。也就是说，对一个试验性研究，我们必须要求暴露因素是无害的，必须符合伦理要求。

当暴露因素有害的时候，我们只能采取观察性研究。也就是说，观察自然发生的一个结局，以及影响这个自然发生结局的一个影响因素。这样的研究设计方法称为观察性研究。

观察性研究设计方法有三种：

①队列研究（Cohort study)

②病例对照研究（Case-control study)

③横断的研究（Cross-sectional study)。

今天我们要给大家介绍的是队列研究。

先讲讲什么叫队列研究

什么是队列？

说起队列研究，首先大家要了解什么是队列，也就是cohort。队列是指有共同经历并且随访一定时间的一组人群。

比如我们通常谈到的出生队列。我们要研究在1959年到1961年三年自然灾害期间出生的人群。那么这个人群的共同特征是：在生长发育期，他们暴露于饥饿，因此我们可以对这组人群进行随访，然后看成年之后他们的糖尿病或心血管疾病的发病跟一般人群有什么差别，这就是出生队列。

再比如职业队列。假如我们将大庆的石油工人当做研究对象，那么这队列人群的共同特征是：他们可能暴露于一些苯等有机溶剂，我们同样可以对这样的队列人群进行随访，看他们在一些特殊疾病（比如说白血病等）上面的发生率跟一般人群有没有差别。

下面通过一个图进一步的理解什么是队列：

首先，队列是一组具有共同特征的人群，在蓝色的圆圈里是一个队列人群，那么所有人都具有共同特征，将按照暴露因素分为两组（吸烟组和非吸烟组）。那么经过一段时间的随访，那我们看有一些人变成了红色，那就代表他已经发病了（肺癌）。

到随访结束的时候我们可以来计算这组人群中，你所研究的疾病或者是研究的结局事件发生的频率。包括了累计发生率或者是以人员为基础的发病率，我们都可以计算出来。那么这个就是队列。

什么是队列研究？

基于队列我们可以延伸出队列研究。在研究之初、随访之初，我们分析这个人群目前的暴露状态，我们可以把他分为暴露组和非暴露组。

以吸烟与肺癌发生这样一个关系研究为例。在队列之初，根据队列人群是否吸烟,我们把人群分为吸烟者和不吸烟者。那么这两个人群分别为吸烟队列和不吸烟的队列。我们希望他们除了吸烟状态之外，其他的方面都有共同的特征。而且在进入队列之初，两组人群都没有患要研究的这个疾病。同时两组人群需要具有发生此研究疾病的可能性。对于这样的两个队列人群（暴露组和非暴露组），经过一段时间的随访，我们可以看到在暴露队列和非暴露队列人群当中，分别有不同的个体发病了。到了研究终点的时候（也就是随访结束的时候），我们可以计算出暴露组的发病率和非暴露组的发病率。

我们还是以吸烟与肺癌发生的关系研究为例。我们可以看到吸烟者肺癌的发生率和非吸烟者肺癌发病率。那么假设暴露组和非暴露组两组人群在暴露因素（吸烟）之外的其他因素方面具有可比性的话，这个时候我们就可以推断：吸烟可能会增加肺癌的发生风险。那么这样的一个研究就是队列研究。

回顾以上案例，我们首先确定了暴露状态，而且在确定暴露状态的时候所有人都没有发病，然后经过随访来观察不同的暴露组人群发生所要研究的疾病的风险是不是有差别。因此它先有暴露后有结局，是一个由因到果的研究。

下面我们对队列研究的定义进行一个总结。

可以回忆一下刚才给大家显示的这个图例。它首先是根据在研究起点时，未患所研究疾病的研究对象的暴露状态，分为暴露组和非暴露组（或者不同暴露水平组），然后经过一段时间的随访，也就是追踪观察之后，来比较各组之间所研究疾病的发病率或者死亡率的差异，从而推断暴露因素和疾病之间是否存在关联。它是一个由因及果的研究，所以又称为定群研究、前瞻性研究或者纵向研究。这是就是队列研究的定义。

如何实施队列研究？

根据队列研究的定义，我们可以知道队列研究的实施步骤。第一步肯定是确定队列人群，包括暴露人群和非暴露人群第二步是随访确定每个个体的结局。第三步是计算暴露人群和非暴露人群的发病率，并比较这两组人群发病率之间是否有差别。那我们下面来分别的来看一下这三步是怎么来完成的。

一、确定队列人群

确定队列人群通常有两种途径：

第一种是根据暴露的机会来选择队列。最常见有两类：第一类是职业队列人群。比如说石油工人队列，我们可以判断石油工人发生肺癌或者间皮瘤等发生率是否高于一般人群。还有一类是特殊人群队列。特殊人群队列指的是那些意外事故或者战争才会存在的暴露，我们把暴露于这种特殊暴露因素的人群选择出来，确定一个队列人群。比如前苏联切尔诺贝利核泄露区域的人群形成的一个暴露队列；还有日本广岛和长崎原子弹爆炸幸存者也成为这样一个队列。它是研究一个暴露因素和多个结局之间的关联。

对于以上两种队列人群来说了，我们要研究暴露者和非暴露者之间发生的差异，通常是在这个人群之外来建立一个对照组。比如一般人群。我们可以比较石油工人发生肺癌的发生率跟一般人群是否有显著性差别。这是一种根据暴露状态来确定队列人群。

第二种队列人群的选择指的是一般人群的队列。也就是说，它在建立队列之初，尚没有确定它的暴露状态。最常用的是不同人口学特征的人群，例如不同地区或者不同种族的全体居民这样一个样本。比如：在美国有一个特别有名的队列人群，就是黑人妇女队列，它就是基于黑人妇女划分的，根据这样的种族和性别来建立的队列人群；还有一个非常有名的队列人群，Framingham队列，它就是选择居住在Framingham小镇的人群来建立一个队列，这个就是基于地区为基础建立的队列。还可以针对一些特殊人群，考虑到护士比较容易随访，那么可以利用护士来建立一个队列，然后来探讨女性中的一些疾病的发生及其影响因素。这是一般人群队列。

我们想一想，对一般人群队列来说，建立队列之初没有确定暴露状态，因此有一个很大的优点，它可以研究多个暴露因素和多个疾病结局之间的关联。而且可以在同一个研究人群中选择没有暴露或者暴露水平最低的人来做对照，也就是说暴露组和非暴露组可以同时在一个队列人群当中完成。

以上就是选择队列人群的两种途径。

下面来看一个非常有名的Framingham队列研究。

这个队列研究始于1948年，它是以地区为基础建立的一个队列人群。Framingham是位于美国Massachusetts的一个小镇，距离Boston只有20公里，而人口只有3万左右。小镇只有一所医院，因此所有患病的人都会到这个医院去看病，所以特别适合进行队列研究和随访。也就是说，这是一个一般人群队列。当时随机抽取了30—62岁的居民，最终是5000人入选。这是一般人群的队列。

其中关于暴露人群和非暴露人群的确定是依赖于什么？它的基线特征以及它的随访过程当中收集的多个暴露因素，包括年龄、性别、家族史、职业、文化水平、国籍、血压、血脂、体力活动、吸烟、饮酒等等的很多因素。然后我们就可以根据不同的人在每一种因素上面的不同的暴露水平，把他们归到不同的暴露组。Framingham研究的主要关系是心血管疾病，分别比较暴露组和非暴露组心血管疾病的发生率有没有什么差别。这是一个Framingham的研究，那么它怎么去选择队列人群的？它是怎么去确定暴露人群和非暴露人群？

二、随访确定每个个体的结局

我们需要确定首次随访时间以及以后每次随访的时间间隔，时间的确定主要是依据你所要研究的具体疾病的自然史以及从暴露到发病的间隔时间。

以Framingham研究为例，它主要关注的是心血管疾病，每隔两年进行一次随访。随访主要根据Framingham的唯一一家医院的医院登记来确定新发冠心病。确定了随访时间以及随访间隔之后，我们还要确定观察终点，观察终点是指研究对象出现了预期结果。我们以Framingham这个研究为例，它的观察终点就是冠心病，同时我们还要确定观察终点的时间。

另外对于队列研究来说，非常棘手的一个问题就是失访。因此在队列研究当中，尤其队列研究的随访当中，我们要适当的处理失访。我们可以比较失访者和未失访者特征，或者来比较暴露组和非暴露组的失访情况，来估计失访对于整个研究结论的影响。通常我们应该保证失访率不高过10%，也就是说我们应该保证的随访率至少有90%。

三、计算暴露组和非暴露组的发病率

我们通常把队列研究的资料归纳成这样的一个模式。首先我们暴露人群有n1，非暴露人群有n0个。那么经过一段时间随访以后，在n1个暴露人群中，有a个人发病了。由此我们就可以计算出暴露组的发病率是a/n1。在n0个非暴露组人群当中，有c个人发病了，因此我们可以计算出非暴露组的发病率是c/n0。基于这两个结果，我们可以计算出它的相对危险度，称为relative risk，又简写成为RR（首字母大写缩写）。

相对危险度是队列研究中用来评价暴露因素和疾病关联强度的指标，指的是暴露组的发病率与非暴露组的发病率之比。对于我们这个例子来说，它就应该等于a/n1，再除以c/n0。之后我们就可以计算出它的相对危险度。

当相对危险度等于1的时候，就提示暴露因素跟疾病的发生没有关联。当相对危险度也就是RR大于1的时候，就提示暴露因素可能是疾病发生的一个危险因素。RR越大，关联强度就越大。当RR小于1的时候，提示暴露因素可能是疾病发生的一个保护因素，RR越小，提示关联强度就越小。

我们回到刚才吸烟与肺癌发生风险队列研究的例子，我们有两组人群，一组是吸烟人群，一组是不吸烟人群。吸烟的人群观察3000人员数之后，有84个人发生了冠心病。由此我们可以计算出它的发病率，即84/3000，也就是2.8%。而不吸烟的人当中，它总共观察了5000个人员数，其中发生冠心病的人数有87个，那么发病率是是87/5000=1.74%。由此我们就可以计算出它的相对危险度，RR就等于吸烟者的发病率2.8%除以不吸烟者的发生1.74%，等于1.61。这个RR值是大于1的，也就提示吸烟可能是肺癌发生的一个危险因素。

以上介绍了队列研究的定义、步骤以及如何根据队列研究来评价暴露因素和疾病之间的关联强度。之后我们会继续介绍队列研究的类型（前瞻性队列研究、回顾性队列研究以及双向队列研究）。敬请期待！

艾德医讯丨艾德课堂丨科研助理

请留下你指尖的温度

让太阳拥抱你

记得这是一个有温度的公众号

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。