SciELO - Scientific Electronic Library Online

 
vol.42 issue3Antimicrobial resistance of Streptococcus pyogenes clinical strainsAnálisis de supervivencia. Aplicación en una muestra de mujeres con cáncer cervical en México author indexsubject indexarticles search
Home Page  

Salud Pública de México

Print version ISSN 0036-3634

Salud pública Méx vol.42 n.3 Cuernavaca May./Jun. 2000

http://dx.doi.org/10.1590/S0036-36342000000300010 

ACTUALIZACIONES

 

Estudios de cohorte. Metodología, sesgos y aplicación

 

Eduardo Lazcano-Ponce, Dr. en C.,(1) Esteve Fernández, Dr. en C.,(2) Eduardo Salazar-Martínez, Dr. en C.,(1) Mauricio Hernández-Avila, Dr. en C.(1)

 

 

cohorte

Del latín cohors, cohortis : séquito, agrupación. Entre los romanos, cuerpo de infantería
que comúnmente constaba de 500 hombres, y era la décima parte de una legión.
Por lo general, los veteranos ocupaban la primera y última fila de la cohorte.
Puede provenir del verbo latino
cohortari, arengar, toda vez que la fuerza de la cohorte se ajustó generalmente
al número de hombres que podían escuchar juntos la voz del jefe que les dirigía la palabra

liciones

 

La característica que define a los estudios de cohorte es que los sujetos de estudio se eligen de acuerdo con la exposición de interés; en su concepción más simple se selecciona a un grupo expuesto y a un grupo no-expuesto y ambos se siguen en el tiempo para comparar la ocurrencia de algún evento de interés. Los estudios de cohorte prospectivos son semejantes a los ensayos clínicos aleatorizados en el sentido de que los sujetos de estudio se siguen en el curso de la exposición hasta la aparición del evento que interesa, pero a diferencia del ensayo clínico aleatorizado, donde el investigador asigna la exposición, en los estudios de cohorte el investigador observa a los sujetos después de ocurrida la exposición.

Anteriormente, los estudios de cohorte eran referidos como longitudinales, porque los sujetos eran seguidos con al menos dos mediciones a través del tiempo; también eran conocidos como prospectivos, que implican la dirección hacia el futuro en la cual eran seguidos los sujetos; o de incidencia, porque se relacionan con la medida básica de los nuevos casos del evento de estudio a lo largo del tiempo. Actualmente, sin embargo, el término correcto para referirse a este diseño es de estudios de cohorte.

Los estudios de cohorte se han utilizado de manera clásica para determinar la ocurrencia de un evento específico en un grupo de individuos inicialmente libres del evento o enfermedad en estudio. Es decir, toda la población en estudio se sigue a través del tiempo y se compara la incidencia del evento de estudio en individuos expuestos con la de los no-expuestos. El seguimiento de la población en estudio se continúa hasta que ocurre una de los siguientes condiciones: a) se manifiesta el evento de estudio (en razón de salud o enfermedad), cuando ocurre esta condición el individuo deja de contribuir a la cohorte pero puede reingresar si se trata de un evento recurrente o que puede ocurrir varias veces; b) los sujetos de estudio mueren; c) los sujetos se pierden durante el seguimiento, o d) el estudio termina.

 

Clasificación de los estudios de cohorte

Dependiendo de la relación temporal del inicio del estudio respecto a la ocurrencia del evento, los estudios de cohorte se han clasificado como: prospectivos, y retrospectivos (o históricos). Los estudios de cohorte histórica reconstruyen la experiencia de la cohorte en el tiempo, por esta razón dependen de la disponibilidad de registros para establecer exposición y resultado. Una aplicación frecuente de una cohorte histórica son los estudios de exposición ocupacional, donde se reconstruye la exposición y frecuencia de eventos en un grupo ocupacional o empresa durante un periodo determinado. La validez del estudio dependerá en gran medida de la calidad de los registros utilizados. En contraste, en las cohortes prospectivas es el investigador quien documenta la ocurrencia del evento en tiempo venidero en la población en estudio, por lo que la exposición y resultado se valoran de manera concurrente, y la calidad de las mediciones puede ser controlada por los investigadores.

Con relación al tipo de población, las cohortes construidas pueden ser fijas, también llamadas cerradas, y dinámicas (figura 1). Cerradas o fijas son las cohortes que por diseño de estudio no consideran la inclusión de población en estudio mas allá del periodo de reclutamiento fijado por los investigadores, por ejemplo: estudiantes de la Escuela de Salud Pública de México, generación 1945.

 

 

Dinámicas son aquellas cohortes que consideran la entrada y salida de nuevos sujetos de estudio durante la fase de seguimiento, por lo que el número de miembros puede variar a través del tiempo. Los participantes entran o salen de la cohorte cuando cumplen criterios de elegibilidad, incorporando la aportación años-persona desde el momento de inclusión en el estudio; frecuentemente están definidos por unidades geográficas y grupos poblacionales, por ejemplo: población asegurada por el Instituto Mexicano del Seguro Social, durante el periodo de 1995 a 2000.

 

Diseño de estudio

En un estudio de cohorte se recluta a un grupo de individuos, ninguno de los cuales manifiesta en ese momento el evento de estudio, pero todos los integrantes están en riesgo de padecer o presentar dicho evento. Para su inclusión en el estudio los individuos de la cohorte son clasificados de acuerdo con las características (factores de riesgo) que podrían guardar relación con el resultado. Posteriormente, estos individuos son observados a lo largo del tiempo para cuantificar cuáles de ellos manifiestan el resultado.

Los dos grupos de comparación (expuestos y no-expuestos) pueden ser seleccionados de poblaciones diferentes; sin embargo, la inferencia causal (la validez del estudio) depende del supuesto de que ambos grupos son comparables respecto a otros factores asociados con la exposición o evento de interés. La principal ventaja metodológica de un diseño de cohorte es que los niveles del factor de estudio son observados a través del periodo de seguimiento antes de que la enfermedad o evento de interés sea detectado. Consecuentemente, el investigador puede razonablemente postular la hipótesis de que la causa precede la ocurrencia de la enfermedad y que el estatus de enfermedad no influyó diferencialmente en la selección de sujetos o en la determinación de la exposición. Los estudios de cohorte tienen ciertas ventajas y desventajas respecto a otro tipo de estudios epidemiológicos (cuadro I), pero en general son menos susceptibles de sesgos de selección como se describe más adelante.

 

 

Como puede observarse en la figura 2, en un estudio de cohorte la información acerca del factor de exposición o de estudio es conocida para todos los sujetos al inicio del periodo de seguimiento. La población en riesgo de desarrollar el evento es seguida por un periodo de tiempo determinado mediante nuevos exámenes o cuantificando su periodo de supervivencia, hasta que el evento de estudio o muerte sean identificadas.

 

 

Selección de la cohorte

Antes de que pueda identificarse a las personas expuestas es necesario definir explícitamente los niveles y duración mínima de la exposición. Adicionalmente, en el estudio pueden fijarse criterios de elegibilidad, pero lo más importante es que los sujetos estén libres al menos momentáneamente del evento de estudio.

En estudios de cohorte se puede contar con más de un grupo de exposición. La decisión de incluir o excluir a determinados sujetos de la población de estudio dependerá de la exposición y del resultado que interesa, así como de la medida en que se influye sobre la heterogeneidad al restringir la admisión a ciertos grupos.

La exposición y las covariables en estudio pueden ser dependientes del tiempo, por lo que es necesario considerar los factores por los cuales el nivel de exposición varía con el tiempo, así como variación de tasas y la posibilidad de que los confusores y modificadores de efecto varíen en el tiempo. En las exposiciones fijas los factores no cambian a través del tiempo, tal es el caso del sexo y el lugar de nacimiento, entre otros.

Existen otras múltiples aplicaciones en que pueden utilizarse los estudios de cohorte, como puede observarse en el cuadro II, de acuerdo con su dimensión tiempo. Entre ellos la edad que es un determinante de incidencia; el tiempo calendario, donde los antecedentes y exposición pueden variar con el tiempo; el seguimiento propiamente dicho que puede ser un índice de exposición. Asimismo, la duración de la exposición refleja un índice de exposición acumulada. El tiempo transcurrido desde la exposición útil al evento es también referido como latencia y, finalmente, el tiempo desde el final de la exposición puede reflejar declinación en el riesgo.

 

 

Los sujetos no-expuestos han de ser similares a los expuestos en todos sus aspectos excepto en que no han estado sometidos a la exposición que se estudia. La captación de los sujetos no-expuestos debe ser la misma que se aplicó a los sujetos expuestos. Deben tener, además, el mismo riesgo potencial de presentar el evento de estudio, y tener las mismas oportunidades que los expuestos de ser diagnosticados del evento resultado en estudio.

Las opciones utilizadas para la conformación de las cohortes varían según la exposición que es objeto de estudio. Así, por ejemplo, el estudio de la dieta o estilos de vida se ha estudiado en cohortes conformadas con muestras de la población general, mientras que exposiciones poco frecuentes se han estudiado en cohortes ocupacionales.

 

Medición de evento resultado y seguimiento

Los eventos de estudio pueden ser: a) evento simple (fijo en el tiempo) o evento raro (muerte o incidencia de enfermedad). En ambos casos, al observar el evento en cada unidad de análisis el seguimiento termina; b) eventos múltiples o raros (enfermedades recurrentes, sintomatología o eventos fisiológicos). Al presentar el evento el individuo deja de estar en riesgo por lo que ya no cumple con el criterio de permanencia en la cohorte. Se puede reiniciar el seguimiento cuando se restablece el riesgo, es decir, cuando hay curación y el individuo vuelve a estar en riesgo de presentar el evento; c) modificación de medida eje (función broncopleural en el tiempo, modificación de la función pulmonar hacia un aumento o disminución; crecimiento), que son evaluados mediante tasa de cambio, y d) marcadores intermedios del evento (cuenta de apolipoproteínas A y B como marcadores de predisposición a enfermedad cardiovascular).

El periodo de seguimiento puede abarcar años, meses, semanas o días, dependiendo de la frecuencia del evento estudiado. Dos momentos definen el periodo de seguimiento: el examen inicial (medición basal) y el final del seguimiento. El inicio del seguimiento depende del tipo de cohorte: si es cerrada o dinámica, ya que en el caso de esta última, el inicio del seguimiento se define para cada participante a través de un largo periodo de tiempo. El seguimiento, dependiendo del evento de interés, puede ser activo o pasivo. Activo es aquel en el que se utilizan contactos repetidos por diversos medios; nueva entrevista y obtención de muestras, cuestionarios autoaplicables o llamadas telefónicas. El seguimiento pasivo es el que se realiza mediante búsqueda sistemática de sistemas de información en registros prestablecidos (registros de cáncer, hospitalarios, registro civil, entre otros).

 

Pérdidas en el seguimiento

Las pérdidas en el seguimiento pueden originarse principalmente por tres razones: a) abandono del estudio, b) muerte por otra causa al evento de interés, y c) pérdidas, llamadas "administrativas", originadas por la terminación temprana del estudio por razones ajenas a las que se plantearon originalmente (ejemplo: agotamiento de la fuente de financiamiento).

Cuantificar las causas que producen pérdidas en el seguimiento es importante para evaluar la validez del estudio.

 

Análisis estadístico

La base del análisis de un estudio de cohorte es la evaluación de la ocurrencia de un evento (en términos de salud o enfermedad) resultante del seguimiento en el tiempo, como consecuencia de haber estado expuesto o no (grupos de comparación) a una determinada exposición (factor de riesgo). Esto es, el investigador selecciona un grupo de sujetos expuestos y otro grupo de sujetos no-expuestos y los sigue en el tiempo para comparar la incidencia de algún evento (incidencia de la enfermedad, o según sea el caso, tasa de muerte de la enfermedad). Es indispensable considerar que para poder analizar adecuadamente un estudio de cohorte se necesitará información sobre la fecha de inicio, fecha en que ocurran los eventos y de terminación del estudio, así como la información completa de los datos de los sujetos participantes, la escala de medición y el motivo de terminación del seguimiento (pérdida, muerte u ocurrencia del evento en estudio.

Cuando existe una asociación positiva entre la exposición y el evento se esperaría que la proporción del grupo expuesto que desarrolló la enfermedad sea mayor que la proporción del grupo no-expuesto que también presentó el evento (incidencia del grupo expuesto vs. incidencia del grupo no-expuesto). Partiendo de un grupo expuesto donde "a" sujetos desarrollan el evento y "c" sujetos no desarrollan el evento, tenemos entonces, que la incidencia de la enfermedad entre los expuestos es: a /a + c. De la misma manera, en el grupo de sujetos no-expuestos, "b" y "d", el evento ocurre en "b" sujetos, pero no en "d" sujetos, tenemos entonces, que la incidencia de la enfermedad entre los no-expuestos es: b / b + d (cuadro III).

 

 

Para calcular la razón de incidencia acumulada (RIA) se estima la incidencia del grupo expuesto entre la incidencia del grupo no-expuesto:

La RIA es una medida de asociación entre el evento y la exposición. Consideremos un ejemplo con datos hipotéticos de un estudio de cohorte donde se investiga la asociación entre el estado nutricional y el riesgo de muerte en pacientes con diagnóstico de leucemia, seleccionando un grupo de 17 sujetos con bajo estado nutricional (expuestos) y otro grupo de 15 sujetos con estado nutricional normal (no-expuestos), quienes se encontraban libres de enfermedad al inicio del estudio; ambos grupos fueron seguidos hasta que se presentó el evento. El evento (muerte) se registró en 14 sujetos del grupo con déficit nutricional y en ocho en el grupo sin déficit. El resultado es una incidencia de 0.82 en el grupo de bajo estado nutricional y de 0.53 en los del grupo de estado nutricional normal. Al estimar el efecto obtenemos un riesgo relativo positivo; por lo tanto, los sujetos con bajo estado nutricional tienen 1.54 veces mayor riesgo de presentar el evento al ser comparados con los sujetos con estado nutricional normal (cuadro IV).

 

 

Razón de tasas de incidencia

Cuando el estudio presenta pérdidas en el seguimiento (abandono, cambio de domicilio, muerte por causa diferente al evento del estudio, finalización del estudio por llegada al tiempo establecido por el protocolo o por agotamiento de recursos financieros) los tiempos de seguimiento son desiguales. Una forma de tratar periodos de seguimiento variables es con el análisis basado en tiempo-persona. En estos casos, se puede utilizar el promedio de tiempo contribuido por la totalidad de sujetos de la cohorte; es decir, se agregan seis meses por el año de entrada, seis meses más por el año de salida y doce meses por todos los años de entrada y salida.1

Cuando se ha cuantificado el tiempo-persona de seguimiento para cada sujeto, el denominador cambia a una dimensión de tiempo (las unidades son por ejemplo, años-persona, días-persona, horas-persona). Esto nos permite estimar la tasa de los casos incidentes en una unidad de tiempo determinada.2

Consideremos una cohorte donde se conoce el tiempo que cada individuo ha permanecido en el seguimiento, se puede calcular la tasa de incidencia de acuerdo con el estado de exposición de cada sujeto. Así, partiendo de un grupo de sujetos "a" que presentan el evento y la exposición, y el tiempo-persona de seguimiento "tpe" de estos sujetos expuestos, se puede calcular la tasa de incidencia para los expuestos: TI1 = a / tpe. De la misma manera, consideremos un grupo "b" de sujetos con el evento, pero sin la exposición y el tiempo-persona de seguimiento de estos sujetos "tpne", en los cuales se puede calcular la tasa de incidencia para los sujetos no-expuestos: TI0 = b / tpne (cuadro V).

 

 

El cálculo de la razón de tasas de incidencia (RTI) se deriva de la siguiente manera:

RTI= TI1 / TI0

El producto de la estimación es una medida de asociación que nos permite evaluar la diferencia entre los grupos expuesto y no-expuesto.

Tomando el mismo ejemplo hipotético de estado nutricional y leucemia, en el cual 14 sujetos con bajo estado nutricional (contribución de 571 días-persona de seguimiento) y ocho sujetos del grupo con estado nutricional normal (contribución de 1 772 días-persona de seguimiento) desarrollaron el evento (muerte). La tasa de mortalidad para los sujetos con bajo estado nutricional fue de 24.5/1 000 días-persona y para los sujetos con estado nutricional normal la tasa de mortalidad fue de 4.5/1 000 días-persona. Por lo tanto, la velocidad de ocurrencia del evento es 5.4 veces más alta en el grupo de sujetos con bajo estado nutricional que en el grupo de sujetos con estado nutricional normal (cuadro VI). Como se puede observar, los resultados de la estimación de la razón de riesgos y la razón de tasas de incidencia es diferente, esto es debido, probablemente, a que el evento es frecuente (14 de 17 sujetos lo presentaron) y el periodo de seguimiento es prolongado.

 

 

Este método permite realizar análisis cuando existe un cambio en el estado de exposición, de tal manera que un mismo sujeto puede contribuir en el denominador de los expuestos en un periodo y entre los no-expuestos en otro momento.

Finalmente, aunque hemos descrito de manera simple la forma como se analizan los datos provenientes de una cohorte, cuando queremos conocer el efecto de la variable estudiada controlando variables potencialmente confusoras, requerimos de un análisis múltiple ajustando simultáneamente diferentes variables mediante la regresión de Poisson.1

Otra estrategia para el análisis de un estudio de cohorte es el análisis de supervivencia.3 Esta estrategia permite el análisis de eventos frecuentes en poblaciones pequeñas, a diferencia del análisis de tiempo-persona en el cual el evento es generalmente poco frecuente y se realiza en poblaciones más grandes. El cuadro VII presenta las principales diferencias entre las dos estrategias de análisis.4

 

 

Sesgo y validez en los estudios de cohorte

Aunque se reconoce que los estudios de cohorte representan un diseño menos sujeto a error sistemático o sesgo en comparación con otros estudios observacionales,5 no es menos cierto que se deben tener en consideración algunas fuentes que pueden distorsionar los resultados que se deriven de ellos (figuras 3, 4 y 5). Existen, en efecto, sesgos de selección e información en los estudios de cohorte que deben ser rigurosamente considerados, sobre todo por lo que se refiere a pérdidas en el seguimiento (de los pacientes, de los participantes, etc.), al modo en que se obtiene la información sobre la exposición estudiada y al modo en que se determina en la población en estudio la ocurrencia de la enfermedad o condición de interés durante el seguimiento. Por lo que se refiere a sesgos de confusión, en los estudios de cohorte es importante considerar factores que se asocien independientemente tanto con la exposición como con la condición o evento estudiado, que no sean pasos intermedios en el proceso causal, ya que éstos pueden hacer aparecer una asociación ficticia entre la exposición y el factor en estudio.6 Dado que el procedimiento para la identificación y el control de la confusión (mediante el análisis estratificado y modelos multivariados, principalmente) es conceptualmente similar al usado en los estudios de casos y controles, vamos a centrar el resto de la discusión en las principales fuentes de sesgos.

 

 

 

 

Clásicamente se clasifican los sesgos en los estudios epidemiológicos como sesgos de selección (cuando los errores derivan de cómo se constituye la población en estudio) y sesgos de información (cuando los errores se originan durante el proceso de recolección de la información). Una fuente de error con entidad propia, aunque podría considerarse un tipo especial de sesgo de información, es la llamada mala-clasificación o error aleatorio, éste puede ocurrir tanto en la medición de la exposición como de la enfermedad o evento de interés.

 

Sesgos de selección

Los sesgos de selección en una cohorte tienen que ver tanto con la validez interna como con la validez externa o extrapolación de los resultados que se obtengan. Este tipo de sesgos está relacionado, evidentemente, con el procedimiento utilizado para conformar la cohorte o población en estudio: cuando la población en estudio se constituye con voluntarios, la representatividad que este grupo pueda tener de la población blanco (de la población a la cual se pretende generalizar los resultados) puede estar limitada por el hecho de que los voluntarios son diferentes en algunos aspectos de la población general. Por ejemplo, en el Estudio europeo sobre dieta y cáncer,7 la cohorte española se ha constituido a partir de donadores de sangre, es decir, hombres y mujeres altruistas, mayoritariamente jóvenes. Sin embargo, es pertinente mencionar que en el ejemplo anterior la validez interna de los resultados no se vería afectada. ¿Cómo se puede constituir una cohorte representativa de una determinada población? Un diseño experimentado con cierto éxito es el de seguimiento de muestras representativas de la población general. Un ejemplo de este tipo de diseño lo constituye el estudio de Sepúlveda y colaboradores8,9 que se basó en el seguimiento activo de los cerca de 3 241 niños de una muestra representativa de la Delegación Tlalpan, en la ciudad de México, que permitió la investigación prospectiva del papel del estado nutricional como un factor de riesgo para enfermedades diarreicas, en una cohorte representativa de un área geográfica de la ciudad de México.

Sin embargo, a pesar de contar con una cohorte inicial representativa, ¿cómo se puede asegurar que determinadas personas que retiren su participación del estudio, ya sea en la fase inicial de recolección de información o incluso después de cierto tiempo de seguimiento, no condicionen diferencias en los grupos estudiados que conduzcan a errores en los resultados? Las pérdidas en el seguimiento son, justamente, la principal causa de sesgo de selección, ya se trate de cohortes constituidas a partir de muestras representativas de la población, voluntarios o colectivos definidos (como pueden ser los trabajadores de una determinada fábrica o sector industrial o grupos profesionales determinados como médicos, enfermeras o de profesionales de la educación). Las pérdidas en el seguimiento no invalidan per se el estudio, pero los investigadores deben utilizar procedimientos para minimizar su ocurrencia y, en caso de que se presenten, considerar si afectan o no los resultados observados en el estudio. Para ello, se intentará recoger información clave de los participantes que abandonen el estudio, en especial para investigar si el abandono tiene alguna relación con las exposiciones o con las enfermedades o eventos estudiados.

Un claro ejemplo de sesgo de selección que puede alterar considerablemente los resultados obtenidos es el llamado efecto del trabajador sano, observado frecuentemente en cohortes laborales cuando el grupo no-expuesto queda constituido por la población general. Por ejemplo, al estudiar la mortalidad por cáncer y por enfermedades cerebrovasculares de los trabajadores de una determinada empresa relacionada con productos radioactivos, y compararla con la mortalidad esperada de acuerdo con las tasas observadas en la población general, se observa que el riesgo relativo de muerte por esas causas es de 0.78 y 0.81, ambos con intervalos de confianza que no incluyen la unidad.10 Los resultados parecerían sugerir que el trabajo en esa empresa protege a sus empleados con una disminución de la frecuencia con la que se presentan las enfermedades estudiadas. ¿Cómo explicar estos resultados? La cohorte de trabajadores representa un grupo especial de personas de la población general: son personas en edad laboral y con capacidad física óptima, existe una autoselección de las personas que van a desarrollar tareas concretas en esa fábrica, de manera que personas con determinados trastornos crónicos se autoexcluyen (o son excluidos por la dirección de la empresa) o pasan a trabajos menos pesados. Así, al comparar la mortalidad en ese grupo de trabajadores sanos con el experimentado en la población general del país, la observada en la empresa debe ser inferior a la de aquél. Una manera de evitar este tipo de sesgo de selección es realizando comparaciones internas en el seno de la cohorte (por ejemplo, la mortalidad por cáncer en los trabajadores de una misma empresa pero expuestos a diferentes niveles de radiación) con lo que se puede eliminar en buena parte el sesgo del trabajador sano.11 Los estudios de cohorte retrospectiva son más vulnerables a los sesgos de selección, esto se debe a que al inicio de este tipo de estudios el evento ya ocurrió en un buen número de los participantes y a que esto puede influir en la probabilidad de participación en el estudio. Este tipo de sesgo en estudios retrospectivos es particularmente serio cuando los participantes conocen también su condición de exposición y cuando la presencia conjunta de estos eventos (exposición y enfermedad) motiva una participación diferencial en el estudio.

Otro tipo de sesgo de selección, acaso el más problemático y frecuente en los estudios de cohorte, es el debido a pérdidas en el seguimiento. Si las pérdidas están relacionadas con alguna característica de los participantes como puede ser la misma exposición o el desenlace estudiado, las pérdidas determinarán de alguna manera (es decir, estarán sesgando) los resultados obtenidos. Así, las pérdidas deben ser independientes de la condición de exposición, es decir, se deben presentar con la misma frecuencia en los grupos expuesto y no-expuesto. En este caso, como en el caso del efecto del trabajador sano, el sesgo de selección introducido por las pérdidas durante el seguimiento compromete la validez interna del estudio, es decir, los grupos expuesto y no-expuesto no son comparables por lo que se pierde la veracidad de los resultados. Uno de los motivos más frecuentes de pérdidas en el seguimiento obedece a la movilidad de los participantes de la cohorte, que dificulta los contactos repetidos que se utilizan tanto para realizar nuevas determinaciones de las exposiciones como para conocer el desarrollo de las condiciones estudiadas (incidencia de enfermedades o muerte). Para mantener y maximizar la participación, y minimizar las pérdidas en el seguimiento, es necesario implementar diferentes estrategias durante el desarrollo del estudio.12

Un ejemplo de estudio de cohorte en el que se ha invertido grandes esfuerzos en el seguimiento es el estudio de las enfermeras estadunidenses. Este estudio comenzó en 1976, con la inclusión de 121 700 enfermeras certificadas, en edades comprendidas entre 30 y 55 años, que contestaron un cuestionario postal sobre estilos de vida y condiciones médicas.13 Su objetivo primario era investigar la relación entre el consumo de anticonceptivos orales y el cáncer de mama, y tras más de 25 años de seguimiento ha generado múltiples resultados con relación a ese y a otros numerosos problemas de salud. ¿Cómo han conseguido los investigadores realizar un seguimiento continuado de las más de 100 000 participantes?

1. El diseño inicial se centró en enfermeras certificadas, de manera que aunque cambien de domicilio y de localidad de residencia, si siguen ejerciendo su profesión, seguirán activas y podrán ser localizadas.

2. En el cuestionario inicial se solicitó, además del nombre de la participante, su número de la seguridad social, la fecha de nacimiento y el nombre, la dirección y el número de teléfono de un contacto personal.

3. Además, gran parte del esfuerzo se concentra en el seguimiento mediante el cuestionario postal: se envían cuestionarios postales de seguimiento cada dos años, que se acompañan de una carta de presentación y un boletín con información actualizada de los progresos del estudio; se actualiza la información de los contactos personales cada cuatro años; se envía hasta cinco veces el cuestionario (la quinta vez se trata de una versión abreviada) en caso de no respuesta.

4. Tras el quinto envío postal se realiza un seguimiento telefónico, se utiliza correo certificado o de mensajería privada, se consulta a los carteros locales, los colegios de enfermería y los contactos personales.

5. Finalmente, una parte importante del seguimiento de la mortalidad se realiza mediante el uso del Registro Nacional de Defunciones estadunidense,14 que es un índice sistematizado de todas las muertes acaecidas en los Estados Unidos de América, desde 1979. De esta manera, mediante la utilización combinada de estas estrategias, desde 1990, la cohorte de las enfermeras cuenta con 90% de seguimiento.

 

Sesgos de información

La introducción de errores sistemáticos que comprometan la validez interna del estudio por el modo en que se obtuvo la información o los datos de los participantes se conoce como sesgos de información. El sesgo de información en los estudios de cohorte se presenta cuando la información se obtiene de manera diferente en los grupos estudiados; por ejemplo, cuando los participantes en el grupo expuesto son seguidos, monitorizados o vigilados de manera más cuidadosa que los participantes en el grupo no-expuesto se introduciría un sesgo de información. En este mismo sentido, en estudios clínicos de seguimiento es frecuente que algunos participantes presenten condiciones comórbidas que generen, incluso de manera no apreciable para los investigadores, una mayor vigilancia o control de esos pacientes con relación a otros sujetos del estudio, aumentando artificialmente las posibilidades de diagnóstico de la condición de interés. Por ejemplo, entre las participantes posmenopáusicas, en la cohorte de las enfermeras estadunidenses es más probable que las enfermeras que toman terapia sustitutiva hormonal se sometan a un seguimiento más riguroso que, acaso, incluya prácticas preventivas adicionales como es la detección oportuna de cáncer de mama, lo que haría más probable la detección de tumores mamarios en este grupo de la cohorte, en comparación con las enfermeras posmenopáusicas que no siguen un tratamiento sustitutivo y llevan un seguimiento médico y ginecológico habitual.15 Así, al cuantificar la asociación entre la terapia hormonal sustitutiva y el riesgo de cáncer mamario se observaría un incremento de la incidencia de la enfermedad debido al sesgo de información (mayor detección de cáncer de mama) entre las enfermeras en tratamiento sustitutivo.

En ocasiones es el propio investigador quien evalúa de forma sesgada la presencia o no de la condición de interés, puesto que conoce las hipótesis bajo investigación o la historia de exposiciones de los participantes. Este tipo de error se conoce como sesgo del observador. Imaginemos que en el estudio mencionado anteriormente "estamos convencidos" de que la terapia sustitutiva aumenta el riesgo de cáncer mamario, por lo que podríamos incurrir en un sesgo del observador si se intensificara el seguimiento de las enfermeras que toman la terapia sustitutiva, a partir de la idea de que se encuentran en mayor riesgo de padecer el evento, o al revés, podríamos minimizar el seguimiento de las enfermeras que no consumen hormonas. El problema se deriva de realizar un esfuerzo diferente en el seguimiento de los expuestos y los no-expuestos, derivado de las hipótesis a priori ¾o en algunos casos de la propia organización logística¾ del estudio. ¿Cómo se puede evitar el sesgo de información? Garantizando que todas las mediciones realizadas tanto mediante cuestionarios como por muestras biológicas se realicen con el mismo grado de error (misma sensibilidad y especificidad) en el grupo expuesto y no-expuesto. Esto se puede lograr en algunos estudios manteniendo ciegos tanto a los participantes como a los observadores sobre la condición de exposición y la hipótesis de estudio.

 

Mala-clasificación o sesgos de clasificación no diferencial

En los estudios de cohorte se deben tener en cuenta los sesgos de información debidos a la clasificación errónea (mala-clasificación) de los participantes respecto a la existencia o a la cuantificación de la exposición estudiada o a la ocurrencia de la enfermedad o de la condición de interés.16 ¿De qué depende este tipo de error? La principal fuente de sesgo deriva de los instrumentos utilizados y de su modo de aplicación (cuestionarios, técnicas analíticas, biomarcadores, etc.). Si disponemos de un cuestionario para determinar el consumo de alcohol semanal que produce estimaciones sesgadas inferiores a las reales (por ejemplo, porque no considera de forma independiente el consumo de alcohol de fin de semana del consumo del resto de la semana) incurriremos en una infravaloración del consumo real de alcohol. Esa subestimación ¿se produce del mismo modo en los grupos expuesto y no-expuesto, entre los sujetos que desarrollaron el evento y los que no? Esa es una cuestión clave que nos permitirá caracterizar la mala-clasificación en dos tipos: a) diferencial, cuando el error en la clasificación depende del valor de otras variables, y b) no-diferencial, cuando el error no depende de las otras variables. Volvamos al ejemplo anterior. Supongamos que el cuestionario sobre consumo de alcohol es administrado por entrevistadores en el domicilio de los participantes. Si el protocolo de administración no se aplica estrictamente o ha fallado el adiestramiento de los entrevistadores, podría suceder que algunos entrevistadores enfaticen e investiguen hasta la última gota de alcohol consumida por el participante, sobre todo cuando se entrevista a varones de mediana edad en zonas o barrios deprimidos de la ciudad en los que el consumo de alcohol parece una conducta habitual. Sin embargo, al entrevistar a mujeres, también de mediana edad, de zonas más favorecidas, el entrevistador no enfatiza la metodología de la entrevista, asumiendo que los participantes de esas características no tienen un consumo de alcohol importante. Nos encontramos, pues, ante un típico ejemplo de mala-clasificación de la exposición, en este caso diferencial en lo que se refiere a la variable de nivel socioeconómico. Cuando el error afecta por igual a todos los participantes, independientemente de su exposición verdadera (los entrevistadores aplican de manera similar el cuestionario, pero éste recoge consumos inferiores de alcohol sistemáticamente) nos hallamos ante mala-clasificación no diferencial o aleatoria. En este último caso, el sesgo introducido tiende a modificar las estimaciones del riesgo relativo hacia la hipótesis nula, es decir, hacia la subestimación de la verdadera asociación. Sin embargo, la dirección del sesgo en el caso de mala-clasificación diferencial depende del tipo de exposición investigada y es, en muchos casos, impredecible.

Lo comentado para el caso de la medida de la exposición es aplicable igualmente a la determinación de la condición o enfermedad estudiada. Veamos un último ejemplo. En una cohorte de adolescentes, constituida durante el primer año de la escuela secundaria del estado de Morelos, en México, se recogieron, en el momento de constitución de la cohorte, diferentes variables sociodemográficas y de hábito tabáquico, y variables sobre el rendimiento escolar. Cinco años después, se desea realizar una entrevista y examen físico a todos los participantes, con la intención de investigar los efectos a corto y mediano plazo del tabaquismo. Debido a que los investigadores conocen las características basales de los participantes, y saben que el consumo de tabaco es más frecuente entre los adolescentes con menor nivel económico y menor rendimiento, en el momento de determinar la presencia de enfermedades (mediante un cuestionario y un examen médico sencillo) tienden a investigar con más detenimiento a los participantes con esas características, aumentando, así, de manera diferencial la probabilidad de diagnóstico de enfermedad en los expuestos.

Las posibles soluciones para minimizar los errores de medición aleatorios consisten en la validación de los instrumentos de medida utilizados, ya sean cuestionarios estructurados, pruebas psicométricas, instrumentos médicos (esfigmomanómetros, balanzas, y otros), técnicas de laboratorio, etcétera, junto con la implantación de protocolos de aplicación estrictos, previo entrenamiento y estandarización, sobre todo cuando los observadores son múltiples e, incluso, de diferentes centros y la realización de medidas repetidas en los mismos sujetos. Finalmente, la realización de una prueba piloto en condiciones reales y la implementación de controles de calidad continuados de la información recolectada pueden alertar sobre la aparición de este tipo de sesgos17 que difícilmente son controlables en las fases de análisis del estudio.

De lo comentado se deduce que los sesgos pueden minimizarse con un buen diseño, que en los estudios de cohorte se ha de incluir la planificación detallada de la constitución de la cohorte y de los mecanismos de seguimiento, además de los instrumentos de captura de la información. La utilización de métodos estadísticos nos permite controlar en el análisis algunos de los sesgos aleatorios que no pudieron ser prevenidos en el diseño, tal como el análisis estratificado y los métodos multivariados. Un estudio libre de sesgos nos garantizará su validez interna, así como su validez externa o extrapolación.

 

Conclusiones

La utilización de los estudios de cohorte ha aumentado considerablemente durante los últimos años. Como parte de la revolución informática ocurrida en la práctica de la epidemiología se han desarrollado avances considerables en los métodos que permiten el seguimiento eficiente y costo-efectivo de grandes y diversos grupos poblacionales, así como la aplicación de métodos estadísticos sofisticados que permiten prevenir, corregir y controlar diferentes sesgos y examinar las relaciones epidemiológicas en un contexto más controlado. Estos avances han permitido el desarrollo de conocimiento derivado de estudios epidemiológicos de cohorte que han tenido un gran impacto en la práctica médica; un ejemplo destacado de esto lo constituyen los datos sobre el efecto del tabaquismo y el plomo sobre la salud humana. Sin duda, los estudios de cohorte han modificado la percepción de los estudios observacionales y ahora se consideran una herramienta importante para el avance del conocimiento médico. La continua mejoría de los registros médicos y epidemiológicos en México, la implementación de bancos de biomarcadores ¾como los que están siendo implementados en las Encuestas Nacionales de Salud¾, así como la capacidad técnica e infraestructura institucional desarrolladas en países como el nuestro, sin duda contribuirán a que este tipo de diseño sea utilizado con mayor frecuencia en nuestro medio para el estudio de diversas exposiciones ambientales, infecciosas, nutricionales, así como exposiciones asociadas a diversos estilos de vida en diversos contextos geopolíticos y grupos de riesgo, lo que nos permitirá estudiar con mayor rigor metodológico el proceso salud enfermedad y el impacto de los diferentes programas de intervención.

 

Referencias

1. Breslow NE, Day NE. Statistical methods in cancer research. The design and analysis of cohort studies. Lyon, Francia: IARC Scientific Publications, 1987;vol. I.         [ Links ]

2. Rothman KJ, Greenland S. Modern epidemiology. 2a. edición. Boston: Lippincot-Raven, 1998:5-100.         [ Links ]

3. Kaplan EL, Meier P. Nonparametric estimation from incomplete observations. J Am Stat Assoc 1958; 53: 457-481.         [ Links ]

4. Nieto GJ. Los estudios de cohorte. En: Martínez N, Antó JM, Castellanos PL, Gili M, Marset P, Navarro V, ed. Salud Pública. Madrid: McGraw-Hill / Interamericana, 1999.         [ Links ]

5. MacMahon B, Trichopoulos D. Epidemiology. Principles and methods. 2a. edición. Boston: Little Brown and Company, 1996:165-225.         [ Links ]

6. Rothman KJ, Greenland S. Modern epidemiology. 2a. edición. Boston: Lippincot-Raven, 1998:120-186.         [ Links ]

7. European prospective investigation into cancer and nutrition. EPIC Group of Spain. Relative validity and reproducibility of a diet history questionnaire in Spain. I. Foods. Int J Epidemiol 1997;26 (Suppl 1):S91-S99.         [ Links ]

8. Sepúlveda J, Willett W, Muñoz A. Malnutrition and diarrhea. A longitudinal study among urban Mexican children. Am J Epidemiol 1988;127:365-376.         [ Links ]

9. Sepúlveda J. Malnutrition and infectious diseases. A longitudinal study of interaction and risk factor. Cuernavaca, Morelos: Instituto Nacional de Salud Pública 1990;(Perspectivas en Salud Pública).         [ Links ]

10. Checkoway H, Pearce N, Crowford-Brown DJ. Research methods in occupational epidemiology. Nueva York: Oxford University Press, 1989: 77-80.         [ Links ]

11. Checkoway H, Eisen EA. Developments in occupational cohort studies. Epidemiol Rev 1998; 20(1):100-111.         [ Links ]

12. Hunt JR, White E. Retainig and tracking cohort study members. Epidemiol Rev 1998;20(1):57-70.         [ Links ]

13. Colditz GA. The nurses' health study: A cohort of US women followed since 1976. J Am Med Women Assoc 1995;50(2):40-44.         [ Links ]

14. Howe GR. Use of computerized record linkage in cohort studies. Epidemiol Rev 1998;20(1):112-121.         [ Links ]

15. Franceschi S, La Vecchia C. Colorectal cancer and hormone replacement therapy: An unexpected finding. Eur J Cancer Prev 1998;7(6): 427-438.         [ Links ]

16. Mertens TE. Estimating the effects of misclassification. Lancet 1993;342: 418-421.         [ Links ]

17. Whitney CW, Lind BK, Wahl PW. Quality assurance and quality control in longitudinal studies. Epidemiol Rev 1998;20(1):71-80.         [ Links ]

 

 

(1) Centro de Investigación en Salud Poblacional, Instituto Nacional de Salud Pública. Cuernavaca, Morelos, México.

(2) Departamento de Salud Pública, Universidad de Barcelona. Barcelona, España.

 

Solicitud de sobretiros: Dr. Eduardo César Lazcano Ponce. Centro de Investigación en Salud Poblacional, Instituto Nacional de Salud Pública. Avenida Universidad 655, colonia Santa María Ahuacatitlán, 62508 Cuernavaca, Morelos, México.
Correo electrónico: elazcano@insp3.insp.mx