epidemiología y bioestadística secretos nordness1ed

285
Versión en español de la primera edición de la obra original en inglés Epidemiology and Biostatistics Secrets Robert J. Nordness Copyright © MMVI, Elsevier Inc., an Elsevier Imprint Revisión Antonio Trilla Director de la Unidad de Evaluación, Soporte y Prevención Hospital Clínic. Barcelona © 2006 Edición en español Elsevier España, S.A. Génova, 17, 3.º 28004 Madrid. España An Elsevier Imprint Fotocopiar es un delito (Art. 270 C.P.) Para que existan libros es necesario el trabajo de un importante colectivo (autores, traductores, dibujantes, correctores, impresores, editores…). El principal beneficiario de ese esfuerzo es el lector que aprovecha su contenido. Quien fotocopia un libro, en las circunstancias previstas por la ley, delinque y contribuye a la «no» existencia de nuevas ediciones. Además, a corto plazo, encarece el precio de las ya existentes. Este libro está legalmente protegido por los derechos de propiedad intelectual. Cualquier uso, fuera de los límites establecidos por la legislación vigente, sin el consentimiento del editor, es ilegal. Esto se aplica en particular a la reproducción, fotocopia, traducción, grabación o cualquier otro sistema de recuperación de almacenaje de información. Coordinación y producción editorial: EDIDE, S.L. ISBN edición original: 0-323-03406-3 ISBN edición española: ISBN-13: 978-84-8174-950-2 ISBN-10: 84-8174-950-8 Depósito legal: Impreso en España por Gráficas Hermanos Gómez, S.L.L. ADVERTENCIA La medicina es un área en constante evolución. Aunque deben seguirse unas precauciones de seguridad estándar, a medida que aumenten nuestros conocimientos gracias a la inves- tigación básica y clínica habrá que introducir cambios en los tratamientos y en los fárma- cos. En consecuencia, se recomienda a los lectores que analicen los últimos datos aporta- dos por los fabricantes sobre cada fármaco para comprobar la dosis recomendada, la vía y duración de la administración y las contraindicaciones. Es responsabilidad ineludible del médico determinar las dosis y el tratamiento más indicado para cada paciente, en función de su experiencia y del conocimiento de cada caso concreto. Ni los editores ni los directo- res asumen responsabilidad alguna por los daños que pudieran generarse a personas o propiedades como consecuencia del contenido de esta obra. EL EDITOR

Upload: laura-maria

Post on 11-Aug-2015

89 views

Category:

Health & Medicine


13 download

TRANSCRIPT

Page 1: Epidemiología y bioestadística secretos   nordness1ed

Versión en español de la primera edición de la obra original en inglésEpidemiology and Biostatistics SecretsRobert J. Nordness

Copyright © MMVI, Elsevier Inc., an Elsevier Imprint

RevisiónAntonio TrillaDirector de la Unidad de Evaluación, Soporte y PrevenciónHospital Clínic. Barcelona

© 2006 Edición en españolElsevier España, S.A.Génova, 17, 3.º28004 Madrid. España

An Elsevier Imprint

Fotocopiar es un delito (Art. 270 C.P.)Para que existan libros es necesario el trabajo de un importante colectivo (autores, traductores,dibujantes, correctores, impresores, editores…).El principal beneficiario de ese esfuerzo es el lector que aprovecha su contenido.Quien fotocopia un libro, en las circunstancias previstas por la ley, delinque y contribuye a la «no»existencia de nuevas ediciones.Además, a corto plazo, encarece el precio de las ya existentes.Este libro está legalmente protegido por los derechos de propiedad intelectual. Cualquier uso, fuerade los límites establecidos por la legislación vigente, sin el consentimiento del editor, es ilegal. Estose aplica en particular a la reproducción, fotocopia, traducción, grabación o cualquier otro sistemade recuperación de almacenaje de información.

Coordinación y producción editorial: EDIDE, S.L.ISBN edición original: 0-323-03406-3ISBN edición española:

ISBN-13: 978-84-8174-950-2ISBN-10: 84-8174-950-8

Depósito legal: Impreso en España por Gráficas Hermanos Gómez, S.L.L.

ADVERTENCIA

La medicina es un área en constante evolución. Aunque deben seguirse unas precaucionesde seguridad estándar, a medida que aumenten nuestros conocimientos gracias a la inves-tigación básica y clínica habrá que introducir cambios en los tratamientos y en los fárma-cos. En consecuencia, se recomienda a los lectores que analicen los últimos datos aporta-dos por los fabricantes sobre cada fármaco para comprobar la dosis recomendada, la víay duración de la administración y las contraindicaciones. Es responsabilidad ineludible delmédico determinar las dosis y el tratamiento más indicado para cada paciente, en funciónde su experiencia y del conocimiento de cada caso concreto. Ni los editores ni los directo-res asumen responsabilidad alguna por los daños que pudieran generarse a personas opropiedades como consecuencia del contenido de esta obra.

EL EDITOR

Page 2: Epidemiología y bioestadística secretos   nordness1ed

COLABORADORES

Robbie Ali, MD, MPH, MPPMVisiting Associate Professor, Department of Behavioral and Community Health Sciences, University ofPittsburgh Graduate School of Public Health, Pittsburgh, Pennsylvania

Adam M. Brown, DOInstructor, Naval Undersea Medical Institute, Groton, Connecticut

Mark Glover, BA, BM, BCh, MRCGP, MFOMConsultant Occupant Physician, Undersea Medicine Division, Institute of Naval Medicine, Alverstoke,Gosport, Hampshire, United Kingdom

Moore H. Jan, MD, MPHHead, Occupational Medicine, U.S. Naval Medical Center and Branch Clinics, Portsmouth, Virginia

Christopher Jankosky, MD, MPHChief Resident, Department of Occupational Medicine, Johns Hopkins School of Public Health,Baltimore, Maryland

John L. Kane, MDGreat Lakes Naval Hospital, Great Lakes, Illinois

Sue Kim, MDDivision of Hematology, Stanford University Medical Center, Stanford, California

Michael D. Lappi, DO, PhDDepartment of Occupational and Environmental Medicine, Harvard Medical School, Boston,Massachusetts

Patrick R. Laraby, MD, MBA, MPH, FACOEMHead, Occupational and Environmental Health, Naval Hospital, Naples, Italy

Jonathan M. Lieske, MD, MPHSenior Medical Officer, Naval Special Warfare Group Two, Norfolk, Virginia

Neal Andrew Naito, MD, MPHHead, Occupational Health Clinic, National Naval Medical Center; Adjunct Assistant ResearchProfessor, Uniformed Services University of the Health Sciences, Bethesda, Maryland

Mark Nordness, MDProHealth Care, Inc., Waukesha, Wisconsin

Robert J. Nordness, MD, MPHFormerly, Officer in Charge, Naval Undersea Medical Institute, Groton, Connecticut

Lee Okurowski, MD, MPH, MBASouth Walpole, Massachusetts

vii

Page 3: Epidemiología y bioestadística secretos   nordness1ed

Philip D. Parks, MD, MPHDiving Medical Officer, Naval Special Warfare Group Two, United States Navy, Norfolk, Virginia

Robert W. Perkins, MD, MPHMedical Corps, United States Navy, Poulsbo, Washington

Ward L. Reed, MD, MPHNaval Aerospace Medicine Institute, Pensacola, Florida

Ashita Tolwani, MD, MScDivision of Nephrology, Department of Medicine, University of Alabama at Birmingham School ofMedicine, Birmingham, Alabama

Thomas H. Winters, MD, FACOEM, FACPMPresident and Chief Medical Officer, Occupational and Environmental Health Network; Lecturer,Harvard School of Public Health and Harvard Medical School, Boston, Massachusetts

Richard I. Wittman, MD, MPHAssociate Medical Director, Workforce Medical Center, Redwood City, California

Ann M. Zaia, NP-C, SM, MSN, MHA, CHS-III, CHE, COHN-SSudbury, Massachusetts

viii COLABORADORES

Page 4: Epidemiología y bioestadística secretos   nordness1ed

PRÓLOGO

El arte de tomar decisiones radica en una base constituida por el conocimiento y la experiencia

en el campo médico. Nunca antes los médicos se habían visto inundados por este aluvión

de información publicada e indicada para ser útil en la atención a los pacientes, aunque muchos

hábiles cuidadores notan que carecen de la capacidad para utilizar eficazmente la literatura

médica actual. Este libro pretende servir de base y reciclaje de algunos de los conceptos

fundamentales en epidemiología y bioestadística para profesionales sanitarios de todo nivel

de experiencia. Puede obtenerse una perspectiva más completa, enfocada y/o teórica de los

temas introducidos en una amplia variedad de textos disponibles en el campo de la epidemiología

y la bioestadística.

Robert J. Nordness, MD, MPH

D E D I C A T O R I A

A mis hijos

Daniel, Oscar y Claire

que son mi vida

ix

Page 5: Epidemiología y bioestadística secretos   nordness1ed
Page 6: Epidemiología y bioestadística secretos   nordness1ed

1

LOS 100 SECRETOS PRINCIPALES

Estos secretos son 100 de las alertas más importantes. Resumen los conceptos, principios

y detalles más relevantes de la epidemiología y de la bioestadística.

1. La epidemiología es el estudio de la distribución y determinantes de la enfermedad en la pobla-

ción humana. Es la ciencia básica y práctica fundamental de la salud pública.

2. Algunas premisas básicas de la epidemiología son que la enfermedad humana no se produce al

azar, y que pueden identificarse los factores causales y preventivos de la enfermedad mediante

una investigación sistemática de diferentes poblaciones o subgrupos de población en diversos

lugares o momentos.

3. La epidemiología descriptiva se ocupa de la identificación de las características generales de la

distribución de la enfermedad, especialmente en relación con la persona, el lugar y el momen-

to. Los estudios descriptivos incluyen estudios ecológicos (es decir, de correlación), descrip-

ción de casos clínicos y series de casos, y estudios transversales.

4. La epidemiología analítica requiere un estudio para probar una hipótesis específica en lo que

respecta a la relación entre una exposición a un factor de riesgo y un desenlace o consecuen-

cia, clásicamente, una enfermedad. Se considera que tanto los estudios observacionales como

los experimentales son estudios analíticos, pero sólo en los estudios experimentales el investi-

gador determina la exposición.

5. Generalmente, las tasas de morbilidad o mortalidad brutas deben ajustarse para ser útiles en la

comparación de poblaciones diferentes. Las tasas ajustadas se denominan también tasasestandarizadas, y la distribución por edades es el factor ajustado más habitual.

6. En la salud pública se consideran los tres niveles de prevención siguiente:■ Prevención primaria: la prevención de la enfermedad o de lesión (p. ej., programas de pro-

moción de la salud e inmunizaciones).■ Prevención secundaria: la detección precoz de la enfermedad y su rápido tratamiento

(p. ej., programas de cribado).■ Prevención terciaria: la reducción de la discapacidad y la promoción de la rehabilitación

resultante de la enfermedad (p. ej., correcciones quirúrgicas y programas de rehabilitación).

7. Los factores de riesgo de enfermedad –o salud– pueden ser genéticos, medioambientales o

relacionados con el estilo de vida. La combinación de estos factores puede afectar de modo

profundo al riesgo en un individuo concreto. Cuando sea posible, debe interpretarse el riesgo

en términos de números reales de sucesos, y tener en consideración el riesgo basal y la preva-

lencia de la exposición a los factores de riesgo.

8. Una tasa tiene un denominador con unidades que incluyen el tiempo (p. ej., 25 muertes

por 100.000 personas por año). Un riesgo no requiere el tiempo en el denominador

(p. ej., 2,6 muertes por 100 operaciones cardíacas). Se debe comprobar siempre el denomina-

Page 7: Epidemiología y bioestadística secretos   nordness1ed

dor en un cálculo del riesgo para establecer exactamente qué población proporciona la fuente

de las observaciones.

9. Un riesgo relativo (RR), o razón de riesgos, es una medida del riesgo absoluto en una pobla-

ción, como una proporción del riesgo absoluto en otra. Por lo general, pero no de modo inva-

riable, se utiliza el riesgo más alto en el numerador.

10. Puede calcularse la posibilidad relativa (odds ratio, OR) en los estudios de cohortes y de casos

y controles, pero no puede calcularse el riesgo relativo en un estudio de casos y controles. No

obstante, cuando el desenlace es infrecuente, la posibilidad relativa es una buena aproximación

al riesgo relativo.

11. El riesgo atribuible, definido como el riesgo adicional de enfermedad en un grupo expuesto

sobre el que existe en un grupo no expuesto, está influido por la magnitud del riesgo basal,

mientras que no existe dicha influencia en el riesgo relativo.

12. La tasa de incidencia es el número de nuevos casos de la enfermedad en un período especifica-

do, dividido por la población en riesgo durante dicho período. La prevalencia es el número de

individuos con una enfermedad en un momento o período determinado, dividido por la pobla-

ción en riesgo en dicho momento o período. Puede calcularse la prevalencia multiplicando la

tasa de incidencia por la duración promedio de la afección.

13. Como instrumentos de recogida de datos, las encuestas son transversales, lo que significa que

la información en relación con la exposición y el desenlace se recoge simultáneamente. En las

encuestas o estudios transversales es imposible asegurar cualquier tipo de información sobre

la relación temporal entre un factor de riesgo posible y su desenlace. Las encuestas son útiles

para identificar a las personas con procesos crónicos o enfermedades menos graves, porque

los sujetos tienen una mayor probabilidad de estar presentes y de tener una salud lo suficiente-

mente buena como para participar, a diferencia de los individuos que padecen enfermedades

graves rápidamente progresivas.

14. La vigilancia es la recogida, el análisis y la difusión sistemática de los datos de la enfermedad

sobre grupos de personas, y está diseñada para detectar signos precoces de enfermedad. La

vigilancia se lleva a cabo en muchos niveles, en relación con una amplia variedad de poblacio-

nes, y es una piedra angular de la medicina preventiva. Su finalidad principal es prevenir la

enfermedad y la lesión y, en último término, mejorar la calidad de vida.

15. Las tasas basales establecen el estándar con el que pueden compararse todas las futuras apari-

ciones de un suceso (p. ej., días de enfermedad o cáncer). Pueden también emplearse para

detectar patrones atípicos, como una epidemia.

16. El National Center for Health Statistics (NCHS) recoge las estadísticas vitales en Estados Uni-

dos. Las estadísticas vitales son acontecimientos críticos en la vida de un individuo. En Esta-

dos Unidos, estos acontecimientos son el nacimiento, la muerte, el matrimonio, el divorcio y la

muerte fetal.

17. El Bureau of Labor Statistics (BLS) es la principal agencia de investigación del gobierno federal

estadounidense en relación con los aspectos económicos y estadísticos del trabajo, como: la

inflación, los salarios, la productividad, la salud, la demografía y el desempleo.

LOS 1OO SECRETOS PRINCIPALES2

Page 8: Epidemiología y bioestadística secretos   nordness1ed

18. El triángulo epidemiológico está compuesto por un huésped, un agente y un ambiente. Un

huésped es un organismo vivo capaz de infectarse, un agente es un factor que ha de estar pre-

sente (o potencialmente ausente) para que se produzca una enfermedad, y un ambiente es una

fuerza o situación extrínseca que afecta a la oportunidad de que un huésped quede expuesto a

un agente.

19. La transmisión directa es la transferencia de un agente infeccioso por contacto físico con lesio-

nes, sangre, saliva u otra secreción. La transmisión indirecta se produce cuando un agente

infeccioso pasa un tiempo variable en el interior o sobre la superficie de una sustancia u orga-

nismo vivo intermedio.

20. La infectividad es la proporción de personas que, expuestas a un agente causal, llegan a pade-

cer en último término una enfermedad infecciosa. La patogenicidad es la capacidad de un orga-

nismo para causar un estado de enfermedad (es decir, morbilidad). La virulencia es la capaci-

dad para causar la muerte (es decir, mortalidad).

21. Una epidemia o brote es, sencillamente, la aparición de una frecuencia mayor de la enfermedad

o lesión de la esperada, en relación con una población clásica durante un período de tiempo

determinado.

22. Las 10 medidas básicas de la investigación de un brote son las siguientes:■ Prepararse para el trabajo de campo.■ Establecer la existencia de un brote.■ Comprobar el diagnóstico.■ Definir e identificar los casos.■ Describir y orientar los datos en términos de tiempo, lugar y persona.■ Desarrollar hipótesis.■ Evaluar hipótesis.■ Depurar hipótesis y llevar a cabo estudios adicionales.■ Llevar a la práctica medidas de control y de prevención.■ Comunicar los hallazgos.

23. Una asociación puede deberse a los cuatro mecanismos siguientes:■ Lo espurio (es decir, artefactual): la asociación es consecuencia de un error o sesgo en el

diseño del estudio, en su puesta en práctica o en su análisis.■ Variable de confusión: la relación entre una exposición y el desarrollo de una enfermedad se

distorsiona por una variable adicional.■ Casualidad: una asociación observada se debe sólo a la casualidad.■ Causalidad: un factor causa, directa o indirectamente, un desenlace observado.

24. Los Criterios de Hill en relación con la causalidad son los siguientes:■ Fuerza de la asociación.■ Consistencia.■ Especificidad.■ Temporalidad.■ Gradiente biológico.

25. Existen cuatro tipos de relaciones causales:■ Necesaria y suficiente.■ Necesaria pero no suficiente.

■ Gradiente biológico.■ Verosimilitud.■ Coherencia.■ Datos experimental sugestivos.■ Analogía.

. ■ Suficiente pero no necesaria.■ Ni suficiente ni necesaria.

LOS 1OO SECRETOS PRINCIPALES 3

Page 9: Epidemiología y bioestadística secretos   nordness1ed

26. Existe una variable capaz de causar confusión cuando una asociación exposición-desenlace se

produce solamente porque un tercer factor distinto se asocia con la exposición y el desenlace.

La asociación observada es verdadera, pero no causal.

27. La modificación del efecto se produce cuando el efecto de un factor de riesgo sobre un desen-

lace particular varía con la presencia y/o el nivel de una tercera variable. La tercera variable

recibe la denominación de modificador del efecto, porque modifica el efecto (es decir, el desen-

lace) del factor de riesgo.

28. El «efecto del trabajador sano» describe el fenómeno según el cual los trabajadores como

grupo están, generalmente, más sanos que los desempleados. No solamente los sanos tienen

una mayor probabilidad de obtener empleo sino que también, una vez obtenido un trabajo, tie-

nen una mayor probabilidad de tener un seguro de la empresa, lo que mejora su acceso al sis-

tema de atención sanitaria.

29. El sesgo es un error sistemático en el diseño, en la puesta en práctica o en el análisis de un

estudio, lo que causa un resultado falso que, generalmente, desvía las observaciones en una

dirección. Las dos principales clasificaciones del sesgo son la selección y la observación

(es decir, la información).

30. Los estudios descriptivos incluyen los siguientes:■ Estudios de correlación (p. ej., estudios de poblaciones o estudios ecológicos).■ Casos clínicos.■ Series de casos.■ Estudios transversales o encuestas.

31. Los estudios analíticos incluyen los siguientes:■ Estudios observacionales (p. ej., estudios de casos y controles o estudios de cohortes).■ Estudios de intervención (p. ej., ensayos clínicos).

32. En un estudio de casos y controles, se seleccionan sujetos que llegan a padecer una afección

(es decir, casos) y sujetos que no llegan a padecer una afección (es decir, controles), y se reali-

za una comparación de los dos grupos con respecto a su exposición previa.

33. En un estudio de cohortes, se definen los sujetos por la presencia o ausencia de una exposi-

ción a un factor de riesgo de una enfermedad. A continuación, estos sujetos son estudiados en

el tiempo. Se analiza la frecuencia relativa del desenlace de interés, para determinar si la expo-

sición es, en efecto, un factor de riesgo de la enfermedad.

34. El modelo de estudio de intervención compara diferentes protocolos de tratamiento o de inter-

venciones preventivas aportadas a diversos grupos de sujetos, y se compara el desenlace entre

los grupos. El estudio controlado y aleatorio (RCT) es un tipo de modelo de intervención que pro-

porciona el dato más consistente con respecto a la relación entre la intervención y el desenlace.

35. Cuando se utilice un artículo médico para responder a problemas clínicos, se deben realizar

siempre las siguientes preguntas:■ ¿Son válidos los resultados del estudio?■ ¿Son importantes los datos sugestivos?■ ¿De qué modo pueden aplicarse los resultados válidos e importantes a la atención médica

de los pacientes?

LOS 1OO SECRETOS PRINCIPALES4

Page 10: Epidemiología y bioestadística secretos   nordness1ed

36. A continuación, se expone una clasificación jerárquica de los datos sugestivos, utilizada en la

medicina basada en la evidencia, por orden de mayor a menor utilidad:■ Número de estudios controlados aleatorios.■ Revisión sistemática de estudios controlados aleatorios.■ Estudio aleatorio único.■ Revisión sistemática de estudios observacionales.■ Estudio observacional único.■ Estudio fisiológico.■ Observación clínica no sistemática.

37. Las pruebas diagnósticas con unos valores de sensibilidad muy elevadas son de utilidad para

descartar una enfermedad o afección dada, cuando los resultados son negativos. Puede recor-

darse por la mnemotécnica SnNout: una prueba sensible con un resultado negativo descarta

(out) una enfermedad.

38. Las pruebas diagnósticas con valores de especificidad muy elevados son útiles para admitir la

presencia de una enfermedad o afección dada, cuando los resultados son positivos. Puede

recordarse por la mnemotécnica SpPin: una prueba específica con un resultado positivo inclu-

ye una enfermedad.

39. El número que es necesario tratar (NNT) es una expresión numérica del número de pacientes

que reciben un tratamiento activo que es necesario incluir para demostrar un beneficio con res-

pecto a la ausencia de tratamiento. El NNT es el valor inverso de la reducción del riesgo absolu-

to (ARR) y se indica por la expresión NNT=1/ARR.

40. Los cocientes de verosimilitud (likelihood ratio) miden hasta qué punto una prueba diagnóstica

eleva o disminuye la posibilidad preprueba en relación con una enfermedad o trastorno concre-

to. Cuanto mayor sea el cociente de verosimilitud positivo (es decir, el cociente entre la sensibi-

lidad y la tasa de falsos positivos), mayor será el aumento entre la posibilidad preprueba y la

posibilidad posprueba.

41. Mediante la aplicación de los principios estadísticos a las ciencias biológicas, los bioestadísti-

cos pueden distinguir metódicamente entre las diferencias verdaderas entre las observaciones

y las variaciones por azar, lo que les permite determinar asociaciones entre factores de riesgo y

enfermedad, para reducir la enfermedad y la lesión.

42. La regla empírica establece que, en una distribución normal, aproximadamente el 68%

de los datos se hallan comprendidos entre una desviación estándar (SD) a ambos lados de

la media, casi el 95% de la distribución se encuentran entre dos SD a ambos lados de la

media, y, aproximadamente, el 99,7% de los datos están entre tres SD a ambos lados

de la media.

43. La media, la mediana y la moda son medidas de la tendencia central. La mediana se halla

menos afectada que la media por los valores atípicos, lo que hace que la mediana sea una

medida más consistente consistente de la tendencia central y, por tanto, una medida mejor de

la tendencia central en los datos sesgados.

44. El intervalo o recorrido, la desviación estándar y la varianza son medidas clásicas de la disper-

sión, o diseminación, del conjunto de datos que se está examinando.

LOS 1OO SECRETOS PRINCIPALES 5

Page 11: Epidemiología y bioestadística secretos   nordness1ed

VP45. Sensibilidad = = tasa de verdaderos positivos = 1 – tasa de falsos negativos

VP + FN

VN46. Especificidad = = tasa de verdaderos negativos = 1 – tasa falsos positivos

VN + FP

47. Una distribución de datos asimétrica está sesgada hacia la izquierda (o sesgada negativamen-

te) si la «cola» más larga de la curva se extiende a la izquierda; si lo está en sentido contrario,

se dice que la distribución está sesgada a la derecha o sesgada positivamente. La moda se

halla situada en el punto más elevado de la curva, la media se localiza hacia la «cola» más

larga, y la mediana se halla situada entre la moda y la media.

48. Una variable es cualquier cosa que puede medirse y observar cómo fluctúa. Las variables

cuantitativas se miden en una escala numérica, mientras que las variables cualitativas se miden

sin un sentido numérico.

49. Las cuatro escalas de medida típicas son las siguientes:■ Escalas nominales: empleadas para agrupar arbitrariamente datos cualitativos.■ Escalas ordinales: muestran la posición, pero no dan información sobre la distancia entre los

valores.■ Escalas de intervalos: tienen posiciones e intervalos significativos entre los valores.■ Escalas de cocientes: tienen ceros, valores e intervalos significativos, y todos ellos dan un

sentido al cociente entre dos valores.

50. Las siguientes son medidas de tendencia central:■ Media: el promedio aritmético de los valores observados; está muy afectada por los valores

extremos.■ Mediana: división de la distribución en dos partes iguales.■ Moda: el valor observado más frecuente en la distribución; en un conjunto de datos puede

haber múltiples modas.

51. Las siguientes son medidas de dispersión en un conjunto de datos de una muestra:■ Intervalo: la diferencia entre el valor más bajo y el más alto; confiere amplitud a la distribu-

ción, pero nada más.■ Desviación estándar: la medida de dispersión empleada más habitualmente, calculada con el

empleo de la fórmula:

Σ(x – x–)2

DE = n – 1

donde S = suma de, x = puntuación individual, x– = media de todas las puntuaciones,

y n = tamaño de la muestra, o número de las puntuaciones■ Varianza: es el cuadrado de la desviación estándar (DE2).

52. El error de medida aleatorio aumenta la dispersión, es impredecible y, probablemente, se sitúa a

cualquier lado del valor verdadero de la propiedad que se está midiendo. La precisión es la falta

de error al azar, lo que lleva a un agrupamiento ajustado con la repetición de las mediciones.

53. El error sistemático (es decir, el sesgo) es causa de que las medidas repetidas se sitúen, gene-ralmente, alrededor de un valor distinto al verdadero valor de la propiedad que se está midien-do. La validez es la ausencia de error sistemático.

LOS 1OO SECRETOS PRINCIPALES6

Page 12: Epidemiología y bioestadística secretos   nordness1ed

54. Una distribución de frecuencias ilustra con qué frecuencia las diferentes categorías de datos

(o intervalos de los valores) aparecen en una muestra de datos. Esta información puede ser

presentada en muchos formatos diferentes, como tablas, gráficos y líneas. Los datos tabulados

son de utilidad cuando hay que mostrar un gran número de variables.

55. En una distribución de frecuencias, un área bajo la curva delimitada por los valores limitantes

es proporcional al porcentaje de los datos de la muestra situados entre dichos límites.

56. Las medias de muestras repetidas a partir de una población tienden a quedar distribuidas nor-

malmente, aun cuando no lo sea la población de la que han sido tomadas. Este fenómeno se

describe mediante el teorema fundamental del límite.

57. El error estándar de la media describe la dispersión de las medias de las muestras alrededor de

la media de la población, del mismo modo que la desviación estándar describe la dispersión

de los valores de la muestra alrededor de la media de la muestra.

58. En una muestra aleatoria en la búsqueda de un suceso o rasgo dicotómico es improbable

(pero no imposible) muestrear una proporción de dicho rasgo que sea muy diferente al de

la población tomada puramente por azar. Las distribuciones binomiales cuantifican dicha

verosimilitud.

59. Hay una distribución binomial diferente para cada combinación de tamaño de muestra (n)

y probabilidad base (p).

60. Un histograma es una representación gráfica de una distribución de frecuencias dada, en

la que se dibujan rectángulos (columnas) cuyas bases representan un intervalo dado. Las

áreas de los rectángulos son proporcionales al número de valores de frecuencia dentro del

intervalo abarcado. En los histogramas, se pierde con frecuencia la información sobre los

extremos de las distribuciones debido al empleo de los intervalos «menor que» y «mayor

que» en los extremos.

61. Un polígono de frecuencias es un gráfico formado al juntar con líneas rectas los puntos medios

del extremo superior de las columnas del histograma. Un polígono de frecuencias reduce los

cambios bruscos que pueden producirse en los trazos del histograma, y ayuda a demostrar la

continuidad.

62. Un diagrama de barras es una representación gráfica de datos discretos en el que se represen-

tan categorías o clasificaciones diferentes sobre un eje y el recuento de frecuencias se represen-

ta sobre el otro. Igual que en los histogramas, el área de la barra es proporcional al recuento.

63. Un diagrama «de tallo y hojas» es, esencialmente, un histograma rotado en su lado: los valores

del «tallo» representan los intervalos, y las «hojas» representan el recuento de frecuencias en

el intervalo. En este diagrama, el tronco representa los dígitos de la mano izquierda de los

datos numéricos, mientras que las hojas son el último dígito a la derecha del tronco. La fre-

cuencia, o número de hojas, de cada valor del tronco se da en una columna distinta.

64. Un diagrama de caja (box-plot) es una representación visual de datos, con un cuadro de

tamaño arbitrario construido alrededor de la mediana del valor, representado por una línea ver-

tical media, con otras dos divisiones verticales que representan el primer cuartil (es decir, el

percentil 25) y el tercer cuartil (es decir, el percentil 75).

LOS 1OO SECRETOS PRINCIPALES 7

Page 13: Epidemiología y bioestadística secretos   nordness1ed

65. Un diagrama «en pastel» es un diagrama circular dividido en segmentos, cada uno de los cuales

representa la frecuencia de una categoría. El total de porciones del pastel suma el 100%.

66. Un gráfico lineal es un método útil para mostrar datos durante un período de tiempo. Clásica-

mente, en el eje y (ordenadas) se representa el índice de incidencia de algún tipo, y el tiempo

durante el que se traza la incidencia se representa sobre el eje x (abscisas).

67. Una hipótesis nula típica afirma que no se detectan diferencias en el resultado entre dos grupos

con exposiciones diferentes. La aceptación de la hipótesis nula significa que, en el estudio, no

se encontró una diferencia estadísticamente significativa.

68. Un error de tipo I consiste en afirmar que existe una diferencia cuando, de hecho, ésta no exis-

te. Se comete este error al rechazar la hipótesis nula cuando ésta es verdadera. El símbolo α

(alfa) indica la probabilidad de cometer un error de tipo I. Un error de tipo II consiste en afirmar

que no existe diferencia cuando, de hecho, sí existe diferencia. Se comete este error al aceptar

la hipótesis nula cuando ésta es falsa. El símbolo β (beta) indica la probabilidad de cometer un

error de tipo II.

69. Hay que saber que un efecto pequeño en un estudio con un gran tamaño de la muestra puede

tener el mismo valor de p que un efecto grande en un estudio con un tamaño pequeño de

muestra.

70. Un resultado con significación estadística no debe llevar automáticamente a una conclusión de

importancia clínica.

71. El valor de un estudio es la probabilidad de no aceptar una hipótesis nula falsa, y es igual a

1 – β. Los estudios con bajo poder estadístico pueden estar justificados, probablemente,

en dos contextos: cuando se investiga una enfermedad infrecuente y cuando se llevan a cabo

estudios piloto sobre nuevos fármacos o tratamientos.

72. La probabilidad cuantifica la verosimilitud de que se produzca un suceso A en estudios ilimita-

dos. La ecuación estándar para estimar la probabilidad es P (suceso) = A/N, donde N es el

número de estudios ensayados en los que podría ocurrir A.

73. La posibilidad (odds) de que tenga lugar un suceso es el cociente entre la probabilidad de que

tenga lugar el suceso y la probabilidad de que no tenga lugar dicho suceso; se expresa por la

siguiente fórmula:

Posibilidad = probabilidad de un suceso/(1 – probabilidad del suceso)

74. La regla aditiva afirma que P(A o B) = P(A) + (P(B) – P(A y B). Si A y B son mutuamente exclu-

yentes, esta ecuación se reduce a P(A o B) = P(A) + P(B).

75. La regla multiplicativa de sucesos independientes afirma que P(A y B) = P(A) � P(B)

Si los dos sucesos no son independientes, puede emplearse una forma especial de regla multi-

plicativa:

P(A y B) = (P(A | B) P(B) = P(B | A) P(A).

76. El muestreo permite al investigador hacer inferencias sobre la población diana utilizando sólo

una porción de la población, conocida como muestra. Una buena muestra debe ser representa-

LOS 1OO SECRETOS PRINCIPALES8

Page 14: Epidemiología y bioestadística secretos   nordness1ed

tiva de las características de la población diana. La aleatorización es una herramienta empleada

para aumentar la probabilidad de que la muestra represente verdaderamente a la población

general de la que procede.

77. La estimación del tamaño de la muestra se lleva a cabo antes de realizar un estudio, para valo-

rar la factibilidad y las restricciones posibles en caso de que éste se lleve a cabo.

78. El valor predictivo depende mucho de la prevalencia de la afección en la población estudiada. Un

valor predictivo positivo en una prueba es, casi siempre, muy bajo cuando la prevalencia es baja.

79. Hay que saber siempre que la prueba patrón de referencia tiene también sus imperfecciones.

80. Se emplea el valor kappa de Cohen para proporcionar un valor cuantitativo (de –1 a 1) en rela-

ción con el grado de acuerdo entre los clasificadores individuales sobre un desenlace o prueba

particular, teniendo en consideración el posible acuerdo debido al azar.

81. El rendimiento de una prueba puede alterarse según dónde se fija el punto de corte positivo.

Una curva ROC (receiver operating charasteristic) ilustra los efectos de esta variabilidad sobre

la sensibilidad y la especificidad.

82. Una prueba paralela proporciona un resultado sensible, pero inespecífico; una prueba seriada

proporciona un resultado específico, pero no sensible.

83. Se debe emplear la prueba de la t para comparar la media de una muestra con la media pobla-

cional en dos muestras independientes, o las de la misma muestra en dos momentos diferen-

tes (con frecuencia, antes y después de un tratamiento), cuando no se conoce la desviación

estándar de la población.

84. La distribución t y la distribución normal se comparan como sigue:■ La distribución t y la distribución normal son similares en tres aspectos: ambas son simétri-

cas alrededor de 0, ambas tienen forma de campana y ambas tienen un solo pico.■ La distribución t difiere de la distribución normal en que la distribución t tiene una cola más

grande que la distribución normal, aunque a medida que aumentan los grados de libertad, la

distribución en la cola se aproxima a los de una distribución normal.■ En las muestras mayores de 30 efectivos, la distribución t es casi idéntica a la distribución

normal (distribución z).

85. Un intervalo de confianza determinado muestra la probabilidad de que el verdadero valor de la

media se encuentre en el intervalo especificado.

86. Antes de analizar sus datos, hágase las siguientes preguntas:■ ¿Son sus datos continuos, discretos o categóricos?■ ¿Son los datos pareados?■ ¿Se supone que cualquiera de los datos sigue una distribución normal?

Las respuestas determinarán, en gran medida, qué pruebas o métodos estadísticos pueden

aplicarse.

87. Si no puede o no desea realizar suposiciones de normalidad, emplee un planteamiento no

paramétrico. Se deben considerar los métodos no paramétricos cuando el tamaño de la mues-

tra es pequeño.

LOS 1OO SECRETOS PRINCIPALES 9

Page 15: Epidemiología y bioestadística secretos   nordness1ed

88. Un diagrama de dispersión debe ser la primera etapa en el análisis de los datos pareados biva-

riantes, continuos o discretos. El coeficiente de correlación de Pearson es un procedimiento

paramétrico que expresa, en términos cuantitativos, la asociación implicada por un diagrama

de dispersión de dos variables. En cuanto a los datos no paramétricos, debe emplearse la

correlación de rangos de Spearman.

89. La regresión lineal simple es un método de modelado para determinar la ecuación lineal de

«mejor ajuste» formada entre dos conjuntos de datos pareados continuos. La variable indepen-

diente x, y la variable dependiente y forman una línea con una pendiente m y un valor b en la

intersección con el eje y:

y = mx + b

Puede predecirse un valor de y para un valor dado de x con exactitud variable, dependiendo de

la bondad del ajuste del modelo.

90. El concepto estadístico «ji al cuadrado» es una prueba no paramétrica de recuento bivariante o

datos de frecuencia. Examina la disparidad entre las frecuencias de recuentos reales y las fre-

cuencias de recuentos esperados, cuando la hipótesis nula es cierta. Para un determinado

número de grados de libertad, se calcula un valor de p, que indica la probabilidad de obtener el

valor de la ji al cuadrado observado sólo por azar. Cuanto mayor sea el valor de ji al cuadrado,

menos probable es que el azar sea la causa de la distribución.

91. En el análisis de regresión típico, la variable dependiente ha de ser continua. A menos que se

empleen técnicas especiales, la variable dependiente también debe tener una distribución nor-

mal y una variabilidad que se mantenga igual para todos los valores de la variable independiente.

92. El coeficiente de correlación (R2) describe la bondad del ajuste del modelo de regresión como

la proporción de la variación en la variable dependiente (es decir, variación explicada/variación

total, que va de 0 a 1) que explica el modelo. Cuanto más próximo esté R2 a 1, mejor explica el

modelo la variación.

93. Un coeficiente logit (p. ej., expb) puede interpretarse como una posibilidad relativa (odds ratio)

que indica la cantidad relativa por la que cambia la posibilidad relativa global cuando aumenta

en una unidad el valor de la variable independiente x.

94. Se emplea el estadístico F en el análisis de la variación entre grupos (ANOVA), y tiene dos gra-

dos de libertad: uno para la varianza entre grupos, y otro para la varianza dentro del mismo

grupo. Si el cociente F es mucho mayor que 1, se rechaza la hipótesis nula.

95. El modelo de riesgos proporcionales de Cox es una forma de modelo de regresión multivarian-

te empleado para analizar las curvas de supervivencia (p. ej., Kaplan-Meier) y también estudios

clínicos con un desenlace dicotómico en el tiempo (p. ej., muerto o vivo; con enfermedad o sin

enfermedad).

96. El análisis de supervivencia es un método estadístico para estudiar el tiempo entre el ingreso

en un estudio y un suceso posterior. Un tiempo de observación desigual por medio de la cen-

sura de los sujetos en estudio hace que el análisis de supervivencia sea singular. El análisis de

supervivencia es útil para realizar predicciones sobre una población, comparar el efecto del tra-

tamiento entre dos grupos, e investigar la importancia de características específicas sobre la

supervivencia.

LOS 1OO SECRETOS PRINCIPALES10

Page 16: Epidemiología y bioestadística secretos   nordness1ed

97. Una función de supervivencia, matemáticamente definida como S(t) = P(T > t), describe la pro-

porción de sujetos que sobreviven hasta un tiempo dado t o más.

98. La tasa de fracasos condicional, o función de riesgo, proporciona el potencial instantáneo de

fracasar en el tiempo t por unidad de tiempo, dada la supervivencia hasta el tiempo t.

99. El análisis de las tablas de vida divide el período total de observación de un grupo en intervalos

fijos, proporcionando una indicación de la distribución de los fracasos en el tiempo.

100. El método de Kaplan-Meier permite la estimación de la función de supervivencia directamente a

partir de los tiempos continuos de supervivencia o fracaso. Es la base del cálculo de la propor-

ción de supervivientes en un momento concreto en el tiempo de que se produzca un fracaso o

suceso, en lugar de intervalos fijos, y genera una curva de supervivencia característica de «pel-

daños de escalera».

LOS 1OO SECRETOS PRINCIPALES 11

Page 17: Epidemiología y bioestadística secretos   nordness1ed

13

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICAJohn L. Kane, MD

1. ¿Dónde se puede encontrar la referencia más temprana del pensamiento

epidemiológico?

Hipócrates escribió un tratado titulado Sobre los aires, aguas y lugares, aproximadamente,

400 años antes de Jesucristo. En él subrayaba su conocimiento no sólo de los síntomas de los

pacientes sino también de su relación con la estación del año y las condiciones de vida, alimen-

tación, ingesta de líquidos y hábitos de ejercicio físico de los mismos:

Si se conocen bien estas cosas, o al menos la mayor parte de ellas, no se puede dejar de conocer,

cuando se llega a una ciudad extraña, las enfermedades peculiares de dicho lugar, o la naturaleza

particular de las enfermedades comunes, de modo que no tendrá duda en cuanto al tratamiento

de las enfermedades, ni cometerá errores, como probablemente ocurriría en el caso de que pre-

viamente no hubiese considerado estos asuntos. Y en particular, a medida que avanza la estación

y el año, puede decir qué enfermedades epidémicas atacarán la ciudad, ya sea en verano o en

invierno, y qué individuo se encontrará en peligro de experimentar por el cambio de régimen.

Hippocrates: En Airs, Waters, and Places, Parts 1 and 2. Adams F (trans). 400 BC, Disponible en

www.classics.mit.edu/Hippocrates/airwatpl.html.

2. ¿Quién describió las heridas como «ventanas del cuerpo»?

Galeno, el gran médico y anatomista del segundo siglo después de Jesucristo, pasó sus pri -

meros años médicos trabajando como cirujano de los gladiadores en Pérgamo. Empleó hasta

20 escribas para que escribieran todo lo que él dijo en esta ocupación. Galeno diseccionó innu-

merables animales en su prolífica investigación médica. Estudió también filosofía, y afirmó que

el objetivo de obtener provecho o lucro era incompatible con una devoción importante a la

medicina, afirmando que los doctores deben aprender a desdeñar el dinero. Fue defensor de la

teoría de los miasmas en relación con la infección, que especialmente responsabilizaba de la

infección a las nubes de gases venenosos.

Galen. Disponible en http://www.med.virginia.edu/hs-library/historical/antiqua/galen.htm.

3. ¿Cuáles son los distintos tipos de peste?■ Pulmonar: manifestada por distrés respiratorio, hemorragia pulmonar y asociada con una tasa de

mortalidad del 100%; se transmite fácilmente por el aire mediante las secreciones respiratorias.■ Septicémica: manifestada con frecuencia por muerte súbita, sin advertencia previa, después

de invadir de forma preferente el torrente circulatorio.■ Bubónica: manifestada por adenopatías a gran escala, con hemorragia cutánea; fallecen,

aproximadamente, el 60% de las víctimas.

4. ¿Cuántas pandemias de peste han habido?

Han habido tres:■ La primera pandemia duró desde el 541 al 544 de nuestra era, y comenzó en Pelusium,

Egipto, antes de diseminarse por todo el Oriente Medio y la cuenca Mediterránea. No se dis-

CA

PÍT

ULO

1

I. EPIDEMIOLOGÍA

Page 18: Epidemiología y bioestadística secretos   nordness1ed

pone de datos estadísticos exactos de los fallecimientos causados por esta pandemia. Se la

denomina Peste de Justiniano porque el emperador Justiniano sucumbió a la enfermedad.■ La segunda pandemia, que diezmó Europa y fue denominada la Muerte Negra, probable-

mente comenzó en Sicilia, en 1347, y duró hasta 1351. Probablemente, esta peste llegó a

Sicilia procedente de Oriente, diseminándose por las rutas marítimas de comercio.■ La tercera pandemia comenzó en 1855 en la provincia china de Yunnan, y se extendió hasta

el resto del mundo, pero devastó especialmente India y China. Sólo en la India fallecieron

12,5 millones de personas.

Perry RD, Fetherston JD: Yersinia pestis—Etiologic agent of plague. Clin Microbiol Rev 10(1):

35–66, 1997.

5. ¿Cuántas personas fallecieron por la Muerte Negra?

No se dispone de una cifra exacta, pero los cálculos varían entre 17 y 28 millones de muertes

o, aproximadamente, un tercio de la población europea, desde 1330 a 1351.

6. ¿Se encuentran en la literatura buenas descripciones de la peste bubónica?

Hay muchas. Dos de especial relevancia son El Decamerón, de Boccacio, y A Journal of the

Plague Year, de Daniel Defoe (famoso por ser el autor de Moll Flanders y Robinson Crusoe).

El Decamerón fue escrito entre 1349 y 1351, y describe cómo siete doncellas y tres jóvenes

florentinos se evaden de los estragos de la enfermedad. Su autor sobrevivió a la peste de Flo-

rencia del año 1347.

El libro de Defoe describe la peste de Londres en el año 1665, inmediatamente antes del

gran incendio de la ciudad. Defoe describió la enfermedad como sigue:

El dolor de la hinchazón era particularmente muy violento, y para algunos, intolerable; se

puede afirmar que los médicos y cirujanos han torturado a muchas pobres criaturas, incluso

hasta la muerte. Las hinchazones en algunos eran excrecencias duras, y aplicaban de modo

violento vendajes de yeso o cataplasmas para romperlas; y si no lo conseguían, las cortaban

y escarificaban de un modo terrible: en algunos enfermos, algunas hinchazones se endu-

recían, en parte por la fuerza del malestar y en parte por aplicar los vendajes de modo muy

violento, y eran tan duras que no había instrumento que las pudiera cortar, y luego las que-

maban con cáusticos, de modo que muchos fallecían enloquecidos por el tormento; y algu-

nos en la misma operación… Si se podía encontrar una cabeza en estas hinchazones y rom-

perla o hacer que gotease, o como los cirujanos lo llamaban, digerirlas, el paciente

generalmente se recuperaba.

Defoe D: A Journal of the Plague Year. 1722. Oxford, Oxford University Press, 1990, pp 81–82.

Boccacio G: The Decameron of Giovanni Boccacio. Rigg JM (trans), c 1350. Disponible en

http://www.brown.edu/Departments/Italian_Studies/dweb/dweb.shtml.

7. ¿Cuáles eran las suposiciones predominantes sobre la causa de la peste?

La Facultad de Medicina de París echó la culpa a la alineación de Saturno, Júpiter y Marte que

se produjo en marzo de 1345. Otros, responsabilizaron a los cometas, y otros, a las estrellas.

Algunos atribuyeron la peste al terremoto de 1348, diciendo que éste había liberado gases con-

taminantes de las profundidades. Algunos dieron la culpa a los miasmas. Y algunos observa-

ron que las ciudades fueron golpeadas más violentamente y postularon varias posibilidades de

contagios. El Dr. Joseph Browne declaraba en su Treatise on the Plague que el contagio se

extiende por «aire, personas enfermas, bienes transportados desde lugares infectados…,

alimentos y enfermedades que son las causas de otras enfermedades».

Sin embargo, la peste fue vista especialmente como una maldición de Dios, y muchos inten-

taron identificar el pecado colectivo por el que estaban siendo castigados. Lamentablemente,

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA14

Page 19: Epidemiología y bioestadística secretos   nordness1ed

gran parte de la población culpabilizó a los judíos, pensando que estaban envenenando expre-

samente el suelo o el agua, o quizá traían el castigo de Dios sencillamente por existir. En 1349,

en Estrasburgo, Francia, 2.000 judíos fueron quemados vivos, y en Maguncia, Alemania, 6.000

fueron incinerados. Hubo más de 350 masacres de judíos registradas en estos años.

Browne J: A Practical Treatise of the Plague. 1720. Disponible en http://whqlibdoc.who.int/rare-

books/a56989.pdf.

8. ¿Cuál es la verdadera causa de la peste?

La infección por Yersinia pestis. El bacilo infecta las ratas, lo que causa la muerte de las mis-

mas. Las pulgas que se alimentan de la sangre de las ratas ingieren las bacterias. Cuando

muere el huésped, las pulgas saltan al huésped disponible más próximo y lo infectan, con fre-

cuencia un huésped humano. Las condiciones en la Edad Media, con una gran población de

ratas, leña y casas con techumbre de paja, que permitían a las ratas una fácil entrada, y el haci-

namiento general, llevaron a una fácil diseminación de la enfermedad. En 1894, durante la ter-

cera pandemia, dos investigadores descubrieron la bacteria de modo independiente, Shibasa-

buro Kitasato y Alexander Yersin, quienes la denominaron Pasteurella pestis y la asociaron con

la rata negra. En 1897, Paul Louis Simond y Masanoro Gata (también de modo independiente)

descubrieron el papel de la pulga en la transmisión.

Perry RD, Fetherston JD: Yersinia pestis—Etiologic Agent of Plague. Clin Microbiol Rev, 10(1):35–66, 1997.

9. ¿Qué medidas se adoptaron para detener la diseminación de la peste?

La principal medida fue el aislamiento. Tan pronto como se descubría la peste en una casa, se

sellaba ésta y no se permitía a persona alguna que entrara en ella ni que la abandonara. Se

apostaron vigilantes para impedir que los ocupantes se aventuraran a salir, lo que con frecuen-

cia dio lugar a la muerte de sus habitantes. Otras medidas fueron quemar incienso, tañer las

campanas de las iglesias o disparar cañones, bañarse en orina humana, colocar «vapores

hediondos» (animales muertos) en el hogar, emplear sanguijuelas y otros métodos de producir

sangría, beber el exudado de un bubón, beber oro líquido, y el movimiento de los flagelantes.

10. ¿Quiénes eran los flagelantes?

Eran un grupo de hombres religiosos entregados que iban de ciudad en ciudad en Europa, en

procesiones solitarias que duraban 33 días y un tercio. Durante sus procesiones se reunían

en las plazas de las ciudades; se flagelaban y flagelaban también a otras personas de su grupo

con correas de cuero con puntas de piezas metálicas con la esperanza de purgarse a sí mismos

y a las personas de las ciudades de su pecado colectivo y culpa, apartando así la ira de Dios,

que había descendido en la forma de peste. La gente asistía a los encuentros con mucha devo-

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA 15

PUNTOS CLAVE: FECHAS IMPORTANTES

1. 400 años antes de Jesucristo: Hipócrates publicó Sobre los aires, aguas y lugares, donde

presentaba los principios epidemiológicos de la observación y del registro de los hábitos

de los pacientes, su alimentación y ambientes, para la predicción de los patrones de la enfermedad.

2. 1747: James Lind realizó un estudio aleatorio y controlado para establecer la causa del escorbuto.

3. 1946: se establecieron los Centers for Disease Control (CDC) a partir de la Office of Malaria Control

in War Areas.

4. 1977: se diagnosticó el último caso natural de viruela en un paciente somalí.

Page 20: Epidemiología y bioestadística secretos   nordness1ed

ción, y con frecuencia dichos encuentros conducían a la persecución de los judíos locales. El

Papa aprobó inicialmente el movimiento, pero rápidamente éste cayó en la desaprobación

papal; el movimiento se extinguió en 1350.

11. ¿Quién fue John Graunt?

Un ciudadano londinense autodidacta quien, aproximadamente en 1620, observó el caudal de

información potencialmente importante disponible en los Weekly Bills of Mortality de Londres.

Graunt comenzó a recoger y tabular datos. En 1662 publicó las Natural and Political Observa-

tions, que se basaban en su examen de los Bills of Mortality. Fue la primera utilización y publi-

cación de un registro de estadísticas vitales.

12. ¿Cuáles fueron algunos de los hallazgos de Graunt?

Graunt observó que no podía mantenerse un recuento verdadero de muertes por la peste sin

un cálculo meticuloso de las muertes por las numerosas enfermedades distintas del día.

Observó que un tercio de los niños nacidos vivos fallecía antes de los 5 años, que dos perso-

nas de cada nueve fallecían por una enfermedad aguda, y que 70 de cada 229 fallecían de

enfermedad crónica. Observó también que el 7% de la población fallecía a una edad avanzada,

y que sólo 1 de cada 4.000 fallecían de hambre en Londres.

Además, Graunt realizó observaciones y sugerencias sobre el empleo de mendigos, la mora-

lidad del suicidio y si el hecho de manipular o fabricar oro beneficiaría a la población.

Graunt J: Natural and Political Observations Mentioned in a following Index, and made upon the Bills of

Mortality. 1622. Disponible en http://www.ac.wwu.edu/~stephan/Graunt/bills.html.

13. ¿Quién fue conocido como el Hipócrates inglés?

Thomas Sydenham (1624-1689) es quien lleva este epíteto. Fue un médico inglés que revivió la

práctica de Hipócrates al enfatizar la observación clínica minuciosa. Sydenham pensaba que el

estudio de la medicina debía llevarse a cabo a la cabecera del paciente. Está considerado como

uno de los padres de la epidemiología, y aportó tratados sobre la gota, la malaria, la escarlati-

na, el sarampión, la histeria y el trastorno nervioso postestreptocócico que lleva su nombre, la

corea de Sydenham. Se le cita por decir que: «La llegada de un buen payaso ejerce una influen-

cia más beneficiosa sobre la salud de una ciudad que veinte asnos cargados de medicinas».

Thomas Sydenham. Available at http://www.whonamedit.com.

14. ¿Qué se describe en la obra De morbis artificum diatriba?

Escrito por Ramazzini y publicado en 1700, es el primer trabajo extenso sobre las enfermeda-

des laborales. Describe los peligros sobre la salud observados en trabajadores de 52 ocupacio-

nes, como albañiles, granjeros, enfermeras y soldados. Ramazzini comenta las dificultades a

las que se enfrentan los «hombres cultos» por causa de sus mentes agobiadas, así como la

necesidad de limpieza en las parteras, y los peligros de contraer la infección sifilítica.

Bernardino Ramazzini. Disponible en http://www.whonamedit.com.

15. ¿Qué es el escorbuto?

El escorbuto es la hipovitaminosis C que produce el deterioro del colágeno y lleva, entre otras

manifestaciones, a la ausencia de colágeno en las paredes de los capilares, lo cual provoca

hemorragias en las células de todo el organismo. El paciente se debilita, y presenta artralgias

secundarias a hemorragias subperiósticas. En la piel, aparecen manchas elevadas de color rojo

alrededor de los folículos pilosos de piernas, nalgas, brazos y espalda. Las encías sangran, y el

tejido gingival se vuelve débil y esponjoso. La dentina, que está debajo del esmalte y es parte

de la raíz de los dientes, se desestructura. Los dientes se aflojan, y el comer se vuelve difícil

y doloroso.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA16

Page 21: Epidemiología y bioestadística secretos   nordness1ed

16. ¿Cómo describió el escorbuto un observador no médico?

Richard Walter, capellán de la Royal Navy, durante un viaje en 1740 describió los síntomas,

que incluían una piel negra como la tinta, úlceras, dificultad respiratoria, ensanchamiento de

las extremidades, caída de los dientes y, quizá el más repugnante de todos, una extraña plétora

de tejido gomoso que brotaba fuera de la boca, que inmediatamente se pudría y daba al aliento

de la víctima un olor abominable.

Lamb J: Captain Cook and the Scourge of Scurvy. 2002. Disponible en http://www.bbc.co.uk/history/

discovery/exploration/captaincook_scurvy_01.shtml.

17. ¿Por qué se convirtió el escorbuto en un problema únicamente en las grandes

expediciones?

La deficiencia vitamínica precisa de 2 a 6 meses para manifestarse, y los síntomas pueden

mejorar con el consumo de vitamina C, que los marineros devoraban vorazmente cuando toca-

ban puerto. Vasco de Gama perdió a dos tercios de su tripulación por la enfermedad en su viaje

a la India en 1499, y Magallanes perdió a más del 80% mientras realizaba la travesía del océano

Pacífico.

18. ¿Por qué los vikingos no se veían afectados por el escorbuto en sus largos

viajes?

Los vikingos comían una especie de frambuesa y una planta llamada Skjørbuksurt (es decir,

cocleria o Cochleria officinalis), y ambas son fuentes ricas en vitamina C.

19. ¿Cuál es uno de los primeros estudios clínicos aleatorios del que se tiene

constancia?

En 1747, James Lind, médico escocés de la Royal Navy, seleccionó a 12 pacientes con es -

corbuto y los alimentó con regímenes distintos. Dos de ellos recibieron sidra, dos recibieron

elixir de vitriolo, dos recibieron vinagre, dos recibieron agua marina, dos recibieron limones

y naranjas, y dos recibieron purgantes. Uno de los pacientes que recibieron el cítrico estuvo

listo para el trabajo a los 6 días y el otro se hallaba lo suficientemente bien como para cuidar

a los restantes pacientes. Los únicos pacientes restantes que mostraron mejoría fueron los

que bebieron sidra, pero la mejoría fue sólo ligera. A pesar de este éxito, tuvieron que pasar

50 años antes de que el Almirantazgo Británico dispusiera de cítricos en todos sus

barcos.

Lind J: A Treatise of the Scurvy in Three Parts. Containing an inquiry into the Nature, Causes and Cure of

that Disease, together with a Critical and Chronological View of what has been published on the subject.

London, A. Millar, 1753. Disponible en http://www.people.virginia.edu/~rjh9u/scurvy.html.

20. ¿Qué es el cólico de Devonshire?

En la intoxicación por plomo. Desde 1762 hasta 1767, casi 300 casos de la enfermedad fueron

ingresados en los hospitales de Exeter. George Baker, médico inglés, observó que los síntomas

eran similares a los que presentaban los pintores con saturnismo. Descubrió que la sidra de

Devonshire contenía plomo, y que los lagares de sidra del lugar, a diferencia de los lagares del

resto del país, se hallaban recubiertos de láminas de plomo.

21. ¿Cuáles fueron las consecuencias médicas de la viruela en el siglo XVIII?

Se calcula que hubo unas 400.000 muertes como consecuencia de la infección de la viruela en

todo el mundo, y que un tercio de los que sobrevivieron quedaron ciegos debido a la infección

de la córnea. Además, los supervivientes quedaron con cicatrices muy profundas o marcas de

viruela. Se llegó a determinar que los pacientes quedaban inmunizados una vez que habían

contraído la viruela y sobrevivían a ella.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA 17

Page 22: Epidemiología y bioestadística secretos   nordness1ed

22. ¿Cómo se empleó el conocimiento de la inmunidad permanente a la viruela

después de haber padecido la infección, con el fin de prevenir la enfermedad?

Se empleó mediante un método denominado variolación. Se administraba a las personas sanas

material procedente de las lesiones de pacientes con viruela. Lamentablemente, este método

produjo muertes por viruela e infectó a otros pacientes.

23. ¿Qué relación guardan las lecheras con el desarrollo de una vacuna frente

a la viruela?

En 1768, Edward Jenner escuchó a una lechera decir: «No puedo contraer la viruela porque ya

he pasado la vacuna». Observó que las lecheras que habían padecido una infección leve de

vacuna eran, efectivamente, inmunes frente a los brotes de viruela.

24. ¿Qué hizo Jenner con esta información?

Para probar su hipótesis, Jenner tomó el exudado de una pústula de vacuna de la mano de una

lechera, Sarah Nelmes, y la inyectó en la piel de James Phipps, un niño de 8 años (Fig. 1-1).

Seis semanas después, Jenner administró material de una pústula fresca de viruela al joven

James, y el niño no contrajo la enfermedad.

25. En relación con la viruela, ¿quién podría decirse que fue la persona más

desgraciada del planeta?

El último caso de enfermedad de viruela de producción natural se dio en un hombre somalí en

1977. La Organización Mundial de la Salud declaró oficialmente erradicada la viruela en 1980.

Es interesante señalar que los experimentos de Jenner fueron guiados enteramente por la

observación. La teoría predominante de la enfermedad seguía siendo el concepto miasmático,

que sostenía que la enfermedad se transmitía por un miasma, o nube, que se mantenía baja,

pegada al suelo. Jenner no tenía conocimiento alguno de la existencia de virus ni de bacterias.

Gordis L: Epidemiology, 2nd ed. Philadelphia, W.B. Saunders, 2000, pp 9–11.

26. ¿Qué tipo peculiar de cáncer asoció sir Percival Potts con la ocupación

de deshollinador, hacia 1775?

Sir Percival Potts fue un cirujano inglés que identificó una elevada tasa de cáncer de escroto en

los deshollinadores. Potts describe el cáncer del siguiente modo:

Es una enfermedad que siempre hace su primer ataque y su primera aparición en la parte

inferior del escroto, en donde produce una herida superficial, dolorosa, irregular, de mal

aspecto, con unos bordes duros y elevados: en el oficio se la conoce como verruga por

hollín. Nunca lo he visto antes de la pubertad, lo que, supongo, es una razón por la que se

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA18

PUNTOS CLAVE: GENTE IMPORTANTE

1. John Graunt: comenzó la recogida y análisis de los Weekly Bills of Mortality de Londres

en el siglo XVII, y demostró la utilidad de un sistema de vigilancia de la enfermedad.

2. Edward Jenner: desarrolló y probó una inmunización frente a la viruela.

3. P.C.A. Louis: denominado «el padre de la epidemiología clínica moderna», fue responsable

del estudio básico de la inefectividad de la sangría.

4. Ignác Semmelweis: redujo de modo espectacular la tasa de fiebre puerperal al instaurar el lavado

de manos.

Page 23: Epidemiología y bioestadística secretos   nordness1ed

toma generalmente, tanto por el paciente como por el cirujano, como una enfermedad vené-

rea, y al tratarse con mercuriales resulta pronto muy exasperante.

Potes especuló con la posibilidad de que el hollín recogido en los pliegues del escroto

fuese el agente causal, y se convirtió por ello en un identificador precoz del riesgo de cáncer

ocupacional.

Percival PS: Chirurgical Observations Relative to the Polypus of the Nose, the Cancer of the Scrotum, the

Different Kinds of Ruptures, and the Mortification of the Toes and Feet. London, Hawes, Clarke, & Collins,

1775.

27. ¿Por qué disminuyeron de modo significativo las tasas de cáncer escrotal en

los deshollinadores daneses después de este hallazgo, mientras que las tasas

en Inglaterra permanecieron sin cambios?

El gobierno de Dinamarca comenzó a requerir a sus trabajadores que vistiesen una indumenta-

ria protectora, y que se bañaran de modo regular. Los británicos continuaron bañándose sólo

una vez a la semana durante muchos años después del informe de Pott.

28. ¿Cuál es la relación entre la elaboración del vino y la teoría de los gérmenes?

Durante su estudio sobre la fermentación del vino, Louis Pasteur, químico y bacteriólogo

francés, demostró que el proceso estaba causado por microorganismos del ambiente, que eran

transmitidos al líquido por medio de partículas de polvo, y no por generación espontánea en el

propio vino. Los experimentos de Pasteur llegaron a refutar finalmente la teoría de que la vida

podía surgir espontáneamente en materiales orgánicos, teoría que había sido dogma científico

durante más de 200 años.

Louis Pasteur, Embassy of France in Canada. Disponible en http://www.ambafrance-ca.org.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA 19

Figura 1-1. Dibujo de Robert A. Thom de la primera vacunación, efectuadapor Edward Jenner el 14 de mayo de 1796, en su apartamento de ChantryHouse, Berkeley, Gloucestershire. (De Great Moments in Medicine. Parke-Davis & Company, 1966. Cortesía de Parke-Davis Company.)

Page 24: Epidemiología y bioestadística secretos   nordness1ed

29. ¿De qué modo hizo avanzar Robert Koch la teoría de los gérmenes?

Estableció los postulados que llevan su nombre, que son los siguientes:■ El agente causal ha de estar presente en cada caso de enfermedad, y no ha de estar presente

en animales sanos.■ El patógeno ha de ser aislado del animal huésped enfermo, y ha de crecer en un cultivo puro.■ Debe producirse la misma enfermedad cuando se inoculan los microbios a partir del cultivo

puro en animales sanos susceptibles.■ El mismo patógeno ha de ser recuperado, una vez más, a partir de este animal artificialmen-

te infectado, y ha de ser capaz de crecer en un cultivo puro.

Wubah DA: The Germ Theory of Disease. Disponible en http://www.towson.edu/~wubah/medmicro/

Germ_theory.htm.

30. ¿Quién está considerado como el «padre de la epidemiología clínica

moderna»? ¿Por qué?

P.C.A. Louis (1787-1872), que diseñó y llevó a cabo un experimento para valorar si la sangría

para afecciones inflamatorias confería algún beneficio médico. Louis vivía en tiempos en los

que las autoridades médicas cimeras, como François Joseph Broussais, en París, considera-

ban la inflamación como la causa de todas las enfermedades. J.J. Jackson, otro médico promi-

nente, escribió en 1836 que «si algo puede ser considerado como asentado en el tratamiento

de las enfermedades es que la sangría es de utilidad en la clase de enfermedades denominadas

inflamatorias; y especialmente en las inflamaciones de las vísceras torácicas». Francia importó

42 millones de sanguijuelas en 1833.

Morabia A: P. C. A. Louis and the birth of clinical epidemiology. J Clin Epidemiol 49 (12):1327–1333, 1996.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA20

PUNTOS CLAVE: LUGARES IMPORTANTES

1. Broad Street, Londres: lugar de la importante investigación de John Snow sobre el cólera.

2. Cuba (1898): Walter Reed llevó a cabo una importante investigación sobre la fiebre amarilla.

3. Tuskegee, Alabama: lugar donde se realizó el famoso «Tuskegee Study of Untreated Syphilis

in the Negro Male».

4. Framingham, Massachusetts: lugar del Framingham Heart Study.

31. ¿Cómo llevó a cabo Louis el estudio?

Efectuó un estudio de casos y controles. Seleccionó a 77 pacientes que habían ingresado en

el hospital con neumonía, y realizó una revisión de sus historias clínicas. Después de controlar

otros factores de confusión, como edad, sexo y gravedad de la enfermedad, comparó el efecto

de una sangría temprana (días 1-4) con una sangría tardía (día 5 hasta la recuperación o el

fallecimiento) sobre la duración y desenlace de la neumonía. Todos los pacientes se hallaban

en perfecto estado de salud antes del comienzo de la enfermedad.

32. ¿Cuáles fueron los resultados?

La enfermedad tuvo una duración de 17,7 días en el grupo de la sangría temprana, y de 20,3 días

en el grupo de la sangría tardía. El riesgo de muerte fue del 44% en el grupo temprano y del 25%

en el último grupo. Louis describió este fenómeno como «un resultado sorprendente y, aparente-

mente, absurdo». Globalmente llegó a la conclusión de que el efecto de la sangría fue «muy infe-

Page 25: Epidemiología y bioestadística secretos   nordness1ed

rior de lo que se había creído comúnmente». Durante los 15 años siguientes, la importación de

sanguijuelas disminuyó a unos pocos miles por año.

Hadjiliadis D: Early clinical statistics. Disponible en http://www.med.unc.edu/wrkunits/syllabus/yr4/gen/

medhist/publish/earlyclinstats.ppt.

Morabia A: P. C. A. Louis and the birth of clinical epidemiology. J Clin Epidemiol 49 (12):1327–1333, 1996.

33. ¿Qué sociedad se formó con la misión de «recoger, preservar y difundir la

información estadística en los diferentes departamentos del saber humano»?

La American Statistical Society, que se creó en Boston, en 1839, por William Cogswell,

Richard Fletcher, John Dix Fisher, Oliver Peabody y Lemuel Shattuck. En 1840, se cambió su

nombre por el de American Statistical Association. Uno de sus primeros miembros fue Flo-

rence Nightingale.

The American Statistical Association en http://www.amstat.org/about/index.cfm?fuseaction=history

34. ¿Cuál fue el origen de los National Institutes of Health?

En 1887 se estableció una instalación de una sola habitación en el Marine Hospital de Staten

Island, Nueva York, llamado Laboratory of Hygiene. El Dr. Joseph Kinyoun fue el director y único

empleado de esta primera instalación de investigación del gobierno. Posteriormente, fue rebau-

tizado con el nombre de Hygienic Laboratory, con nueva base en Washington DC. En 1930, tras

la aprobación de la Ley Randsell, se adoptó el nombre de National Institutes of Health (NIH).

Los NIH crecieron en alcance y tamaño, y fueron trasladados a Bethesda, Maryland, en 1938.

35. ¿Dónde se localiza Broad Street?

Se localiza en la ciudad de Londres, donde esta calle alcanzó fama en 1885 por su bomba de

agua contaminada por el cólera.

36. ¿Quién fue el anestesista que administró cloroformo a la reina Victoria

durante el nacimiento de sus hijos? ¿Qué relación guarda este hecho

con Broad Street?

John Snow se hallaba muy interesado en la epidemiología del cólera. Las muertes por cólera

en Londres en el siglo XIX eran elevadas, y Snow creía que la causa del cólera era una especie

de veneno que las personas infectadas eliminaban por las heces y por el vómito, y que los

pacientes sanos contraían la enfermedad al ingerir agua que había sido contaminada con el

vómito o las heces de los pacientes con cólera.

El Registrar General (jefe de registros) William Farr no estaba de acuerdo con la teoría de

Snow. Farr se adhería a la teoría miasmática de la enfermedad, que sostenía que una nube de

infección se mantenía pegada próxima al suelo y diseminaba la enfermedad. Teóricamente, una

persona podría escapar a la infección al desplazarse a mayor altitud. Farr tabuló los datos

estadísticos y mostró que los pacientes que vivían a mayor altitud tenían menos riesgo de con-

traer el cólera.

Snow observó el agrupamiento de muertes en el área geográfica suministrada por la bomba

de Broad Street, que era abastecida por la Southwark and Vauxhall Company, mientras que la

Lambeth Company suministraba el agua a otras partes de la ciudad. Ambas compañías extraían

el agua del río Támesis, pero la captación de la Southwark Company se realizaba en una

parte muy contaminada del río, mientras que la Lambeth Company había cambiado reciente-

mente su captación aguas arriba, a una parte del río menos contaminada. Snow investigó el

abastecimiento de agua de las víctimas del cólera y pudo demostrar que la tasa de mortalidad

por cólera era casi 10 veces superior en las casas que recibían el agua de la Southwark Com-

pany (Fig. 1-2).

Gordis L: Epidemiology, 2nd ed. Philadelphia, W. B. Saunders, 2000, pp 10–11.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA 21

Page 26: Epidemiología y bioestadística secretos   nordness1ed

37. ¿Qué es la fiebre puerperal?

Es una forma agresiva y muy virulenta de infección que se produce después del parto. Costó la

vida de Jane Seymour, la tercera mujer de Enrique VIII, así como de Mary Wollstonecraft, la

madre de Mary Shelley. Se dice que en el siglo XVIII se cobró la vida de hasta el 20% de las

madres primerizas.

38. ¿Qué relación guarda el lavado de las manos con la fiebre?

Ignac Semmelweis (1813-1865) observó que un simple lavado de las manos antes de explorar

a las parturientas podía eliminar prácticamente la enfermedad. Trabajaba en una clínica de

maternidad, y observó que la tasa de mortalidad era superior en las mujeres que daban a luz en

el hospital que en las que daban a luz en su hogar de camino al hospital. Observó también que

las mujeres que daban a luz de forma prematura tenían una menor frecuencia de la enferme-

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA22

Figura 1-2. Mapa que señala los fallecimientos por cólera en Londres.(De http://www.nationalgeographic.com/resources/ngo/education/ideas912/912choleraho1.html, con autorización.)

metros

Muertes por cólera

2000

Page 27: Epidemiología y bioestadística secretos   nordness1ed

dad. Observó que, en ocasiones, las mujeres ingresadas en una fila completa de camas morían

de fiebre puerperal.

Las futuras madres imploraban que no fueran ingresadas en el primer departamento de la

clínica de maternidad, donde realizaban sus prácticas los estudiantes y los doctores. Las

pacientes deseaban ser ingresadas en el segundo departamento, donde sólo las parteras lleva-

ban a cabo los partos. Semmelweis estudió el registro cuidadosamente y confirmó que las

tasas de mortalidad en el primer departamento eran, con frecuencia, 12 veces superiores a las

registradas en el segundo departamento. Se aseguró de que todos los partos en el primero y

segundo departamentos se realizaban en la posición lateral con el fin de estandarizar su entor-

no. Esta estrategia no afectó a la tasa de mortalidad.

39. ¿Cómo desentrañó Semmelweis el acertijo de la fiebre puerperal?

Un profesor se cortó con un cuchillo en una autopsia y, posteriormente, tuvo una infección

generalizada que acabaría con su vida. Semmelweis observó que la enfermedad guardaba una

estrecha relación con la enfermedad que había afligido a tantas pacientes de la clínica de

maternidad. Las autopsias de las mujeres y de sus recién nacidos confirmaron que la enferme-

dad era, efectivamente, la misma que afectó al profesor.

Se animaba a los estudiantes de medicina de esta escuela a que realizaran estudios anatómi-

cos con cadáveres, y no se llevaba a cabo la práctica del lavado de las manos entre las disec-

ciones y la exploración y el parto de las mujeres que iban a dar a luz. En mayo de 1847 se intro-

dujo el lavado de las manos con cloro, lo que redujo el número de muertes maternas a un nivel

por debajo del observado en el segundo departamento.

Caplan, CE: The Childbed Fever Mystery and the Meaning of Medical Journalism. Disponible en

http://www.med.mcgill.ca/mjm/issues/v01n01/fever.html.

40. ¿Qué es la fiebre amarilla?

Una fiebre hemorrágica vírica causada por el virus de la fiebre amarilla, que se transmite a los

seres humanos a partir de la picadura del mosquito Aedes aegypti infectado. El hígado, el

corazón, los riñones y el tejido linfático se ven atacados, y la piel se vuelve ictérica, de aquí la

denominación de «amarilla».

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA 23

PUNTOS CLAVE: ENFERMEDADES IMPORTANTES

1. Peste: produjo la muerte de un tercio de la población de Europa en la Edad Media.

2. Escorbuto: el azote de los marineros, limitó la distancia que podían recorrer los barcos navegando

sin escalas.

3. Viruela: causó, aproximadamente, 400.000 muertes en el siglo XVIII, y dejó ciegos al 33%

de los supervivientes.

4. Sida: la peste moderna; el sida acabó con la revolución sexual.

41. ¿Qué guerra actuó como estímulo para resolver el enigma de la fiebre amarilla?

Durante la guerra entre España y Estados Unidos de 1898, en Cuba se produjo una epidemia de

fiebre amarilla al inicio de la contienda. El U.S. Surgeon General (cirujano general) envió un

equipo de investigadores liderados por el científico médico Walter Reed. Se probaron muchas

ideas en el terreno, incluida la teoría, que contaba con más de 50 años, propuesta por el

Dr. Carlos Finlay, de que la fiebre amarilla podía diseminarse por insectos. Reed dividió a varios

Page 28: Epidemiología y bioestadística secretos   nordness1ed

voluntarios en dos grupos. Los del primer grupo dormían sobre las ropas contaminadas y

ropas de cama de los pacientes afectados de fiebre amarilla, pero se les protegía con redes

contra los mosquitos; los del segundo grupo dormían sobre ropa limpia, pero sin protección

frente a los mosquitos. Los pacientes protegidos por las redes no contrajeron la fiebre amarilla,

mientras que los otros sí la contrajeron. Este descubrimiento llevó al empleo generalizado de

una protección frente a los mosquitos en forma de redes y, posteriormente, a una reducción

drástica en la incidencia de fiebre amarilla.

Marton, T: Yellow Fever and Dr. Walter Reed, 1999. Disponible en http://www.mcatmaster.com/

medicine&war/yellowfever.htm.

42. ¿Qué otra denominación recibe la fiebre entérica?

Fiebre tifoidea, enfermedad que sólo se observa en humanos, y causa fiebre de hasta 40 ºC,

malestar, molestias abdominales, erupción de manchas de color rosado, esplenomegalia y leu-

copenia. Las complicaciones más graves son la hemorragia y la perforación intestinales. Está

causada por la bacteria Salmonella typhi, y se transmite a otras personas por medio de la ruta

fecal-oral.

43. ¿Qué relación tiene la Clergy Orphans School de St. John Wood con la fiebre

tifoidea?

En 1856 se produjo en dicho lugar un brote de fiebre tifoidea que afectó a muchos de los

estudiantes jóvenes. Una carta remitida a Lancet describía el brote. El primer alumno enfermó

el 14 de septiembre; dicho alumno fue seguido por otros cuatro casos en las 3 semanas

siguientes, y después por 19 casos en un período de 36 horas. El paciente padecía fiebre,

astenia, diarrea y erupción papular. Debido al comienzo simultáneo en este grupo, el autor

creyó que el brote no podía atribuirse a contagio: «El comienzo simultáneo del brote es sufi-

ciente para desechar la idea del contagio. Es evidente que alguna causa local desempeñaba

algún papel».

44. ¿Qué respuesta generó esta carta?

William Budd respondió mediante una carta bien razonada, demostrando claramente que los

síntomas descritos eran compatibles con fiebre tifoidea. Budd expuso la teoría de que la dia-

rrea de los pacientes infectados contenía un veneno concentrado que, al ser ingerido por una

persona sana, le causaría la enfermedad. Postuló que la diarrea se había filtrado a través del

suelo al pozo vecino, y, en último término, publicó en marzo de 1873 el artículo Fiebre tifoidea,

su naturaleza, modo de diseminación y prevención.

Budd W: Typhoid Fever, its Nature, Mode of Spreading and Prevention. 1873, Appendix. Disponible en

http://www.deltaomega.org/typhoid.pdf.

45. ¿Quién fue Mary Mallon?

Mary Mallon nació en Irlanda, en 1869, y emigró a América en 1884, a la edad de 15 años.

Encontró un empleo como cocinera en la ciudad de Nueva York. En calidad de cocinera infectó

a 47 personas con fiebre tifoidea, de las que tres fallecieron. Llegó a ser famosa con el sobre-

nombre de «Mary la tifosa». En el verano de 1906, el banquero Charles Henry Warren llevó a

su familia de vacaciones a Long Island, y llevó a Mary como cocinera. De los 11 residentes de

la casa, 6 enfermaron de fiebre tifoidea. El propietario de la casa requirió los servicios del inge-

niero civil George Soper para que investigase el origen de la fiebre tifoidea, temiendo que

pudiera tener el origen en su casa. Soper siguió la huella hasta la Mallon y encontró también

que, en los siete empleos que había tenido desde 1900, se habían producido 22 casos de fiebre

tifoidea y una muerte. Mallon fue la primera paciente que era portadora de la enfermedad sin

sufrir ella misma la enfermedad.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA24

Page 29: Epidemiología y bioestadística secretos   nordness1ed

46. ¿Cómo respondió Mary Mallon a las noticias sobre su estado de portadora?

Cuando Soper se acercó a ella para solicitarle muestras de sangre, orina y heces, Mary cogió

un cuchillo de cocina y fue tras él. Más tarde, Soper volvió con refuerzos, policía incluida.

Mallon salió a su encuentro con un gran tenedor y arremetió contra ellos; en estado de confu-

sión, corrió al interior de la casa. Después de una búsqueda de 5 horas, la encontraron final-

mente oculta en un armario.

47. ¿Qué hizo con Mary el Departamento de Salud?

Después de confirmar que era portadora, fue llevada a una pequeña casa aislada en la North

Brother Island, cerca del Bronx.

48. ¿Cuándo se le permitió volver de nuevo a la ciudad de Nueva York?

En 1910, cuando tomó posesión de su cargo un nuevo inspector de salud pública, Mary fue

liberada a condición de que prometiera no intentar conseguir empleo que requiriese cocinar.

También tenía que acudir de modo regular al departamento de salud para que se le hicieran

nuevos análisis.

49. ¿Quién fue Mary Brown?

Fue una cocinera empleada en el Sloane Maternity Hospital de Manhattan, donde, en enero de

1915, un brote de fiebre tifoidea afectó a 25 personas, de las que dos fallecieron. Su verdadero

nombre era Mary Mallon. Vivió el resto de su vida en la North Brother Island en una casita ais-

lada; en 1932 padeció un ictus, y falleció en 1938.

Rosenberg J: Typhoid Mary. Disponible en http://history1900s.about.com/library/weekly/aa062900a.htm.

50. ¿Qué es lo que causa la pelagra?

Una deficiencia en niacina. La pelagra es una enfermedad con síntomas cutáneos promi -

nentes, que puede ser confundida con la lepra. Otros síntomas incluyen demencia y diarrea.

El pensamiento prevalente a comienzo del siglo XX era que la pelagra era transmitida por

bacterias.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA 25

PUNTOS CLAVE: CÓMO GANAR UNA APUESTA EN UN BARFRECUENTADO POR EPIDEMIÓLOGOS

1. Nombre de María «la Tifoidea»: Mary Mallon.

2. Cólico de Devonshire: intoxicación por plomo contraída por beber sidra elaborada en Devonshire,

donde los lagares estaban recubiertos por láminas de plomo.

3. Verruga por hollín: nombre del cáncer escrotal, habitual en los deshollinadores de Londres

en el siglo XVIII.

4. Gaetan Dugas: nombre de un auxiliar de vuelo de una línea aérea canadiense. Se consideró

falsamente que fue el caso inicial de sida en Estados Unidos.

51. ¿Por qué no se mostraba de acuerdo Joseph Goldberg con la teoría

de los gérmenes en relación con la pelagra?

Observó que sólo los internos contraían la enfermedad en los asilos y orfanatos del Sur.

Una fuente infecciosa afectaría también al personal de plantilla, y nunca se produjo este patrón.

Page 30: Epidemiología y bioestadística secretos   nordness1ed

Propuso la teoría, que en último término consiguió demostrar, de que la causa era una alimen-tación deficiente. Dr. Joseph Goldberg and the War on Pellagra. Disponible en http://history.nih.gov/exhibits/goldberger/docs/pellegra_5.htm.

52. ¿En qué consiste el estudio de Tuskegee?

El Public Health Service, junto con el Tuskegee Institute, comenzó en 1932 un estudio enMacon County, Alabama, denominado «The Tuskegee Study of Untreated Syphilis in the NegroMale». Se informó a los varones que estaban siendo tratados frente a una enfermedad denomi-nada «mala sangre». Se incluyeron 600 pacientes, 399 con sífilis y 201 sin la enfermedad. El estudio duró 40 años, a pesar de que originalmente se había diseñado para que tuviera unaduración de 6 meses. En 1947, se sabía ya que la penicilina curaba la sífilis, pero no se ofreciódicho tratamiento a los hombres incluidos en el estudio, y no existen datos que confirmen quelos participantes fueran informados de que podían abandonar el estudio en caso de desearlo. El New York Times desveló la historia en 1972.The Tuskegee Syphilis Study: A Hard Lesson Learned. Disponible en http://www.cdc.gov/nchstp/od/tuskegee/time.htm.

53. ¿Cuándo se establecieron los Centers for Disease Control and Prevention

(CDC)?

La Office of Malaria Control in War Areas se hallaba ya en funcionamiento durante la SegundaGuerra Mundial, y tenía la misión de controlar la malaria en el sudeste de Estados Unidos. En1946 se estableció el Center for Communicable Diseases (CDC) como sucesor de esta oficina.Después de que la malaria quedase eliminada en Estados Unidos, el CDC expandió en granmedida su papel en la salud pública, y se cambió el nombre a Centers for Disease Control en1970. La frase «and Prevention» fue añadida al nombre en 1992.Malaria, CDC Origins. Disponible en http://www.cdc.gov.

54. ¿Por qué la población de Natick, Massachusetts, es casi famosa en la historia

de la epidemiología?

Es la ciudad más próxima a Framingham, donde se inició el estudio Framingham en 1948, con elfin de estudiar los factores de riesgo de cardiopatía. Éste fue un estudio observacional a largoplazo que, inicialmente, implicó a 5.127 personas, de edades comprendidas entre 30 y 62 años,que no mostraban signos de cardiopatía. Se evaluó a los participantes con cuestionarios y unaexploración física cada 2 años durante 30 años. Muchos de los conceptos básicos de nuestroconocimiento actual de la arteriopatía coronaria proceden de este estudio.Framingham Heart Study. Disponible en http://www.clinicaltrials.gov/show/NCT00005121.

55. ¿Cuándo se observó por primera vez la relación entre el consumo

de cigarrillos y el cáncer de pulmón?

En 1950, dos investigadores presentaron datos que mostraban una conexión entre fumar ciga-rrillos y el cáncer de pulmón. El primero se llamaba Ernst Wynder, que se mostró interesado enla conexión después de haber sido testigo de la autopsia de un fumador y observar el tintenegro de los pulmones. Entrevistó a pacientes con cáncer de pulmón y a pacientes con otrostipos de cáncer, y observó una incidencia muy superior de cáncer de pulmón en los fumadores.El otro investigador (Richard Doll) era un científico británico que entrevistó a numerosos médi-cos sobre sus hábitos de fumar, y después observó en quiénes se desarrollaba el cáncer depulmón. También él demostró la conexión.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA26

Page 31: Epidemiología y bioestadística secretos   nordness1ed

Does smoking really cause lung cancer? Dr. George Johnson, On Science. Disponible enhttp://www.txtwriter.com/Onscience/Articles/smokingcancer.html.

56. ¿Qué fue el Informe Lalonde?

Fue un informe realizado en 1974, titulado A New Perspective on the Health of Canadians. Elinforme era innovador porque quitaba prácticamente toda la importancia de las intervencionesbiomédicas en el bienestar individual de las personas e identificaba, en su lugar, cuatro áreasque eran responsables principalmente de la salud del paciente: ambiente, biología humana,estilo de vida y organización de la atención sanitaria.Lalonde M: A New Perspective on the Health of Canadians, a working document. 1974. Disponible enhttp://www.hc-sc.gc.ca/hppb/phdd/pdf/perspective.pdf.

57. ¿De qué producto era el lema «absorbe incluso la preocupación»?

Los tampones Rely. En 1980, se notificaron a los CDC 55 casos de una nueva enfermedad querecibió la denominación de síndrome del shock tóxico. Los síntomas consistían en fiebre eleva-da, erupción similar a quemaduras por el sol, descamación, hipotensión y lesión multiorgánicageneralizada. Las mujeres supusieron 52 de los 55 casos totales, y los estudios de casos ycontroles indicaron una elevada asociación con el empleo de tampones. Estudios posterioresdescubrieron un mayor riesgo en las que habían utilizado los tampones Rely, que era untampón con una absorbencia particularmente elevada.Centers for Disease Control: Historical Perspectives Reduced Incidence of Menstrual Toxic-ShockSyndrome—United States 1980–1990. MMWR 39(25):421–423, 1990.

58. ¿Cuándo trascendió a la atención pública el síndrome de inmunodeficiencia

adquirida (sida)?

El Morbidity and Mortality Weekly Report (MMWR) publicó un artículo denominado Pneu-mocystis Pneumonia-Los Angeles el 5 de junio de 1981, en el que describía cinco casos deinfecciones oportunistas, como neumonía por Pneumocystis y candidiasis. Aunque sigue sien-do desconocido el papel de la infección por CMV en la patogenia de la neumonía por P. carinii,debe considerarse seriamente la posibilidad de infección por P. carinii en el diagnóstico dife-rencial en varones homosexuales previamente sanos, con disnea y neumonía.Centers for Disease Control: Pneumocystic pneumonia—Los Angeles. MMWR 37(12):81, 1981.

59. ¿Quién fue el primer paciente que introdujo el sida en Estados Unidos?

Esta cuestión no tiene una respuesta conocida. Se creyó, por error, que el «paciente cero»,Gaetan Dugas, era el paciente índice. Fue identificado por los CDC como «paciente cero» enun estudio epidemiológico inicial, en el que 40 de 228 pacientes diagnosticados de sida en abril de 1992 habían tenido relaciones sexuales con este auxiliar de vuelo de una líneaaérea canadiense. Sin embargo, hubo numerosos casos de sida en Estados Unidos antesde Dugas.Gaetan Dugas. The Free Dictionary. Disponible en www.encyclopedia.thefreedictionary.com.

60. ¿Cuál es el virus del Cañón Muerto?

Este virus es más conocido en la actualidad como virus sin nombre y el agente etiológico delsíndrome pulmonar por hantavirus. La enfermedad despertó a la atención pública cuando unhombre joven y sano de la tribu de los indios navajo que vivía en el suroeste de Estados Unidoscomenzó con disnea y falleció rápidamente. Su novia había muerto 2 días antes. Los investiga-dores documentaron otros numerosos casos, y los laboratorios de los CDC pudieron identificarcon precisión un tipo de hantavirus hasta entonces desconocido.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA 27

Page 32: Epidemiología y bioestadística secretos   nordness1ed

Se sabía que los hantavirus eran transportados a los seres humanos desde los roedores, ylos análisis demostraron que el principal huésped era el ratón ciervo. La diseminación se pro-ducía a partir de las heces secas aerosolizadas de los roedores, inhaladas por el huéspedhumano. Se cree que la razón del brote de 1993 fue una explosión demográfica de la poblaciónde roedores que llegó a alcanzar unos valores 10 veces superior a sus cifras habituales. El áreahabía sufrido una intensa sequía durante muchos años, y luego, en 1993, unas lluvias adecua-das dieron nueva vida a las plantas del área, y las ratas dispusieron de un abundante aporte dealimentos.Tracking a Mystery Disease: The Detailed Story of Hantavirus Pulmonary Syndrome. Disponible enhttp://www.cdc.gov.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA28

PÁGINAS WEB

1. http://www.classics.mit.edu/Hippocrates/airwatpl.htm

2. http://www.med.virginia.edu/hs-library/historical/antiqua/galen.htm

3. http://www.brown.edu/Departments/Italian-Studies/dweb//dweb.shtml

4. http://www.whqlibdoc.who.int/rare-books/a56989.pdf

5. http://www.ac.wwu.edu/~stephan/Graunt/b.Us.html

6. http://www.whonamedit.com

7. http://www.bbc.co.uk/history/discovery/exploration/captaincook_scurvy-01.shtml

8. http://www.people.virginia.edu/~rjh9u/scurvy.html

9. http://www.ambafrance-ca.org

10. http://www.towson.edu/~wubah/medmicro/Germ_theory.htm

11. http://www.med.unc.edu/wrkunits/syllabus/yr4/gen/medhist/publish/earlyclinstats.ppt

12. http://www.med.mcgill.ca/mjm/issues/v01n01/fever.html

13. http://www.mcatmaster.com/medicine&war/yellowfever.htm

14. http://www.deltaomega.org/typhoid.pdf

15. http://www.history1900s.about.com/library/weekly/aa062900a.htm

16. http://www.history.nih.gov./exhibits/goldberger/docs/pellagra_5.htm

17. http://www.cdc.gov/nchstp/od/tuskegee/time.htm

18. http://www.cdc.gov

19. http://www.clinicaltrials.gov/show/NCT00005121

20. http://www.txtwriter.com/Onscience/Articles/smokingcancer.html

21. http://www.hc-sc.gc.ca/hppb/phdd/pdf/perpective.pdf

22. http://www.encyclopedia.thefreedictionary.com

23. http://www.amstat.org/about/index.cfm?fuseaction=history

Page 33: Epidemiología y bioestadística secretos   nordness1ed

BIBLIOGRAFÍA

1. Centers for Disease Control: Historical perspectives reduced incidence of menstrual toxic-shock syndrome—United States 1980-1990. MMWR 39(25):421–433, 1990.

2. Centers for Disease Control: Pneumocystic pneumonia—Los Angeles. MMWR 37(12):81, 1981.3. Defoe D: A Journal of the Plague Year [1722]. Oxford, Oxford University Press, 1990, pp 81–82.4. Gordis L: Epidemiology, 2nd ed. Philadelphia, W.B. Saunders, 2000, pp 9-11.5. Morabia A: P. C. A. Louis and

the birth of clinical epidemiology. J Clin Epidemiol 49(12):1327–1333, 1996.5. Percival PS: Chirurgical Observations Relative to the Polypus of the Nose, the Cancer of the Scrotum, the

Different Kinds of Ruptures, and the Mortification of the Toes and Feet. London, Hawes, Clarke, & Collins,1775.

6. Perry RD, Fetherston JD: Yersinia pestis—Etiologic agent of plague. Clin Microbiol Rev 10(1):35–66, 1997.

EPIDEMIOLOGÍA: UNA PERSPECTIVA HISTÓRICA 29

Page 34: Epidemiología y bioestadística secretos   nordness1ed

31

CAPÍ

TULO

2INTRODUCCIÓN A LOS PRINCIPIOS EPIDEMIOLÓGICOSPatrick R. Laraby, MD, MBA, MPH

1. ¿Qué es la epidemiología?

La epidemiología es el estudio de la distribución y de los determinantes de la enfermedad enlas poblaciones humanas. Es la ciencia básica y práctica fundamental de la salud pública.

2. ¿De dónde deriva la palabra epidemiología?

La palabra epidemiología procede de epidemia, que, traducida del griego, significa «sobre elpueblo».

3. ¿Qué hacen los epidemiólogos?

Los epidemiólogos estudian la frecuencia de las enfermedades en las poblaciones, con el fin deidentificar los factores de riesgo de la enfermedad (y de la salud) para, en último término,mejorar la salud de la población.

4. ¿Qué es la salud?

De acuerdo con la Organización Mundial de la Salud (OMS), la salud es un estado de bienestarfísico, mental y social completo, y no meramente la ausencia de enfermedad.

5. ¿Qué es la medicina preventiva?

La aplicación por los profesionales clínicos de las medidas preventivas para mantener la salud.

6. ¿Qué es la salud pública?

La aplicación de los principios de la medicina preventiva a una población.

7. Describa los niveles de prevención.

■ Prevención primaria: la prevención de la enfermedad o lesión.■ Prevención secundaria: la detección precoz y el tratamiento temprano de la enfermedad.■ Prevención terciaria: la reducción de la discapacidad, y la promoción de la rehabilitación por

la enfermedad.

8. ¿Cuáles son los niveles de Leavell?

Hugh Leavell desarrolló un paradigma sencillo para la salud preventiva, que se correlacionacon el estadio de la enfermedad, el nivel de prevención y la respuesta apropiada por los profe-sionales sanitarios. Los niveles son los siguientes:1. Preenfermedad

a. Sin factores de riesgo conocidos: la prevención primaria debe ser la promoción de lasalud (p. ej., alentar unos cambios saludables en el estilo de vida, la nutrición y elambiente).

b. Con susceptibilidad a la enfermedad: la prevención primaria debe incluir una protecciónespecífica (p. ej., recomendaciones en relación con suplementos nutricionales, inmuni-zaciones y seguridad en el trabajo y con los vehículos de motor).

Page 35: Epidemiología y bioestadística secretos   nordness1ed

INTRODUCCIÓN A LOS PRINCIPIOS EPIDEMIOLÓGICOS32

2. Enfermedad latente: la prevención secundaria debe centrarse en el cribado en el caso depoblaciones, o en la detección de casos cuando se trata de individuos, en la atención médi-ca y, si se detecta la enfermedad, ofrecer el tratamiento correspondiente.

3. Enfermedad sintomáticaa. Atención inicial: la prevención terciaria debe centrarse en la limitación de la discapacidad

(es decir, en el tratamiento médico o quirúrgico para limitar el daño producido por laenfermedad con medidas de prevención primaria).

b. Atención posterior: la prevención terciaria debe centrarse en la rehabilitación (es decir,en la enseñanza de métodos para reducir la discapacidad social).

Leavell HR, Cark EG: Preventive Medicine for the Doctor in His Community, 3rd ed. New York, McGraw-Hill,1965.

9. Explique los objetivos de los programas de cribado.

Los programas de cribado son una estrategia de prevención secundaria para identificar enfer-medades antes de que éstas desarrollen ya síntomas, así como instaurar un nuevo programade tratamiento para reducir la morbilidad, la mortalidad o ambas.

10. ¿Cuáles son las suposiciones básicas o fundamentales de la epidemiología?

■ La enfermedad humana no se produce al azar.■ La enfermedad humana tiene factores causales y factores preventivos que pueden identifi-

carse mediante una investigación sistemática de las diferentes poblaciones o subgrupospoblacionales en diversos lugares y momentos.

Hennekens CH: Epidemiology in Medicine. Boston, Little, Brown & Company, 1987.

11. ¿Quién fue John Snow?

Los epidemiólogos modernos consideran que John Snow fue, posiblemente, el mayor inno-vador en su campo. Detalló los hechos sobre las fuentes del agua potable, que relacionó con las tasas de mortalidad por cólera en Londres entre 1853 y 1854. Su trabajo consiguióestablecer la demostración clásica del modo de transmisión del cólera mucho antes de que seidentificase el agente causal: Vibrio cholerae.

12. Explique la utilidad de la epidemiología.

La utilidad más importante de la epidemiología es mejorar nuestro conocimiento de la salud yde la enfermedad. El epidemiólogo Jeremy Morris definió cinco usos de la epidemiología:1.• Estudio histórico: determinar si la salud de la comunidad mejora o empeora.2.• Valoración de la comunidad: definir los problemas de salud reales y potenciales.3.• Trabajo con los servicios sanitarios: mejorar la eficacia, efectividad y eficiencia.4.• Riesgo y azar individual: determinar el riesgo real y las valoraciones de los riesgos sobre la

salud, en relación con los individuos y las poblaciones (p. ej., ¿cuál es el riesgo de que unin dividuo fallezca antes de su próximo cumpleaños?).

5.• Completar el cuadro clínico: ofrecer diferentes presentaciones de una enfermedad.Morris JN: Uses of Epidemiology, 3rd ed. Edinburgh, Churchill-Livingstone, 1975.

13. Ilustre la secuencia epidemiológica.

Una secuencia ordenada de hechos caracteriza la epidemiología. El mejor modo de explicarla escon un ejemplo, como el de la asociación entre el cáncer de pulmón y el consumo de cigarrillos:1.• Observación: la observación científica sobre el tabaquismo y el cáncer aparecía en un

número reducido de publicaciones bien conocidas alrededor de los años 1920-1930.2.• Contar los casos o sucesos: las tendencias en las estadísticas vitales mostraban un aumen-

to en las muertes causadas por el cáncer de pulmón en Estados Unidos.

Page 36: Epidemiología y bioestadística secretos   nordness1ed

3. Relacionar los casos o sucesos con la población en riesgo: se notificaban mayores tasasde mortalidad por cáncer de pulmón en las estadísticas vitales nacionales en países en losque el tabaquismo estaba establecido como un estilo de vida característico.

4.• Hacer comparaciones: los estudios sobre los médicos británicos en los años 1950-1960proporcionaron las comparaciones definitivas entre el hábito de fumar y el cáncer de pulmón.

5. Desarrollar una hipótesis: dado que el humo de cigarrillo contiene más de 2.500 compo-nentes químicos, algunos de ellos carcinógenos en animales, sólo era preciso un pequeñopaso lógico para avanzar de la inferencia a la hipótesis.

6. Comprobar la hipótesis: los estudios epidemiológicos mostraban una relación sólida entrela incidencia actual de cáncer de pulmón y una historia previa de tabaquismo, con relaciónentre la dosis y la respuesta.

7. Realizar inferencias científicas: las observaciones llevaron a inferencias científicas váli-das sobre la asociación entre el consumo de tabaco y el cáncer de pulmón. Éstas com-prenden: 1) observaciones clínicas; 2) tendencias nacionales en la mortalidad en paísescon una elevada prevalencia de consumo de cigarrillos; 3) comparaciones epidemioló-gicas en grandes grupos representativos de diferentes segmentos de la población nacio-nal en más de un país, y 4) efectos biológicos del humo del tabaco. Todas estas observa-ciones llevaron a la inferencia de que fumar aumentaba el riesgo de fallecer por cáncer de pulmón.

8. Realizar estudios experimentales: los estudios de laboratorio con animales mostraron quela exposición al humo del tabaco produce lesiones precancerosas, seguidas de carcinomaepidermoide, tanto en los animales como en los seres humanos.

9. Intervención y evaluación: la acción realizada por algunos organismos responsables de lasalud pública redujo las tasas de consumo de cigarrillos. A esta reducción le siguió un decli-nar en las tendencias de mortalidad por causas relacionadas con el tabaquismo.

Doll R, Hill AB: The mortality of doctors in relation to their smoking habits: A preliminary report.Br Med J 1:1451-1455, 1954.

14. ¿Qué significa el término epidemiología descriptiva?

La epidemiología descriptiva se ocupa de la descripción de las características generales de ladistribución de la enfermedad, sobre todo de la relación con la persona, el lugar y el tiempo.Los datos descriptivos proporcionan una información valiosa, lo que permite al personal sani-tario y a los administradores la asignación de recursos de modo eficiente y la planificación deprogramas efectivos de prevención y educación.

15. Liste los tipos de estudios epidemiológicos descriptivos.

■ Estudios ecológicos (es decir, estudios de correlación): se emplean datos de poblacionescompletas para comparar frecuencias de enfermedades entre grupos diferentes durante unmismo período de tiempo, o en una misma población en diferentes momentos. Estos estu-dios son útiles para la formulación de una hipótesis, pero no pueden emplearse para probaruna hipótesis, debido a la limitación de su diseño. También, y dado que los estudios decorrelación se refieren a poblaciones completas y no a individuos, no es posible asociar lasexposiciones con la presencia de enfermedad en una misma persona. Ésta es una limitaciónimportante de los estudios ecológicos.

■ Casos clínicos y series de casos: son el tipo más básico de los estudios descriptivos enindividuos. Constan de una identificación detallada y descripción de un único individuo (enlos casos clínicos) o de un grupo de sujetos (en las series de casos). No se consideran ver-daderas investigaciones epidemiológicas.

■ Estudios transversales: es la investigación en la que se valora el estado de un individuo conrespecto a la presencia o ausencia tanto de exposición como de enfermedad en un momen-

INTRODUCCIÓN A LOS PRINCIPIOS EPIDEMIOLÓGICOS 33

Page 37: Epidemiología y bioestadística secretos   nordness1ed

INTRODUCCIÓN A LOS PRINCIPIOS EPIDEMIOLÓGICOS34

to concreto y determinado. Dado que la exposición y la enfermedad se valoran en estemismo momento, los estudios transversales no siempre pueden indicar si la exposiciónprecedió al desarrollo de la enfermedad o viceversa.

16. Un estudio poblacional muestra que, en algunas partes de Irlanda, los distritos

católicos tienen una tasa de suicidio significativamente mayor que

los distritos protestantes. ¿Qué tipo de estudio descriptivo es éste?

¿Qué puede determinarse desde un punto de vista epidemiológico?

Éste es un ejemplo de estudio ecológico o, en otras palabras, un estudio de correlación pobla-cional. Es el más débil de todos los estudios epidemiológicos. Dado que los estudios ecológi-cos comparan grupos en vez de individuos, se requiere una gran precaución para extraer con-clusiones e identificar asociaciones. El riesgo inherente a la interpretación de estudios de estetipo se denomina falacia ecológica.

17. Explique la falacia ecológica.

Es un error en la inferencia que se produce cuando se supone que existe a nivel individual unaasociación observada en la población. Por ejemplo, el elevado número de suicidios en los dis-tritos católicos puede estar causado por los protestantes que viven en tales distritos y cometensuicidio. A pesar de ello, los estudios ecológicos pueden ser útiles de algún modo, porque sonrápidos y fáciles, emplean datos ya existentes, y pueden ayudar a formular hipótesis sobre lasque pueden realizarse investigaciones futuras.

18. ¿Qué es la epidemiología analítica?

La epidemiología analítica es el proceso de probar una hipótesis sobre una exposición poten-cial y un desenlace de interés. Se lleva a cabo un estudio para examinar la relación entre laexposición a un factor de riesgo y el desenlace, clásicamente una enfermedad.

19. Liste los tipos de estudios analíticos.

Observacional y experimental.

20. Liste los tipos de estudios observacionales.

Los estudios de casos y controles y los estudios de cohortes. También puede estar incluido oanidado un estudio de casos y controles en un estudio de cohortes particular, y en este caso sedenomina estudio de casos y controles anidados (nested).

21. ¿Qué son los estudios experimentales?

Los estudios experimentales son estudios clínicos que se observan bajo condiciones predeter-minadas. En un estudio experimental, los sujetos quedan distribuidos en grupos, que se some-ten a exposiciones diferentes (clásicamente, distintas pautas de tratamiento) controladas porun investigador. Para evitar la introducción de sesgos, los grupos deben ser lo más similaresposible en todas sus características, a excepción de la exposición. La aleatorización, o asigna-ción aleatoria, es la técnica empleada para reducir al mínimo el sesgo.

22. ¿Qué es un estudio de casos y controles?

Es un estudio epidemiológico en el que se compara la exposición entre los casos (es decir,individuos con enfermedad) y los controles (es decir, individuos sin enfermedad). Un estu-dio de casos y controles implica un grupo de personas con enfermedad y un grupo de «em -parejamiento», que son similares en todos los aspectos a excepción de la enfermedad. Selleva a cabo una evaluación retrospectiva para determinar quién estuvo expuesto y quién no lo estuvo.

Page 38: Epidemiología y bioestadística secretos   nordness1ed

INTRODUCCIÓN A LOS PRINCIPIOS EPIDEMIOLÓGICOS 35

23. ¿Qué es un estudio de cohortes?

Es un estudio en el que se sigue en el tiempo a un grupo expuesto y a otro grupo no expuesto,para determinar en cuál de ellos se desarrolla la enfermedad de interés. Un estudio de cohor-tes proporciona la evaluación más directa de los patrones de salud y enfermedad en unapoblación.

24. ¿Cuáles son las ventajas y las desventajas de los distintos tipos de estudios

epidemiológicos principales?

Véase la Tabla 2-1.

25. Liste y explique los aspectos epidemiológicos principales que se deben

considerar en un estudio epidemiológico.

■ Precisión: reducción en el error aleatorio, indicado por la varianza de una determinación y elintervalo de confianza asociado.

■ Validez: reducción del error sistemático o sesgo sistemático, indicado al comparar qué esti-ma el estudio y qué pretendía estimar.

■ Sesgo de selección: cualquier sesgo introducido debido al modo como fueron selecciona-dos los participantes.

■ Sesgo de información: sesgo relacionado con los instrumentos y las técnicas empleadospara recoger la información sobre la exposición, desenlaces o resultados de salud, y otrosfactores.

■ Sesgo de confusión: causado por no tener en cuenta el riesgo de otros factores relaciona-dos con la exposición y el desenlace o resultado de salud. Un factor de confusión debe serun factor de riesgo de la enfermedad, debe asociarse con la exposición y no debe ser unaetapa intermedia en la vía causal entre la exposición y el desenlace de la enfermedad.

Bowler RM, Cone JE: Occupational Medicine Secrets. Philadelphia, Hanley & Belfus, 1999.

PUNTOS CLAVE: PRINCIPIOS DE LA EPIDEMIOLOGÍA

1. La epidemiología es el estudio de la distribución y de los determinantes de la salud y la enfermedad en la población humana. Es la ciencia básica y práctica fundamental de la saludpública.

2. Los tipos de estudios epidemiológicos incluyen los estudios ecológicos, los estudios de casos y series de casos, los estudios transversales, los estudios de cohortes y los estudios de casos y controles.

3. Es preciso considerar el efecto de la distribución etaria diferencial en dos poblacionescomparables. Ajustando de este modo las tasas, se intenta comparar las tasas de enfermedad en varios grupos poblacionales o valorar cambios en las tasas con el tiempo. Hay dos métodoscentrales de ajuste de tasas: directo e indirecto.

4. La tasa de mortalidad estandarizada (TME o SMR) puede controlar la mortalidad tiempo específicamediante la estandarización indirecta.

5. Al calcular la TME o SMR, las tasas específicas por edades procedentes de una población estándar(es decir, de una comarca, región o país) se multiplican por las unidades persona-años en riesgoen la población en estudio (p. ej., empleados en una industria), para proporcionar el número defallecimientos esperado. Los números de fallecimientos observados divididos por el númeroesperado, multiplicado por 100, constituye la TME o SMR.

Page 39: Epidemiología y bioestadística secretos   nordness1ed

INTRODUCCIÓN A LOS PRINCIPIOS EPIDEMIOLÓGICOS36

Adaptada de Bowler RM, Cone JE. Occupational Medicine Secrets. Philadelphia: Hanley & Belfus, 1999.

TA B L A 2 - 1 . • V E N TA J A S Y D E S V E N TA J A S D E L O S T I P O S P R I N C I PA L E S D E E S T U D I O S E P I D E M I O L Ó G I C O S

Diseño del estudio

Estudio ecológico

Estudio de casos/

series de casos

Estudio transversal

Estudio de cohortes

Estudio de casos

y controles

26. ¿Qué es una tasa?

Es el número de veces que se produce un suceso concreto durante un período de tiempo tam-bién especificado, dividido por la población en riesgo durante dicho período. Por comodidad,las tasas se proporcionan con frecuencia por 1.000, por 10.000 o por 100.000 personas enriesgo.

27. ¿Cómo se calculan las principales medidas de mortalidad?

Las medidas básicas de enfermedad en una población son las tasas de mortalidad y de morbili-dad. A continuación, se exponen ejemplos de las tasas más habituales y el modo de calcularlas.

N.º de muertes en un año (todas las causas)Tasa de mortalidad bruta = � 1.000

Población total

(por ejemplo, tasa de mortalidad bruta en EE.UU. en 1977 = 8,8/1.000 personas)

Desventajas

Falacia ecológica (véase la pregunta 10).

No observa individuos

No es un verdadero estudio

epidemiológico

Sesgo de selección: puede concentrarse

sólo en la población superviviente

debido a que los individuos enfermos

hayan desaparecido

Mide solamente la prevalencia

Caro

Se necesita un período de seguimiento

largo; los individuos pueden perderse

para el seguimiento

Se requieren mayor número de

individuos

Sesgo de recuerdo: las personas con

enfermedad pueden tender a recordar

la exposición mejor que los controles

Ventajas

Rápido y fácil; aceptable para la

génesis de hipótesis para

estudios posteriores

Barato y fácil; buenos para los

acontecimientos muy

infrecuentes

Fija las bases para estudios futuros

más potentes

Barato, relativamente rápido, y fácil

Bueno si la población es de difícil

acceso o definición

Mide el riesgo

Menos costoso y requiere períodos

de tiempo más cortos; bueno

para enfermedades infrecuentes

Page 40: Epidemiología y bioestadística secretos   nordness1ed

INTRODUCCIÓN A LOS PRINCIPIOS EPIDEMIOLÓGICOS 37

N.º de muertes por unao varias causas específicas

Tasa de mortalidad específica por causa = � 100.000Población total

(por ejemplo, muertes por cáncer en EE.UU. en 1977 = 178,7/100.000 personas)

N.º de muertes entre personasde un grupo etario específico

en un año concretoTasa de muerte específica por edades = � 100.000

Población total en el grupoetario especificado

(por ejemplo, tasa de muertes por cáncer en el grupo etario de 1-14 años = 4,9/100.000)

N.º de muertes entre niñosmenores de 1 año de edad

en un año concretoTasa de mortalidad en menores de 1 año = � 1.000

N.º de nacimientosen dicho año concreto

De Principles of Epidemiology, 2nd ed. Atlanta, U.S. Department of Health and Human Services, PublicHealth Service, Centers for Disease Control and Prevention, Epidemiology Program Office, Public HealthPractice Program Office, 1992.

28. Indique algunas de las otras tasas que describen la morbilidad y la mortalidad.

Las Tablas 2-2 y 2-3 ilustran varias tasas empleadas para examinar las características de saludde una población.

29. ¿Qué es la incidencia?

La incidencia es el número de casos nuevos de una enfermedad concreta en un momentoespecificado, dividido por la población en riesgo de dicha enfermedad en el mismo período detiempo.

30. ¿Qué es la prevalencia?

La prevalencia es el número de casos existentes de una enfermedad dada, en un momentoespecificado, dividido por la población en riesgo de dicha enfermedad en el mismo período de tiempo.

31. ¿Cómo se relacionan la incidencia y la prevalencia?

Una fórmula útil para estimar la prevalencia de una afección o enfermedad específica es:

Prevalencia = incidencia � promedio de la duración de la afección o enfermedad

Esta fórmula es útil únicamente para realizar una estimación, y es más exacta a medida queaumenta la duración promedio de la afección o enfermedad, como sucede en las enfermedadescrónicas.

32. ¿Qué son las estadísticas vitales?

Las estadísticas vitales son estadísticas que enumeran los nacimientos, muertes, muertes feta-les, matrimonios y divorcios. El registro de muchos de estos sucesos es obligatorio por ley enEstados Unidos. Los distintos estados son responsables de la recogida de información y deremitirla al National Center for Health Statistics.

Page 41: Epidemiología y bioestadística secretos   nordness1ed

INTR

OD

UC

CIÓ

N A

LOS

PR

INC

IPIO

S EP

IDEM

IOLÓ

GIC

OS

38

De Principles of Epidemiology, 2nd ed. Atlanta, U.S. Department of Health and Human Services, Public Health Service, Centers for Disease Control and Prevention, Epidemiology Program Office,Public Health Practice Program Office, 1992.

TA B L A 2 - 2 . M E D I DA S D E M O R B I L I DA D E M P L E A DA S C O N F R E C U E N C I A

Medida

Tasa de incidencia

Tasa de ataque

Tasa de ataque secundario

Prevalencia puntual

Prevalencia en un período

Expresada por el N.º en riesgo (10n)

Varía: 10n en que n = 2, 3, 4, 5, 6

Varía: 10n en que n = 2, 3, 4, 5, 6

Varía: 10n en que n = 2, 3, 4, 5, 6

Varía: 10n en que n = 2, 3, 4, 5, 6

Varía: 10n en que n = 2, 3, 4, 5, 6

Numerador (x)

N.º de nuevos casos de una enfermedad especificada

notificada durante un intervalo de tiempo dado

N.º de nuevos casos de una enfermedad especificada

notificados durante un período epidémico

N.º de nuevos casos de una enfermedad especificada

entre contactos de casos conocidos

N.º de casos actuales, nuevos y antiguos, de una

enfermedad especificada, en un momento

determinado

N.º de casos actuales, nuevos y antiguos, de una

enfermedad especificada, identificados durante un

intervalo de tiempo determinado

Denominador (y)

Población promedio durante el mismo

intervalo de tiempo

Población al comienzo del período epidémico

Tamaño de la población de contactos en riesgo

Población estimada en el mismo momento

Población estimada en la mitad del intervalo

de tiempo

Page 42: Epidemiología y bioestadística secretos   nordness1ed

INTR

OD

UC

CIÓ

N A

LOS

PR

INC

IPIO

S EP

IDEM

IOLÓ

GIC

OS

39

Adaptada de Principles of Epidemiology, 2nd ed. Atlanta, U.S. Department of Health and Human Services, Public Health Service, Centers for Disease Control and Prevention, Epidemiology ProgramOffice, Public Health Practice Program Office, 1992.

TA B L A 2 - 3 . OT R A S M E D I DA S D E M O RTA L I DA D

Medida

Mortalidad proporcional

Cociente muertes/casos

Tasa de mortalidad

neonatal

Tasa de mortalidad

posneonatal

Tasa de mortalidad

materna

Expresada por el N.º en riesgo (10n)

100 o 1.000

100

1.000

1.000

100.000

Numerador (x)

N.º de muertes atribuidas a una causa específica

durante un intervalo de tiempo determinado

N.º de muertes atribuidas a una causa específica

durante un intervalo de tiempo determinado

N.º de muertes registradas antes de los 28 días de

vida durante un intervalo de tiempo determinado

N.º de muertes a partir de los 28 días de vida hasta

(pero sin incluir), 1 año de vida durante un

intervalo de tiempo determinado

N.º de muertes atribuidas a las causas relacionadas

con el embarazo durante un intervalo de tiempo

determinado

Denominador (y)

N.º total de muertes por todas las causas

durante el mismo intervalo de tiempo

N.º de casos nuevos de dicha enfermedad

notificados durante el mismo período de

tiempo

N.º de nacidos vivos durante el mismo

intervalo de tiempo

N.º de nacidos vivos durante el mismo

intervalo de tiempo

N.º de nacidos vivos durante el mismo

intervalo de tiempo

Page 43: Epidemiología y bioestadística secretos   nordness1ed

INTRODUCCIÓN A LOS PRINCIPIOS EPIDEMIOLÓGICOS40

33. ¿Cuáles son algunos de los problemas relacionados con la recogida de datos

en los certificados de defunción?

El único registro realmente completo en relación con todas las posibles causas de enfermedades el relacionado con la defunción. Sin embargo, la causa de muerte consignada en los certifi-cados de defunción es, con frecuencia, inexacta. Además, en relación con una enfermedad enla que el cociente número de casos/número de muertes es bajo (es decir, una enfermedad quecuando se produce improbablemente lleve a la muerte) la tasa de mortalidad es claramente unainfravaloración inexacta de la incidencia de la afección en la comunidad. Un ejemplo de ello esel cáncer de piel distinto al melanoma.

34. ¿Cuál es el principal problema con la notificación de la morbilidad?

Los informes de morbilidad, aun cuando son obligatorios por ley, como sucede en el caso deciertas enfermedades infecciosas (p. ej., tuberculosis y algunas enfermedades de transmisiónsexual), dan lugar con frecuencia a una infranotificación importante.

35. ¿Qué son las tasas brutas?

Las tasas brutas son las que se aplican a una población en su totalidad, sin tener en considera-ción especial ninguna de las características de los individuos de dicha población (p. ej., la edad).Para realizar comparaciones significativas entre poblaciones, se han de ajustar estas tasas.

36. ¿Qué quiere decir ajuste de tasas?

Es preciso considerar el efecto de la distribución etaria diferencial en dos poblaciones compa-rables. Ajustando así las tasas, se intenta comparar las tasas de enfermedad en los grupospoblacionales o valorar los cambios de las tasas en el tiempo. Hay dos métodos centrales deajuste de tasas: el directo y el indirecto.

37. ¿Cuál es el método directo de ajuste de tasas?

El método directo aplica las tasas específicas por edades observadas a una población estándar.Este método es apropiado cuando cada una de las poblaciones que se comparan es lo suficien-temente grande para proporcionar unas tasas específicas por edades estables. Por ejemplo, seutiliza el método directo para la comparación de las tasas de cáncer en el tiempo. Las tasas demortalidad brutas muestran un aumento espectacular del cáncer en las pasadas décadas, yparecería que proporciona datos sólidos sugestivos sobre una epidemia de cáncer. Sin embar-go, hay que asegurar hasta qué punto el envejecimiento de la población del país ha contribuidoa la epidemia aparente, y hasta qué punto otros factores, como un aumento de los agentes can-cerígenos en el ambiente, podrían ser responsables.

La Tabla 2-4 muestra un ejemplo del cálculo de una estandarización directa de unas tasas demortalidad brutas ficticias.

LaDou J: Occupational and Environmental Medicine. 2nd ed. Stamford, CT: Appleton & Lange, 1997.

38. ¿Cuál es el método indirecto de ajuste de tasas?

El método indirecto aplica las tasas específicas por edades de una población estándar a la dis-tribución etaria de una población observada. Para eliminar el efecto variable de la edad por elempleo del método de ajuste directo, se elige una población estándar. A continuación, se mul-tiplica el número de personas de cada grupo de edad de la población estándar por la tasaespecífica por edades apropiada en cada una de las poblaciones del estudio. Este procesogenera el número de muertes esperado en cada grupo de edad; se divide la suma por el totalde la población estándar; a continuación, se multiplica el resultado por 100.000. La Tabla 2-5muestra un ejemplo del cálculo de una estandarización indirecta de unas tasas de mortalidadbrutas ficticias.

Page 44: Epidemiología y bioestadística secretos   nordness1ed

De Jekel JF, Katz DL, Elmore JG. Epidemiology, Biostatistics and Preventive Medicine, 2nd ed. Philadelphia: W.B. Saunders, 2001, p 33.

TA B L A 2 - 4 . • E S TA N DA R I Z A C I Ó N D I R E C TA D E L A S TA S A S D E M O RTA L I DA D B R U TA S D E D O S P O B L A C I O N E S , E M P L E A N D O L O S P E S O S R E L AT I V O S M E D I O S C O M O P O B L A C I Ó N E S T Á N DA R ( DATO S F I C T I C I O S )

Parte 1. Cálculo de las tasas de mortalidad brutas

Grupo de edad

Jóvenes

Mediana edad

Mayores

Total

Tasa de mortalidad bruta 451/10.000 = 4,51% 308/10.000 = 3,08%

Parte 2. Estandarización directa de las tasas de mortalidad brutas anteriores, empleando las dos poblaciones combinadas para formar los pesos estándares o de referencia

Grupo de edad

Jóvenes

Mediana edad

Mayores

Total

Tasa de mortalidad estandarizada 605/20.000 = 3,03% 1.210/20.000 = 6,05%

INTRODUCCIÓN

A LOS PRINCIPIOS EPIDEM

IOLÓGICOS41

Tamaño

poblacional

4.000

5.000

1.000

10.000

Tamaño

poblacional

5.000

10.000

5.000

20.000

=

=

=

=

=

=

=

=

=

=

=

=

Población B

Tasa de mortalidad

específica por

edades

0,002

0,020

0,200

Poblacional B

Tasa de mortalidad

específica por

edades

0,002

0,020

0,200

Número

esperado

de muertes

8

100

200

308

Número

esperado

de muertes

10

200

1.000

1.210

Número

esperado

de muertes

1

50

400

451

Número

esperado

de muertes

5

100

500

605

Población A

Tasa de mortalidad

específica por edad

0,001

0,010

0,100

Población A

Tasa de mortalidad

específica por edad

0,001

0,010

0,100

Tamaño

poblacional

1.000

5.000

4.000

10.000

Tamaño

poblacional

5.000

10.000

5.000

20.000

Page 45: Epidemiología y bioestadística secretos   nordness1ed

TA B L A 2 - 5 . • E S TA N DA R I Z A C I Ó N I N D I R E C TA D E L A TA S A D E M O RTA L I DA D B R U TA E N VA R O N E S E N U N A E M P R E S A , M E D I A N T E E L E M P L E O D E TA S A S D E M O RTA L I DA D E S P E C Í F I C A P O R E DA D , E N R E L A C I Ó N C O N L O S VA R O N E S D E U N A P O B L A C I Ó N E S T Á N DA R ( DATO S F I C T I C I O S )

Parte 1. Datos de inicio

Varones en la población estándar Varones en la empresa

Grupo de edad

Jóvenes

Mediana edad

Mayores

Total

Tasa de mortalidad observada 0,00334 o 334/100.000 48/10.000 o 480/100.000

Parte 2. Cálculo de la tasa de mortalidad esperada, con empleo de la estandarización indirecta de las tasas arriba indicadas, y con aplicación de las tasas de mortalidad

específicas por edades a partir de la población estándar al número de trabajadores de la empresa

Varones en la población estándar Varones en la empresa

Grupo de edad

Jóvenes

Mediana edad

Mayores

Total

Tasa de mortalidad esperada 53,2/10.000 o 532/100.000

Tasa de mortalidad

específica

por edades

0,0001

0,0010

0,0100

Tasa de mortalidad

específica

por edades

0,0001

0,0010

0,0100

Tasa de mortalidad

específica por

edades

?

?

?

Tasa de mortalidad

estándar

0,0001

0,0010

0,0100

INTRODUCCIÓN

A LOS PRINCIPIOS EPIDEM

IOLÓGICOS42

Número de

trabajadores

2.000

3.000

5.000

10.000

Número de

trabajadores

2.000

3.000

5.000

10.000

=

=

=

=

=

=

=

=

=

=

=

=

Número de

muertes

observadas

?

?

?

48

Número de

muertes

esperadas

0,2

3,0

50,0

53,2

Tasa de

mortalidad

observada

0,00004

0,00030

0,00300

0,00334

Tasa de

mortalidad

observada

0,00004

0,00030

0,00300

0,00334

Proporción de

la población

estándar

0,40

0,30

0,30

1,00

Proporción de

la población

estándar

0,40

0,30

0,30

1,00

(Continúa)

Page 46: Epidemiología y bioestadística secretos   nordness1ed

De Jekel JF, Katz DL, Elmore JG. Epidemiology, Biostatistics, and Preventive Medicine, 2nd ed. Philadelphia: W.B. Saunders, 2001, p 34.

TA B L A 2 - 5 . • E S TA N DA R I Z A C I Ó N I N D I R E C TA D E L A TA S A D E M O RTA L I DA D B R U TA E N VA R O N E S E N U N A E M P R E S A , M E D I A N T E E L E M P L E O D E TA S A S D E M O RTA L I DA D E S P E C Í F I C A P O R E DA D , E N R E L A C I Ó N C O N L O S VA R O N E S D E U N A P O B L A C I Ó N E S T Á N DA R ( DATO S F I C T I C I O S ) ( C o n t . )

Parte 3 Cálculo de la tasa de mortalidad estandarizada (TME o SMR)

Tasa de mortalidad observada

en los varones de la empresaTME o SMR = � 100

Tasa de mortalidad esperada

en los varones de la compañía

0,00480= � 100

0,00532

= (0,90)(100) = 90

= Los varones de la empresa tuvieron realmente una tasa de mortalidad de sólo el 90% del valor esperado atendiendo a las tasas de mortalidad en

la población estándar.

INTRODUCCIÓN

A LOS PRINCIPIOS EPIDEM

IOLÓGICOS43

Page 47: Epidemiología y bioestadística secretos   nordness1ed

INTRODUCCIÓN A LOS PRINCIPIOS EPIDEMIOLÓGICOS44

39. ¿Cuándo es más útil emplear el método indirecto de estandarización?

Cuando el grupo en estudio es relativamente pequeño y probablemente tenga unas tasasespecíficas por edad inestables, resulta más apropiado emplear el método indirecto en vez delmétodo directo de estandarización.

40. ¿Qué método de estandarización tiene mayor probabilidad de utilizarse

cuando se investigan los fallecimientos específicos por causas concretas?

Se utiliza con mayor frecuencia el método indirecto en el análisis de la mortalidad específicapor una causa concreta en una cohorte. El método indirecto se emplea con frecuencia paracomparar la incidencia de enfermedad o los resultados obtenidos en el seguimiento de ungrupo de estudio con la incidencia esperada, a tenor de la experiencia de una población mayor.Con el método indirecto, las tasas específicas por edades en relación con una población están-dar se multiplican por las unidades persona-años en riesgo, en cada grupo en las series delestudio. A continuación, se compara el número de muertes observadas con el número espera-do, mediante un simple cociente.

41. ¿Cuál es el cociente o tasa de mortalidad estandarizada (TME o SMR)?

La TME o SMR es un ejemplo de estandarización indirecta. Al calcular la TME o SMR se multi-plican las tasas específicas por edades a partir de una población estándar (p. ej., comarca,región o país) por el número de personas en riesgo en una población en estudio(p. ej., emplea-dos de una industria) para obtener el número esperado de muertes. El número de muertesobservadas dividido por el número de muertes esperadas, multiplicado por 100, es la TME oSMR. Una TME o SMR puede servir para controlar también la mortalidad específica por tiempomediante la estandarización indirecta.

BIBLIOGRAFÍA

1.• Bowler RM, Cone JE: Occupational Medicine Secrets. Philadelphia, Hanley & Belfus, 1999. 2.• Doll R, Hill AB: The mortality of doctors in relation to their smoking habits: A preliminary report. Br Med J

1:1451–1455, 1954.3.• Hennekens CH: Epidemiology in Medicine. Boston, Little Brown & Company, 1987.4.• LaDou J: Occupational and Environmental Medicine, 2nd ed. Stamford, CT; Appleton & Lange, 1997.5.• Morris JN: Uses of Epidemiology, 3rd ed. Edinburgh, Churchill-Livingstone, 1975.6.• Wallace RB: Maxcy-Rosenau-Last’s Public Health and Preventive Medicine, 14th ed. Stamford, CT, Appleton

& Lange, 1998.

PÁGINAS WEB

1. http://www.acepidemiology.org

2. http://www.apha.org/public–health/epidemiology.htm

Page 48: Epidemiología y bioestadística secretos   nordness1ed

45

CA

PÍT

ULO

3

DETERMINACIÓN DEL RIESGOMark Glover, BA, BM, BCh

N OTA C I Ó N U T I L I Z A DA E N E S T E C A P Í T U L O

Se pueden clasificar las observaciones en un estudio de cohortes controlado del siguiente modo:

Factor de riesgo presente: población en estudio

Factor de riesgo ausente: población control

Positivo en relación con el desenlace de interés: por ejemplo, enfermedad

Negativo en relación con el desenlace de interés: por ejemplo, ausencia de enfermedad

La tabla inferior se denomina como tabla de 2 � 2 o tabla de contingencia. Es un método habitual para

resumir los hallazgos de la investigación, en la que las categorías numéricas, representadas por a, b, c

y d, reflejan la distribución de las observaciones en cada categoría.

Se puede añadir una fila o columna con el total, como se indica a continuación, para simplificar los

cálculos:

Con el empleo de esta anotación, se verá más adelante que se cumplen los enunciados siguientes:■ Riesgo absoluto en la población en estudio (Rs) = a/(a � c)■ Riesgo absoluto en la población control (Rc) = b/(b � d)■ Riesgo relativo (RR) = Rs/Rc

Estudio Control

Enfermedad a b

Ausencia de enfermedad c d

Estudio Control

Enfermedad a b

Ausencia de enfermedad c d

Total a � c b � d

Page 49: Epidemiología y bioestadística secretos   nordness1ed

DETERMINACIÓN DEL RIESGO46

1. ¿Qué es el riesgo?

En el lenguaje corriente, la palabra riesgo tiene muchos significados estrechamente relaciona-dos que, con frecuencia, se asocian con malos resultados. En términos de estadística y epide-miología, riesgo es sencillamente una expresión de probabilidad. Suele significar, pero no demodo invariable, la probabilidad de un suceso adverso, como una enfermedad, lesión o muer-te. En ocasiones, la naturaleza del riesgo depende de la perspectiva del observador. Por ejem-plo, hay riesgo de que usted pierda dinero (suceso adverso) si compra un número de lotería;pero, si usted no gana, los organizadores de la lotería se benefician (suceso beneficioso).

2. ¿Qué es el riesgo absoluto?

El riesgo absoluto de un suceso es la probabilidad de que éste se produzca. La siguientefracción muestra los dos datos requeridos para calcular el riesgo absoluto:

número de observaciones en las que el suceso de interés está presentenúmero total de observaciones

Si a indica el número total de observaciones en las que se observa el suceso de interés, yc denota el número total de observaciones en las que no se observa el suceso de interés, elnúmero total de observaciones es a + c, y el riesgo absoluto de que se produzca el suceso deinterés se expresa de la siguiente manera:

aa + c

3. ¿Qué valores puede adoptar el riesgo absoluto?

Dado que es una expresión de probabilidad, un riesgo puede adoptar cualquier valor compren-diendo entre 0 y 1. En algunos casos, el riesgo puede expresarse como porcentaje, con valoresentre 0 y 100%. Cuando el valor es muy pequeño, el riesgo se puede expresar como sucesosde interés entre un mayor número de observaciones (p. ej., 2,75 muertes por cada 100.000personas).

4. ¿Qué sucede si no es posible recoger toda la observación relevante?

Rara vez es posible incluir todas las observaciones relevantes en un estudio. Sin embargo, si se extrae de modo aleatorio una proporción de todas las observaciones posibles, y hay aobservaciones en las que se observa el suceso de interés y c observaciones en las que no seobserva dicho suceso de interés, se puede calcular el riesgo absoluto a partir de la fracción:

aa + c

De modo que, en la medida en que las observaciones registradas sean una representaciónproporcional de todas las observaciones relevantes posibles, puede calcularse correctamenteel riesgo a partir de una muestra de la población total.

5. ¿Es útil la información extraída a partir de una muestra de una población

determinada?

Mucho, siempre que la muestra sea verdaderamente representativa de la población que seintenta caracterizar. Por ejemplo, suponiendo que en Estados Unidos haya 150.000 accidentescerebrovasculares mortales y 450.000 accidentes cerebrovasculares no mortales anualmente,el riesgo de que el accidente cerebrovascular sea mortal en Estados Unidos cada año se expre-sa del modo siguiente:

150.000/(150.000 + 450.000) = 150.000/600.000 = 0,25

Page 50: Epidemiología y bioestadística secretos   nordness1ed

DETERMINACIÓN DEL RIESGO 47

Si una de cada 1.000 víctimas de accidente cerebrovascular en Estados Unidos fuera seleccio-nada de modo aleatorio para incluirla en un estudio de 1 año de duración, se recogerían 600 casos.Si dichos casos fuesen una representación proporcional de todos los individuos que padecen unaccidente cerebrovascular en Estados Unidos, 150 fallecerían y 450 sobrevivirían. El riesgo de queun accidente cerebrovascular sea mortal, calculado a partir de las observaciones recogidas, es:

150/(150 + 450) = 150/600 = 0,25

Este riesgo es el mismo que el calculado a partir de la población total de pacientes de accidentecerebrovascular.

6. ¿Cuál es la diferencia entre un riesgo y una tasa o índice?

Las convenciones de terminología no son totalmente consistentes en la literatura científica,pero, hablando en sentido estricto, el denominador de una tasa incluye unidades de tiempo. Porejemplo, 25 muertes por 100.000 personas por año. El denominador de un riesgo no incluye eltiempo; por ejemplo, 2,6 muertes por cada 100 intervenciones quirúrgicas a corazón abierto.

7. ¿Qué diferencia hay entre el riesgo de incidencia y la tasa de incidencia?

Ésta es otra convención epidemiológica que puede causar confusión. La incidencia es una medi-da de cuántos casos de interés se producen en una población en el tiempo, clásicamente, de unaño. El riesgo de incidencia es un riesgo absoluto, calculado al dividir el número de nuevoscasos que se producen en un año por el número de personas libres de enfermedad al comienzodel año. La tasa de incidencia es una expresión del número de nuevos casos que se producen en un año, dividido por el promedio de personas libres de enfermedad durante el año.

8. Cite ejemplos del modo de determinar el riesgo de incidencia y la tasa

de incidencia.

Tomemos un ejemplo especial de una población de 1.000 personas con una enfermedad graveque causa la muerte a 720 de ellas en un año. El riesgo de incidencia de mortalidad en dichapoblación será de 720/1.000 = 0,72/año.

El método más sencillo para calcular la media de personas libres de enfermedad en el año escalcular la media de personas libres de enfermedad al inicio (1.000) y al final del año (1.000 –720 = 280). En este caso, el promedio es (1.000 + 280)/2 = 1.280/2 = 640. La tasa de inciden-cia de mortalidad en dicha población es 720/640 = 1,125. En consecuencia, a diferencia de unriesgo, la tasa de incidencia puede exceder la unidad en algunas circunstancias. Un modoalternativo de describir el denominador para la tasa de incidencia es el tiempo medio que unapersona tendrá que esperar antes de padecer la enfermedad.

9. ¿Qué efecto significativo tienen estas diferencias sobre los resultados

del estudio?

La diferencia entre los valores calculados en relación con el riesgo y la tasa de incidencia esmínima en la mayoría de los casos. Los factores responsables de este hecho son dos:■ La mayoría de enfermedades afecta a proporciones muy pequeñas de una población, y unos

pocos individuos abandonarán el grupo de riesgo.■ El denominador de la tasa suele permanecer estable a medida que nuevas personas en ries-

go sustituyen a las que abandonan el grupo. Por ejemplo, una población permanece mode-radamente estable si los nacimientos equilibran aproximadamente las muertes.

10. ¿Qué se entiende por valores altos y bajos del riesgo absoluto?

No existe un estándar. Un valor de riesgo absoluto aislado no dice si éste es alto o bajo. El único modo de poder decirlo, empleando el riesgo absoluto, es comparar los hallazgos endos o más conjuntos de observaciones.

Page 51: Epidemiología y bioestadística secretos   nordness1ed

11. Proporcione un ejemplo del modo de determinar valores altos y bajos del ries-

go absoluto. ¿Cómo se comparó el riesgo de divorcio en el Reino Unido con el

de Grecia en el año 2002?

Las estadísticas gubernamentales muestran que el riesgo de divorcio en Grecia en el año 2002fue de 1,1 por 1.000 personas, mientras que el riesgo de divorcio en el Reino Unido en el año2002 fue de 2,7 por 1.000 personas. El riesgo de divorcio fue claramente superior en el ReinoUnido con respecto a Grecia. La conclusión es directa en este caso porque tales cifras suelenderivarse a partir de registros nacionales mantenidos en un organismo centralizado que abarcaa la totalidad de la población. Si se hubiese tomado una muestra de cada población nacional,habrían sido necesarias pruebas estadísticas para establecer que las diferencias de los riesgosobservados eran significativas.

12. ¿En qué difiere un riesgo comparativo de un riesgo absoluto?

El riesgo absoluto, cuando se cita de modo aislado, no proporciona información alguna de si esalto o bajo. Igualmente, tampoco es posible calcular el riesgo absoluto a partir de todos losposibles diseños de los estudios. Por el contrario, las medidas de riesgo comparativo permitenproducir resultados que pueden comparar el riesgo en poblaciones diferentes y, por ello, pro-porcionan cierta idea de la magnitud relativa de los riesgos. Estas medidas pueden calcularse apartir de una gama más amplia de estudios. Los métodos que se suelen utilizar habitualmentepara describir el riesgo comparativo son el riesgo relativo, la oportunidad relativa y el riesgoatribuible.

13. ¿Cuál es el mejor método para medir el riesgo comparativo?

No existe un solo método que proporcione una descripción perfecta si se emplea de modo ais-lado. Aún peor, pueden utilizarse las cifras para dar una impresión muy distorsionada de la rea-lidad. Como resultado, dos de los desafíos mayores a los que se enfrentan los profesionalessanitarios son la interpretación correcta de los resultados y la explicación de un riesgo específi-co a una persona normal de tal modo que sea relevante para dicho individuo y comunique ade-cuadamente su verdadera magnitud. Diferentes medidas se adaptan mejor a usos específicos.

14. ¿Con qué comparan el riesgo las medidas del riesgo comparativo?

Pueden compararse los riesgos entre dos grupos. Muchos proyectos de investigación compa-ran observaciones de uno o más grupos que se están estudiando, con observaciones en ungrupo control. Los grupos de estudio tienen unas características unificadoras inherentes oadquiridas, con frecuencia denominadas factores de riesgo. Se elige el grupo control a partir deun grupo en el que el factor de riesgo está ausente. Mediante la comparación puede valorarseel efecto del riesgo sobre el desenlace.

15. ¿Qué forma adoptan los factores de riesgo?

Los factores de riesgo pueden adoptar muchas formas, incluidas formas hereditarias, ambien-tales y las relacionadas con el estilo de vida. Entre los ejemplos de factores de riesgo figuranlos siguientes:■ Defecto genético importante, tanto de morfología como de función fisiológica; por ejemplo,

la presión arterial.■ Exposiciones a agentes infecciosos o ambientales.■ Exposición a sustancias tóxicas o fármacos.

16. ¿Qué es el riesgo relativo?

El riesgo relativo (RR), o razón o cociente de riesgos, es una medida del riesgo absoluto en unapoblación, como proporción del riesgo absoluto en otra población. Generalmente, pero no de

DETERMINACIÓN DEL RIESGO48

Page 52: Epidemiología y bioestadística secretos   nordness1ed

DETERMINACIÓN DEL RIESGO 49

modo invariable, el riesgo más elevado se coloca en el numerador. Dado que el grupo controltiene con frecuencia un riesgo más bajo, el riesgo relativo suele expresarse así:

Rs/Rc

Los investigadores que buscan la magnitud de una asociación entre un factor de riesgo y undesenlace de interés defienden la importancia de la medición del riesgo relativo. En algunoscasos, sin embargo, el riesgo relativo puede inducir a errores.

17. ¿De qué modo puede producir errores la mediación de los riesgos relativos?

Con el empleo de la fórmula arriba expresada, si existe una enfermedad infrecuente con unriesgo absoluto de 1 por cada 10 millones de personas por año, y se observa que un aditivo ali-mentario aumenta el riesgo absoluto hasta 5 por cada 10 millones de personas por año, el ries-go relativo de los que consumen el aditivo sería 5. Si existe una enfermedad más frecuentepero igualmente grave con un riesgo absoluto de 1 por cada 10.000 personas por año y seobserva que un fármaco aumenta el riesgo absoluto a 1,2 por cada 10.000 personas por año, elriesgo relativo de los que toman el fármaco es de 1,2. El hecho de conocer que el aditivoaumenta el riesgo de una enfermedad en cinco veces y que el fármaco aumenta el riesgo deuna enfermedad en 1,2 podría llevar a la conclusión de que se obtendrían mayores beneficiossi se evitase el mencionado aditivo.

18. Parece que el ejemplo anterior no conduce a error. ¿Por qué?

Primero, examinemos el beneficio obtenido al eliminar el aditivo alimentario ya que se hademostrado que tiene un mayor riesgo relativo que el fármaco. Esta eliminación comportaría 4 casos menos de enfermedad en una población de 1 millón de habitantes. Sin embargo, apesar de su riesgo relativo menor, evitar el fármaco comportaría 20 casos menos en una pobla-ción de 1 millón de habitantes (1,2 casos por cada 10.000 – 1 casos por 10.000 = 0,2 casos en10.000 = 20 casos en 1 millón). La diferencia en el riesgo basal entre las dos enfermedadespuede tener un gran efecto. Con frecuencia, es preferible calcular el cambio real esperadosegún el número bruto de casos.

19. ¿Qué es la oportunidad o posibilidad (odds)?

La probabilidad de que se produzca un suceso expresada como una proporción sobre la proba-bilidad de que éste no se produzca se conoce como la posibilidad de un suceso. La probabili-dad de un suceso en un estudio se denota como Rs y, dado que la suma de todas las probabili-dades ha de ser igual a la unidad, la probabilidad de que no se produzca el suceso es 1 – Rs.Para calcular la posibilidad, se divide la probabilidad de que se produzca el suceso por la pro-babilidad de que éste no se produzca. Por ello, la posibilidad de que se produzca el suceso enla población del estudio puede expresarse del modo siguiente: Rs/(1 – Rs).

20. Proporcione un ejemplo de cómo se utiliza la posibilidad.

Cada vez que se echa un dado sin defectos, la probabilidad de que salga un 1 es 1 de cada 6, yla probabilidad de sacar un número distinto al 1 es 5 de cada 6. La posibilidad de que salga un1 es 1/6 dividido por 5/6 = 1/5 = 0,2.

21. Defina la posibilidad relativa (odds ratio).

La posibilidad relativa (odds ratio), o cociente de productos cruzados, es la oportunidad de quese produzca un suceso de interés en la población objeto de estudio, expresada como una pro-porción de la posibilidad de que se produzca el mismo suceso en una población control. Estecociente puede expresarse del siguiente modo:

Page 53: Epidemiología y bioestadística secretos   nordness1ed

DETERMINACIÓN DEL RIESGO50

[Rs/(1 – Rs)]/[Rc/(1 – Rc)]= [Rs � (1 – Rc)]/[Rc � (1 – Rs)]

22. Parece confuso. ¿Existe un modo más fácil de calcular la posibilidad relativa?

Sí. Afortunadamente, también pueden utilizarse las cifras absolutas. Remitiéndonos a la tablagenérica de 2 � 2, la posibilidad de un desenlace positivo en la población de estudio sería a/c, y la posibilidad de un desenlace positivo en la población control sería b/d. Así, la posibilidadrelativa sería la siguiente:

(a/c)/(b/d)= ad/bc

23. ¿Por qué es clásicamente imposible calcular el riesgo relativo a partir de un

estudio de casos y controles?

Un estudio de casos y controles implica la selección de un grupo con la enfermedad (u otrodesenlace de interés) y un grupo sin la enfermedad. A continuación, se determina el númerode individuos con el factor de riesgo en investigación en cada grupo. Recuerde que sólo sepuede calcularse el riesgo a partir de una muestra si refleja las proporciones en la totalidadde la población.

24. ¿Es posible calcular el riesgo relativo a partir de un estudio de casos y controles?

Es posible calcular los riesgos a partir de un estudio de casos y controles en sólo una de lassiguientes circunstancias improbables:■ Si el estudio incluye todos los miembros posibles de las poblaciones apropiadas.■ Si las cifras de los individuos en los grupos de muestras con y sin los factores de riesgo se

hallan presentes en las mismas proporciones que en la población de la que proceden.

25. ¿Por qué es infrecuente calcular la probabilidad de tener un factor de riesgo

en presencia o ausencia de la enfermedad a partir de los resultados de un

estudio de casos y controles?

No hay más que una relación muy laxa entre el riesgo de enfermedad en presencia o ausenciade un factor de riesgo y la probabilidad de tener dicho factor de riesgo en presencia o ausenciade la misma enfermedad. Esta información sería de interés solamente académico y de nuloempleo predictivo.

26. Facilite un ejemplo del problema anterior.

Se ha demostrado que los pulmones pequeños con baja capacidad vital forzada (FVC) se aso-cian con barotraumatismo pulmonar (PBT) durante los ascensos de entrenamiento de escapede submarinos presurizados. En la siguiente tabla se muestran algunos registros ficticios obte-nidos en un centro de entrenamiento de escape submarino:

Dado que está registrada la totalidad de la población, se pueden calcular los riesgos. El riesgode PBT con una FVC baja es 39/7.586 = 5,1 por cada 1.000 ascensos. La probabilidad de una

FVC normal

Baja FVC o mayor Total

PBT 39 83 122

Sin PBT 7.547 240.168 247.715

Total 7.586 240.251 247.837

Page 54: Epidemiología y bioestadística secretos   nordness1ed

DETERMINACIÓN DEL RIESGO 51

FVC baja en presencia de PBT es mucho mayor a 39/122 = 0,47 y, claramente no resulta unabuena medida del riesgo de cada ascensión emprendida.

27. ¿Qué medida puede emplearse para obtener una información predictiva

clínicamente útil a partir de un estudio de casos y controles?

Puede emplearse la posibilidad relativa para ilustrar la fuerza de la asociación entre un factor deriesgo y el desenlace, tanto en estudios de cohortes como de casos y controles. Una propiedadmatemática inherente a la posibilidad relativa que la hace particularmente útil en los estudiosde casos y controles es que la oportunidad relativa no requiere la presencia de factores de ries-go en las mismas proporciones que en la población de la que se extrajeron las muestras.Además, la oportunidad relativa posee simetría, de modo que:

posibilidad de enfermedad con un factor de riesgo presenteposibilidad de enfermedad cuando falta un factor de riesgo

es igual a:

posibilidad de un factor de riesgo en los afectados por la enfermedadposibilidad de un factor de riesgo en los que no tienen la enfermedad

Como consecuencia, la posibilidad relativa proporciona una medida sólida y significativa de larelación entre el factor de riesgo y la enfermedad, sea cual sea el modo de calcularla. Igualmen-te, si el desenlace de interés se produce de modo infrecuente, la posibilidad relativa está muypróxima al riesgo relativo.

28. Proporcione un ejemplo de la simetría de las posibilidades relativas.

Para este ejemplo se utiliza la tabla genérica de 2 � 2 indicada al comienzo del capítulo. Se havisto anteriormente que la posibilidad relativa de enfermedad en presencia de un factor deriesgo viene dada por (a/c)/(b/d) = ad/bc. Al retitular la tabla genérica de 2 � 2 para represen-tar los hallazgos de un estudio de casos y controles, en la que las cifras fueran divididas entreel desenlace y el factor de riesgo en las mismas proporciones que antes, se obtiene losiguiente:

La posibilidad de un factor de riesgo en presencia de la enfermedad es igual a a/b. La posibi-lidad de un factor de riesgo en ausencia de la enfermedad es igual a c/d: la posibilidad relativaes (a/b)/(c/d) = ad/bc, igual que la posibilidad relativa calculada al emplear la posibilidad de laenfermedad.

29. Proporcione un ejemplo de las circunstancias necesarias para que

la posibilidad relativa se aproxime mucho al riesgo relativo.

El riesgo relativo en un estudio de cohortes viene dado por la expresión Rc/Rs. En términos decifras absolutas a partir de la tabla genérica de 2 � 2, el riesgo relativo es igual a:

Factor de riesgo Factor de riesgo

presente ausente

Grupo de estudio (anteriormente, a b

enfermedad)

Grupo control (anteriormente, c d

sin enfermedad)

Page 55: Epidemiología y bioestadística secretos   nordness1ed

[a/(a + c)]/[b/(b + d)]. A medida que el desenlace de interés se vuelve más infrecuente, tanto acomo b tienden a cero, y el riesgo relativo tiende a:

[a/(0 + c)]/[b/(0 + d)]= (a/c)/(b/d)= ad/bc

que es igual que la posibilidad relativa. De modo que si una enfermedad es infrecuente, la posi-bilidad relativa proporciona un cálculo muy próximo al riesgo relativo.

30. Aplique la posibilidad relativa al ejemplo del tanque de entrenamiento

de escape submarino.

Repetimos los resultados obtenidos en el ejemplo del tanque de entrenamiento de escape submarino:

El riesgo de PBT con FVC baja (Rs) es a/(a + c) = 39/7.586 = 5,1 por cada 1.000El riesgo de PBT con FVC normal o elevada (Rc) es b/(b + d) = 83/240.251 = 3,5 por cada 10.000

El riesgo relativo (RR) es Rs/Rc = 5,1 � 10-3/3,5 � 10-4 = 14,9La posibilidad de PBT con FVC baja es a/c = 39/7.547 = 5,2 � 10-3

La posibilidad de PBT con FVC normal o elevada es b/d = 83/240.168 = 3,5 � 10-4

Esto da una posibilidad relativa de (5,2 � 10-3)/(3,5 � 10-4) = 15La posibilidad de una FVC baja con PBT es a/b = 39/83 = 0,47

La posibilidad de una FVC baja sin PBT es c/d = 7.547/240.168 = 0,031Esto proporciona una posibilidad relativa de 0,47/0,031 = 15

Obsérvese que la posibilidad relativa es idéntica, no importa cómo se calcule. Obsérvese, igual-mente, que la posibilidad relativa y el riesgo relativo son muy similares, porque el PBT clínica-mente manifiesto es un suceso infrecuente.

31. ¿En qué difieren el riesgo relativo y la posibilidad relativa?

De las respuestas anteriores, se deduce que el riesgo relativo puede calcularse a partir de unestudio de cohortes, pero no a partir de un estudio de casos y controles, mientras que la posi-bilidad relativa puede calcularse a partir de cualquier tipo de estudio. La posibilidad relativa seaproxima notablemente al riesgo relativo cuando el desenlace de interés es infrecuente y losgrupos son representativos de las poblaciones de las que proceden. Ni el riesgo relativo ni laposibilidad relativa proporcionan pista alguna de la magnitud del riesgo en la población basal ogrupo control.

32. ¿Cuál es la importancia del denominador al valorar el riesgo?

Hay que ser cuidadosos para definir y comprender totalmente el denominador, ya que podríatener un impacto significativo en la interpretación de los resultados. De modo similar, esimportante asegurarse de que cualquier riesgo empleado para la comparación tenga el denomi-nador apropiado para permitir dicha comparación. No tiene sentido, por ejemplo, realizar una

DETERMINACIÓN DEL RIESGO52

FVC normal

Baja FVC o elevada Total

PBT 39 83 122

Sin PBT 7.547 240.168 247.715

Total 7.586 240.251 247.837

Page 56: Epidemiología y bioestadística secretos   nordness1ed

comparación no corregida o no cualificada entre un riesgo medido durante 2 años con otroriesgo medido durante 3 años. La población de la que pueden obtenerse las observacionesabarca una amplia gama de posibilidades.

33. ¿Puede haber, realmente, muchas opciones para un denominador?

Sí. Por ejemplo, considere la pregunta: «¿Cuál es el riesgo de muerte como resultado de unaccidente de tráfico en Estados Unidos?». El denominador podría ser cualquiera de las siguien-tes cifras:■ Habitantes de Estados Unidos.■ Individuos implicados en accidentes de tráfico en Estados Unidos.■ Número de viajes realizados.■ Minutos pasados en un automóvil.■ Kilómetros recorridos.

Todos serían aceptables, pero las respuestas serían muy diferentes. Es particularmenteimportante tener en cuenta este hecho al comparar el riesgo con una actividad, como paracai-dismo, en el que hay un menor número de muertes globalmente, pero el número total de indivi-duos expuestos, la duración de la exposición y la distancia recorrida son mucho menores.

34. Proporcione un ejemplo de cómo los diferentes denominadores afectan al

riesgo calculado.

Las cifras siguientes son ficticias, y se relacionan con la mortalidad mientras se realiza buceocon escafandra y el nivel de preparación en una asociación de inmersión submarina (buceo):■ Hay 60.000 miembros activos en la asociación de buceadores.■ En un momento concreto, 12.000 de los buceadores de la asociación se hallan al comienzo

de su período de formación (alumnos).■ La duración promedio de una inmersión por cada alumno es de 20 minutos.■ Es típico que a un alumno se le exijan 20 inmersiones completas en 1 año para conseguir la

titulación o calificación.■ Una vez lograda la titulación, los miembros se sumergen como promedio 10 veces por año.■ La duración promedio de una inmersión por un miembro ya calificado es de 40 minutos.■ Hay 24 accidentes mortales en la actividad de inmersión submarina cada año, el 25% (6) de

los cuales afectan a alumnos.A la vista de estos datos, ¿se hallan los alumnos en mayor riesgo de sufrir un incidente

mortal?Si se toman las cifras referidas a los individuos por año como denominador, 6/12.000 =

5 por cada 10.000 alumnos tienen un accidente fatal cada año, y 1/48.000 = 3,75 por cada10.000 miembros calificados tienen un accidente fatal cada año. La conclusión sería que losalumnos se hallan en situación de mayor riesgo.

Si analizamos el ejemplo según las cifras de inmersiones por año, 6/(12.000 � 20) = 2,5por cada 100.000 inmersiones por alumnos producen un incidente fatal, y 18/(48.000 � 10) = 3,75 por cada 100.000 inmersiones por miembros calificados producen un incidente fatal. La conclusión, en este caso, sería que los miembros calificados se hallan en mayor riesgo.

Si analizamos las cifras de minutos de inmersión por año, 6/(12.000 � 20 � 20) = 1,25 acci-dentes mortales en 1 millón de minutos de inmersión por alumno, y 18/(48.000 � 10 � 40) =0,9375 muertes por cada 1.000.000 minutos de inmersión por miembros calificados. La con-clusión aquí sería que los alumnos se hallan en mayor riesgo.

Si se emplea el riesgo acumulativo de incidente mortal por inmersión, cada buceador habrásido alumno al principio, y luego puede aumentar su riesgo adicional mientras continúa bu-ceando como miembro calificado. La conclusión aquí sería que los miembros calificados sehallan en mayor riesgo durante un mayor período de tiempo.

DETERMINACIÓN DEL RIESGO 53

Page 57: Epidemiología y bioestadística secretos   nordness1ed

Es evidente que se requiere mucho sentido común, que debe aplicarse para decidir sobre eldenominador apropiado. El ejemplo anterior muestra lo difícil que puede ser demostrar demodo preciso lo que se pretende discutir.

35. ¿Qué es el riesgo atribuible?

El riesgo atribuible es el riesgo en el grupo de estudio, menos el riesgo en el grupo control.Puede calcularse a partir de la ecuación

Rs – Rc

Es la medida más apropiada de cambio en el riesgo cuando se toma una decisión para unindividuo, como, por ejemplo si resulta tolerable o no el riesgo de los efectos secundarios pro-ducidos por tomar un fármaco.

36. Proporcione un ejemplo de riesgo atribuible.

Si en un estudio se observa que el riesgo de fallecer a una edad media determinada es de 0,4y de 0,22 para un fumador y un no fumador, respectivamente, el riesgo atribuible al hecho defumar es de 0,4 – 0,22 = 0,18.

37. ¿Cuál es el porcentaje de riesgo atribuible?

Es el riesgo atribuible expresado como porcentaje del riesgo absoluto en el grupo de estudio,que puede calcularse a partir de la fórmula:

100% � (Rs – Rc)

Rs

La fórmula da la proporción de casos de enfermedad en investigación en la poblaciónexpuesta de la que es responsable el factor de riesgo.

38. Proporcione un ejemplo de porcentaje de riesgo atribuible.

En el estudio de fumadores de la pregunta 36, el porcentaje de riesgo atribuible es de (100% � 0,18)/0,4 = 45%.

39. ¿En qué difieren el riesgo relativo y el riesgo atribuible?

El riesgo relativo no proporciona información sobre el cambio real en la magnitud del riesgo,mientras que sí lo proporciona el riesgo atribuible. Por ello, el riesgo relativo tiene un empleolimitado en el momento de tomar decisiones sobre un individuo concreto. Las dos medidas sehallan relacionadas por la fórmula:

Riesgo atribuible = Rc � (riesgo relativo – 1)

Como se ha dicho anteriormente, el riesgo relativo se emplea muchas veces para valorar lafuerza de la asociación entre el factor de riesgo y el desenlace. Puede calcularse el valor aproxi-mado del riesgo relativo a partir de un estudio de casos y controles, mientras que no sucede lomismo con el riesgo atribuible. Además, el riesgo relativo es, con frecuencia, mejor indicadorde la interacción entre los diferentes factores de riesgo. Suele observarse la interacción comomultiplicador relativamente constante, a aplicar al riesgo relativo para cada factor de riesgoindividual.

40. Proporcione un ejemplo de cómo el riesgo relativo y el riesgo atribuible

difieren en su sensibilidad en relación con la magnitud de riesgo absoluto.

Si Rs es 0,075 y Rc es 0,05, el riesgo atribuible es 0,075 – 0,05 = 0,025, y el riesgo relativo es0,075/0,05 = 1,5.

DETERMINACIÓN DEL RIESGO54

Page 58: Epidemiología y bioestadística secretos   nordness1ed

Si Rs es 0,75 y Rc es 0,5, el riesgo atribuible es 0,75 – 0,5 = 0,25, pero, a pesar del aumentoen diez veces en el riesgo global, el riesgo relativo permanece sin cambios en 0,75/0,5 = 1,5.

41. ¿Cuál es el riesgo atribuible en la población?

El riesgo atribuible en la población predice la reducción en el riesgo alcanzable si se elimina unfactor de riesgo en una población. Se calcula multiplicando el riesgo atribuible por la prevalen-cia de exposición al factor de riesgo, y puede expresarse por la fórmula:

(Rs – Rc) � proporción de población expuesta

La proporción atribuible en la población es una medida de qué proporción de una enfermedaden una población es atribuible al factor de riesgo. Puede expresarse por medio de la fórmula:

(Rs – Rc ) � proporción de población expuesta

(Rs� proporción de población expuesta) + [Rc � (1 – proporción de población expuesta)]

Dado que el riesgo relativo es (RR) = Rs/Rc, la proporción atribuible a la población puedeexpresarse en términos de RR como sigue:

proporción de población expuesta � (RR – 1)

1 + [proporción de población expuesta � (RR – 1)]

Por ello, en las circunstancias adecuadas puede emplearse la posibilidad relativa para calcu-lar la proporción atribuible a la población. Puede expresarse la proporción como porcentajeatribuible a la población, multiplicando la fórmula por 100%, como sigue:

100% � (Rs – Rc) x proporción de población expuesta

(Rs � proporción de población expuesta) + [Rc � (1 – proporción de población expuesta)]

También puede calcularse en términos de riesgo relativo:

100% � [proporción de población expuesta � (RR – 1)]

1 + [proporción de población expuesta � (RR – 1)]

Todas estas medidas se emplean para comparar los efectos de posibles estrategias en saludpública.

42. Proporcione un ejemplo de la proporción atribuible en la población.

Considere un estudio de cohorte ficticio del riesgo de enfermedad por descompresión (DCI),tomado en 1 año, con 500 buceadores con una variación en la anatomía cardíaca conocidacomo foramen oval permeable (PFO) controlado, frente a 500 buceadores sin PFO.Los resultados se resumen así:

Es una creencia ampliamente extendida que el PFO, o cualquier otra derivación circulatoriade derecha a izquierda, aumenta el riesgo de DCI. Aproximadamente, el 30% de individuos dela población general tienen PFO, y algunos estudios han demostrado que una proporción simi-lar de buceadores tienen PFO.

DETERMINACIÓN DEL RIESGO 55

PFO Control

DCI 2 1

Sin DCI 498 499

Total 500 500

Page 59: Epidemiología y bioestadística secretos   nordness1ed

DETERMINACIÓN DEL RIESGO56

En este estudio, el riesgo absoluto de DCI con PFO es 2/500 = 0,004 y el riesgo absoluto deDCI en un individuo sin PFO es 1/500 = 0,002. El riesgo relativo es 0,004/0,02 = 2 y la posibili-dad relativa es 2/0,998 = 2.■ El riesgo atribuible es 0,004 – 0,002 = 0,002.■ El porcentaje de riesgo atribuible es 0,002/0,004 = 50%.■ El riesgo atribuible a la población es 0,002 � 0,3 = 0,0006.■ La proporción atribuible a la población es 0,0006/[(0,004 � 0,3) + (0,002 � 0,7)] =

0,0006/(0,0012 + 0,0014) = 0,0006/0,0026 = 0,23.El porcentaje atribuible a la población será del 23%. De modo que, de acuerdo con estos

resultados, el cierre de rutina del PFO en los buceadores reduciría el riesgo global de DCI en un23% en esta población.

PUNTOS CLAVE: DETERMINACIÓN DEL RIESGO

1. El riesgo absoluto es la probabilidad de un suceso, como una enfermedad, lesión o muerte.

2. El riesgo absoluto no proporciona una indicación de cómo esta magnitud se compara con otras.

3. La posibilidad relativa se aproxima notablemente al riesgo relativo, si la enfermedad es infrecuente.

4. Se emplean la posibilidad relativa y el riesgo relativo entre un factor de riesgo y el desenlace paravalorar la fuerza de la asociación.

5. Para tomar decisiones basadas en el riesgo en relación con individuos se emplea el riesgo atribuible.

6. Para informar en las decisiones de salud pública, se emplean las medidas del riesgo atribuible a la población.

43. ¿Qué sucede si el grupo control difiere del grupo de estudio en algunas

características (distintas del factor de riesgo en investigación) que podrían

influir sobre el desenlace de interés?

No es infrecuente que características tales como la edad y el sexo influyan sobre el desenlace,con independencia del factor de riesgo que se está estudiando. Por ejemplo, en estudios demortalidad cardiovascular, se esperaría que fallecieran menos individuos en una poblaciónmás joven con una mayor proporción de mujeres. En tales casos, podría ser necesaria unamodificación de los valores de la posibilidad relativa para que explicasen las diferencias en lasmuestras.

44. ¿Qué técnicas pueden utilizarse para conseguir que la posibilidad relativa sea

más representativa?

Una técnica es el emparejamiento por estratos, en la que se extrae el mismo número de casosy controles por cada grupo de edad y sexo. Otra técnica es calcular la posibilidad relativa encada grupo, y luego sumarlas.

45. ¿Cómo se calcula la posibilidad relativa en un estudio de casos y controles

con controles pareados?

En los estudios de casos y controles se seleccionan con frecuencia para cada caso controlespareados en edad y sexo. En ocasiones, se selecciona más de un control pareado para cadacaso, con el fin de realzar la significación estadística. Puede tabularse la información resultanteen el siguiente formato:

Page 60: Epidemiología y bioestadística secretos   nordness1ed

DETERMINACIÓN DEL RIESGO 57

En este caso, se calcula la posibilidad relativa a partir de b/c. Si desea realmente compren-der por qué debería ser así, lea un gran libro de referencia, y luego hágamelo saber.

Controles

Factor de riesgo Factor de riesgo

presente ausente

Casos Factor de riesgo presente a b

Factor de riesgo ausente c d

BIBLIOGRAFÍA

1.• Bland M: An Introduction to Medical Statistics. New York, Oxford University Press, 1995.2.• Daly LE, Bourke GJ: Interpretation and Uses of Medical Statistics, 5th ed. Oxford, Blackwell Science Ltd.,

2000.3.• Gigerenzer G: Calculated Risks: How to Know When Numbers Deceive You. New York, Simon & Schuster,

2002.4.• Kirkwood BR: Essentials of Medical Statistics. Oxford, Blackwell Science Ltd., 1988.

PÁGINAS WEB

1. http://www. amstat.org/sections/epi/SIE_Home.htm

2. http://www.biostat.ucsf.edu/epidem/epidem.html

Page 61: Epidemiología y bioestadística secretos   nordness1ed

59

FUENTES DE DATOS Y VIGILANCIAMichael D. Lappi, DO, PhD

1. ¿Qué es un estudio tipo encuesta?

Es un método para monitorizar conductas asociadas con enfermedad, atributos que afectan alriesgo de enfermedad, conocimiento o actitudes que influyen sobre las conductas de salud,empleo de los servicios sanitarios e incidencia de enfermedades autonotificadas. En general,los estudios tipo encuesta son relativamente baratos, y proporcionan un método fiable y repro-ducible para recoger información a partir de un conjunto de individuos.

2. Enumere algunas de las debilidades de las encuestas.

Primera, las encuestas no emplean el método científico en su diseño y ejecución. Además, lasencuestas son clásicamente un instrumento transversal para recoger información, lo que signi-fica que los datos sobre exposición y desenlace se recogen al mismo tiempo. En los estudiostransversales es imposible asegurar cualquier información sobre la relación temporal entre unfactor de riesgo potencial y un desenlace. El sesgo también puede ser un problema importanteen la recogida e interpretación de los datos de la encuesta.

3. ¿Qué tipos de enfermedades tienden a identificar las encuestas?

Las encuestas tienden a identificar enfermedades tanto crónicas como menos graves, por lasencilla razón de que las personas tienen una mayor probabilidad de estar presentes y lo sufi-cientemente sanas como para responder a la pregunta, en comparación con las personas quesufren enfermedades graves rápidamente progresivas.

4. ¿Cuáles son algunos ejemplos de encuestas?

Un ejemplo de una encuesta común es el estudio transversal, por el cual puede ser estudia-da una población diversa en un momento concreto. Ejemplos bien conocidos de encuestasson un censo, que estudia una gran población, y una votación, que se centra en objetivos políticos.

5. Explique la vigilancia.

La vigilancia es la recogida, análisis y diseminación de los datos de enfermedad, de modo sis-temático, que atañen a grupos de personas, y se diseña para detectar signos precoces deenfermedad. La vigilancia se lleva a cabo a muchos niveles en relación con una gran variedadde poblaciones, y ésta es una piedra angular de la medicina preventiva.

6. ¿Cuál es la finalidad principal de la vigilancia médica?

Prevenir la enfermedad y la lesión y, en último término, mejorar la calidad de vida.

7. ¿Cuáles son los distintos tipos de vigilancia?

Un modo de describir los sistemas de vigilancia es clasificarlos como activos o pasivos.

CAPÍ

TULO

4

Page 62: Epidemiología y bioestadística secretos   nordness1ed

8. Describa una vigilancia activa.

La vigilancia activa requiere esfuerzos de personal dedicado y, típicamente, una gestión fre-cuente de las fuentes de recogida de datos para identificar los casos. Por los niveles de esfuer-zo requeridos se efectúa la vigilancia activa sobre un tema seleccionado durante un período detiempo limitado. La vigilancia activa es mucho más cara que la vigilancia pasiva.

9. Indique algunos ejemplos de vigilancia activa.

Dos ejemplos son los estudios actualmente en progreso Framingham Heart Study y el Nurse’sHealth Study.

10. Describa la vigilancia pasiva.

En contraste con la vigilancia activa, la vigilancia pasiva se basa en la notificación oportuna ycuidadosa de la enfermedad a los organismos o agencias apropiadas. La vigilancia pasiva seemplea con mucha mayor frecuencia, y parte del supuesto de que la información requeridaserá suministrada siguiendo las órdenes del médico, personal clínico, centro médico, laborato-rio u otra parte responsable.

FUENTES DE DATOS Y VIGILANCIA60

11. ¿Cuál es el ejemplo más ampliamente utilizado de la vigilancia pasiva?

El ejemplo más habitual de vigilancia pasiva es la recogida de enfermedades de declaraciónobligatoria por organismos locales, estatales y federales, y la tabulación de tales datos (en EE.UU.) por los Centers for Disease Control and Prevention (CDC), publicados en el Morbi-dity and Mortality Weekly Report.

12. Defina una tasa basal.

Una tasa basal consta de datos presentados clásicamente como tasas de incidencia en eltiempo, que describen patrones previos de los procesos patológicos estudiados para estable-cer sucesos típicos bajo los parámetros necesarios. Los ejemplos de los temas estudiadospor medio de las tasas basales pueden oscilar desde aspectos tan sencillos como el númerode días de enfermedad registrados en un grupo determinado durante el curso de los últimos5 años, hasta aspectos como el número de casos de cáncer en este mismo grupo durante unperíodo de 5 años.

PUNTOS CLAVE: ENCUESTAS Y VIGILANCIA

1. Las encuestas son un modo eficaz para recoger información, aunque no emplean el métodocientífico.

2. Las encuestas tienen una mayor probabilidad de recoger información sobre procesos crónicos o menos graves.

3. El objetivo de la vigilancia es prevenir la enfermedad y la lesión.

4. La vigilancia es la piedra angular de la práctica de la salud pública.

5. Los datos de vigilancia posibilitan la estimación de las tasas basales.

Page 63: Epidemiología y bioestadística secretos   nordness1ed

13. ¿Qué información se ha de considerar al examinar los datos basales

y las tendencias?

Los datos notificados pueden ser indicativos de un cambio en la incidencia de un desenlaceparticular. Sin embargo, siempre se debe considerar si ha habido un cambio en el modo en quese define, se detecta o se notifica el desenlace particular durante el período en cuestión.

14. ¿De qué modo son útiles las tasas basales?

Fijan los estándares frente a los que se comparan todos los sucesos futuros de un tema con-creto (p. ej., días de enfermedad o cáncer) para detectar así sucesos atípicos. Este hechosubraya la importancia de la vigilancia: sin datos basales o de partida, no habría estándar opatrón para la comparación.

15. ¿Qué son las tendencias seculares?

Son sucesos de desenlaces de salud de interés en el tiempo, clásicamente en años. La Figura 4-1ilustra una tendencia en el número de casos del síndrome de inmunodeficiencia adquirida (sida)entre 1984 y 1993, y también el efecto de cambiar la definición de caso. Si no se supiese que ladefinición de caso de sida se cambió en 1993, se podría suponer, de modo erróneo, un cambionotable en la basal (es decir, número esperado de casos).

FUENTES DE DATOS Y VIGILANCIA 61

Figura 4-1. Casos de sida por trimestres anuales notificados en Estados Unidos, 1984-1993. *En octubrede 1987 se revisaron las definiciones de caso y los criterios diagnósticos. †En 1993 se revisó de nuevo ladefinición de caso. (De los CDC: Update: Trends in AIDS and reporting under de expanded surveillancedefinition for adolescents and adults – United States, 1993. MMWR 43[32]:826-828, 1994.)

Año

1984

40

30

20

10

0

1985 1986 1987 1988 1989 1990 1991 1992 1993

Caso

s (m

iles)

16. ¿Qué son las estadísticas vitales?

Son sucesos críticos en la vida de un individuo. En Estados Unidos, estos sucesos son el naci-miento, la muerte, el matrimonio, el divorcio y la muerte fetal. Estos datos se recogen inicial-mente a nivel local, y se remiten al estado. A nivel estatal, se resume esta información y, des-pués, se informa al National Center for Health Statistics (NCHS).

17. Explique la finalidad del National Center for Health Statistics (NCHS).

¿Qué datos recoge?

El NCHS es la rama de los CDC designada como punto focal en la recogida de las estadísticasvitales en Estados Unidos. La información contenida en los certificados de nacimiento y de

Page 64: Epidemiología y bioestadística secretos   nordness1ed

defunción de los estados, el número y características de nacimientos y fallecimientos, y losmatrimonios y divorcios son rastreados por el NCHS. Se considera que la recogida de estosdatos es responsabilidad nacional; los datos son remitidos, en último término, a las NacionesUnidas.

18. ¿Qué es el censo de Estados Unidos? ¿Cuáles son sus características?

El censo de Estados Unidos es un programa federal establecido en 1790 para caracterizar ycuantificar la población de los estados, principalmente con fines de impuestos y del cumpli-miento del servicio militar. En el primer censo se hacían sólo seis preguntas: nombre del cabezade familia; número de personas que vivían en el hogar; número de varones blancos libres, de 16 o más años, que vivían en el hogar; número de varones blancos libres menores de 16 añosque vivían en el hogar, y sexo y color de todas las personas restantes que vivían en el hogar.

19. ¿Con qué frecuencia se lleva cabo el censo en Estados Unidos?

Es un proceso obligado por la Constitución estadounidense que comienza cada 1 de abril delos años terminados en cero, y los resultados se informan clásicamente en 1 a 2 años. Aunqueel censo ofrece una valoración razonable de las características demográficas de la población, la validez de los resultados se basa directamente en la calidad de los datos remitidos.

20. ¿Qué información se recoge durante el censo? ¿De quién?

La información del censo se recoge de cada uno de los hogares de Estados Unidos, según unaidentificación por medio de una red extensa de referencias por ordenador, incorporando losdatos del censo, listas de direcciones del gobierno, y sistemas de direcciones del Servicio Pos-tal de Estados Unidos. Además, los trabajadores del censo identifican físicamente a la cuartaparte de los vivos no reconocidos por este proceso, por medio de una recogida de datos depuerta a puerta.

Hay dos versiones del censo: un formulario corto y otro más largo, más detallado. En gene-ral, uno de cada seis hogares recibe la versión más larga. Si no se rellena el censo y se remiteen la fecha requerida, un trabajador del censo realizará una visita a dicho hogar. El trabajadorpreguntará verbalmente las cuestiones al cabeza de familia del hogar, y rellenará las respuestasapropiadas en un formulario impreso. En la Tabla 4-1 se muestra el cuestionario del formulariomás largo del censo de 2000.

21. Identifique los defectos potenciales del sistema del censo.

Éstos son los aspectos en relación con la validez del foco del censo en la irregularidad geográ-fica y variabilidad de las preguntas. Dado que existe una fluctuación casi constante en lascaracterísticas de crecimiento en un área dada, el censo no puede utilizar límites geográficosestándares o resultados base de acuerdo con un código postal. De modo similar, los cuestiona-rios del censo se hacen a medida para considerar áreas relevantes a la administración delgobierno presente y, por consiguiente, no son directamente comparables de censo a censo.

22. ¿Cuál es la población actual de Estados Unidos a tenor del censo de 2000?

Según el censo de 2000, la población de Estados Unidos es de 281.421.906 habitantes, lo querepresenta un aumento del 13,2% (es decir, un crecimiento de 32.712.033 personas) de lapoblación con respecto a los resultados previos, descritos en 1990.

23. Describa la red de enfermedades notificables primarias administrada por

los CDC.

El National Notifiable Disease Surveillance System (NNDSS) es responsable de la recogida deestos datos a partir de médicos, hospitales, clínicas y laboratorios. El sistema está diseñado

FUENTES DE DATOS Y VIGILANCIA62

Page 65: Epidemiología y bioestadística secretos   nordness1ed

para rastrear datos a partir del punto de notificación a los departamentos de salud locales yestatales y, por último, a los CDC en Atlanta, Georgia.

24. ¿Cuáles son las enfermedades de declaración obligatoria, definidas por

los CDC, en Estados Unidos en 2005?

Véase la Tabla 4-2.

25. ¿Cuál es la finalidad de la sección National Center for Injury Prevention

and Control (NCIPC) de los CDC?

Su función es reducir la morbilidad, la discapacidad, la mortalidad y los costes asociados conlas lesiones.

26. Liste las cinco áreas de interés principales del NCIPC.

■ Maltrato a los niños. ■ Suicidio.■ Violencia de la pareja. ■ Violencia en los jóvenes.■ Violencia sexual o de género.

27. ¿De qué estudios es responsable el National Center for Health Statistics

(NCHS)?

■ National Health and Nutrition Examination Survey (NHANES): recoge datos sobre la preva-lencia de enfermedades y afecciones crónicas (incluidas las afecciones no diagnosticadas),factores de riesgo, estado de alimentación y nutrición, estado de inmunización, prevalenciade enfermedades infecciosas, seguros de enfermedad, y medidas de exposiciones medio-ambientales.

■ National Health Care Survey (NHCS): obtiene información sobre los centros encargados deprestar la atención sanitaria, los servicios prestados y las características de los pacientesatendidos.

FUENTES DE DATOS Y VIGILANCIA 63

TA B L A 4 - 1 . F O R M U L A R I O L A R G O D E L C E N S O D E E S TA D O S U N I D O S D E L A Ñ O 2 0 0 0

Población

Abuelos como cuidadores

Ascendencia

Discapacidad

Estado conyugal

Estado de veterano

Estado laboral

Estado laboral en 1999

Ingreso en 1999

Ingreso escolar y nivel educativo conseguido

Lengua hablada en el hogar y capacidad para

hablar inglés

Lugar de nacimiento, ciudadanía y año de entrada

Lugar de trabajo y viaje al trabajo

Migración (residencia en 1995)

Profesión, industria y clase de trabajador

Hogar

Año de construcción de la estructura

Año de mudanza a la residencia

Combustible para calefacción

Coste de los servicios, hipoteca, impuestos,

seguros y combustible

Instalación sanitaria y cocina

Número de habitaciones y número de

dormitorios

Residencia en granja

Servicio telefónico

Unidades de la estructura

Valor del hogar o renta pagada mensualmente

Vehículos disponibles

Page 66: Epidemiología y bioestadística secretos   nordness1ed

FUENTES DE DATOS Y VIGILANCIA64

TA B L A 4 - 2 . E N F E R M E DA D E S D E D E C L A R A C I Ó N O B L I G ATO R I A ( C D C , E E . U U . )

AIDS (sida)

Botulismo■ Botulismo distinto (herida

e inespecificado)■ Botulismo en el lactante■ Botulismo vehiculado por alimentos

Brucelosis

Carbunco

Chancroide

Ciclosporiasis

Coccidioidomicosis

Cólera

Criptosporidiosis

Difteria

Ehrlichiosis■ Ehrlichiosis humana granulocítica ■ Ehrlichiosis humana monocítica ■ Ehrlichiosis humana, otra, o agente

no especificadoEscherichia coli enterohemorrágicoEscherichia coli enterohemorrágico,

O157:H7Escherichia coli enterohemorrágico,

productor de la toxina shiga (no seroagrupado)

Escherichia coli enterohemorrágico, productor de toxina shiga, serogrupo distinto al O157

Enfermedad de Hansen (lepra)

Enfermedad de Lyme

Enfermedad estreptocócica invasiva, grupo A

Enfermedad meningocócica

Enfermedad por coronavirus asociada con el

síndrome respiratorio agudo grave

(SARS-CoV)

Enfermedades neuroinvasivas

y no neuroinvasivas por arbovirus■ Enfermedad por el virus de la encefalitis

de St. Louis■ Enfermedad por el virus de la encefalitis

equina del Este

■ Enfermedad por el virus de la encefalitis equina del Oeste

■ Enfermedad por el virus del NiloOccidental

■ Enfermedad por el virus Powassan ■ Enfermedades por virus del serogrupo

CaliforniaFiebre manchada de las Montañas RocosasFiebre QFiebre tifoideaGiardiasisGonorreaHaemophilus influenzae, enfermedad invasivaHepatitis vírica aguda

■ Hepatitis A, aguda■ Hepatitis B, aguda■ Virus de la hepatitis B, infección perinatal

Hepatitis vírica crónica■ Hepatitis B crónica■ Infección por el virus de la hepatitis C

(pasada o presente)Infección por el virus de la inmunodeficiencia

humana (VIH)■ Infección por el VIH, adulto (• 13 años)■ Infección por el VIH, pediátrica (< 13 años)

Infecciones genitales por Chlamydia trachomatisLegionelosisListeriosisMalariaMortalidad pediátrica asociada con la gripePaperasPestePoliomielitis paralíticaPsitacosisRabia

■ Rabia animal■ Rabia humana

RubéolaRubéola, síndrome congénitoSalmonelosisSarampiónShigelosis

Page 67: Epidemiología y bioestadística secretos   nordness1ed

TA B L A 4 - 2 . E N F E R M E DA D E S D E D E C L A R A C I Ó N O B L I G ATO R I A ( C D C , E E . U U . ) ( C o n t . )

Sífilis■ Neurosífilis■ Sífilis latente■ Sífilis latente de duración desconocida■ Sífilis primaria■ Sífilis secundaria■ Sífilis tardía latente■ Sífilis tardía, no neurológica■ Sífilis temprana latente

Sífilis congénita■ Mortinato sifilítico

Síndrome del shock tóxicoSíndrome del shock tóxico estreptocócicoSíndrome hemolítico urémico, posdiarreicoSíndrome pulmonar por Hantavirus

FUENTES DE DATOS Y VIGILANCIA 65

Staphylococcus aureus intermedio a la vancomicina (VISA)

Staphylococcus aureus resistente a la vancomicina (VRSA)

Streptococcus pneumoniae, invasiva, en niñosmenores de 5 años

Streptococcus pneumoniae, resistente a los antibióticos, enfermedad invasiva

TétanosTos ferinaTriquinosisTuberculosisTularemiaVaricela (morbilidad)Varicela (muertes solamente)Viruela

■ National Health Interview Study (NHIS): estudio anual de ámbito nacional de, aproximada-mente, 36.000 hogares en Estados Unidos; es una fuente de información principal sobre lasalud de la población civil no institucionalizada.

■ National Immunization Survey (NIS): estudio por marcación telefónica aleatoria asistido porlista telefónica, que comenzó a recoger datos en abril de 1994 para monitorizar la inmuniza-ción en niños.

■ National Survey of Family Growth (NSFG): la finalidad principal del estudio de 1973-1995fue aportar datos nacionales fiables sobre matrimonios, divorcios, anticoncepción, infertili-dad y salud en mujeres y lactantes en Estados Unidos.

■ State and Local Area Integrated Telephone Survey (SLAITS): complementa las estrategiasde recogida de datos actuales al aportar datos estatales y locales en profundidad, para satis-facer varias necesidades de programas y políticas en nuestro sistema de atención sanitaria,siempre cambiante.

28. ¿Cómo emplea el NCHS la información que obtienen en estos estudios?

Tal como describe el NCHS, estas estadísticas le permiten hacer lo siguiente:■ Documentar el estado de salud de la población y el de subgrupos importantes.■ Identificar disparidades en el estado de salud y en el empleo de los sistemas sanitarios por

raza y etnia, estado socioeconómico, región y otras características poblacionales.■ Describir las experiencias en relación con el sistema de atención sanitaria.■ Monitorizar las tendencias en el estado de salud y en la prestación de la atención sanitaria.■ Identificar problemas de salud.■ Apoyar la investigación de los servicios biomédicos y sanitarios.■ Proporcionar información para realizar cambios en las políticas y programas públicos.■ Evaluar el impacto de las políticas y programas de salud.

29. ¿Cuál es el estudio mundial más amplio llevado a cabo por teléfono?

El Behavioral Risk Factor Surveillance System (BRFSS), que rastrea los riesgos de la salud enEstados Unidos. El cuestionario del BRFSS está diseñado por un grupo de coordinadores esta-tales y por personal de los CDC.

Page 68: Epidemiología y bioestadística secretos   nordness1ed

30. ¿Cuáles son las partes del estudio BRFSS?

En la actualidad, el cuestionario tiene tres partes: 1) el componente central, que consta de unnúcleo fijo, el núcleo rotador y el núcleo emergente; 2) módulos opcionales, y 3) cuestionesañadidas por los estados. Todos los departamentos de salud deben realizar las cuestiones delcomponente central sin modificación en el enunciado de las palabras; sin embargo, los módu-los son opcionales.

31. Describa el componente central del BRFSS.

El núcleo fijo es un grupo estándar de cuestiones preguntadas por todos los estados. Incluyepreguntas sobre conductas actuales que afectan a la salud (p. ej., consumo de tabaco y alcohol,actividad física, búsqueda de atención médica preventiva) y cuestiones sobre característicasdemográficas. El núcleo rotador está compuesto de dos grupos de preguntas distintos, cadauna de ellas preguntadas en años alternos por todos los estados, y trata sobre temas diferentes.

32. ¿Pueden modificar los estados las porciones opcionales del estudio?

No. Los módulos opcionales de los CDC son conjuntos de cuestiones sobre temas específicos(p. ej., tabaco sin humo) que los estados eligen utilizar en sus cuestionarios. Aunque losmódulos son opcionales, los estándares de los CDC requieren que, en caso de incluirlos, debenser utilizados sin modificación alguna. Los temas de los módulos han incluido aspectos delestudio sobre tabaco sin humo, salud oral, enfermedad cardiovascular y armas de fuego.

33. ¿Cuál es la finalidad de un registro de enfermedades?

Un registro de enfermedades se diseña para focalizarse en una afección o enfermedad específi-ca, con el fin de rastrear características notificables para su análisis e investigación posterio-res. Las enfermedades clásicas rastreadas en los registros incluyen el cáncer y los defectoscongénitos al nacimiento. El Occupational Lung Disease Registry y el Occupational DiseaseRegistry catalogan y siguen enfermedades asociadas con el lugar de trabajo.

34. ¿Se utilizan los registros solamente para rastrear enfermedades?

No. De hecho, se utilizan también, por ejemplo, los registros de gemelos, con el fin de delimitarentre las causas ambientales y las genéticas de diferentes enfermedades, así como la saludy bienestar generales.

35. ¿Cuál es la finalidad de la Agency for Toxic Substances and Disease Registry

(ATSDR)?

La ATSDR actúa como el principal organismo de salud pública para ejecutar las disposicionesrelacionadas con la salud del Superfund (Superfondo) (Comprehensive Environmental Res-ponse, Compensation, and Liability Act de 1980). La ATSDR tiene la misión de valorar los ries-gos sobre la salud en diferentes sitios de desechos peligrosos, ayudando a prevenir o reducirla exposición a enfermedades resultantes, y de aumentar el conocimiento y comprensión de losefectos de la salud que pueden producirse por la exposición a sustancias peligrosas.

36. ¿Quién controla los datos recogidos en los programas sanitarios federales

como Medicare y Medicaid?

Los Centers for Medicare & Medicaid Services (CMS) constituyen un organismo federal dentrodel Department of Health and Human Services de Estados Unidos, dedicados a la operación deprogramas federales seleccionados. Entre los programas de los que es responsable el CMSfiguran Medicare, Medicaid, el State Children’s Health Insurance Program (SCHIP), el HealthInsurance Portability and Accountability Act of 1996 (HIPAA), y los Clinical Laboratory Impro-vement Amendments (CLIA).

FUENTES DE DATOS Y VIGILANCIA66

Page 69: Epidemiología y bioestadística secretos   nordness1ed

El Medicare Current Beneficiary Survey (MCBS), un ejemplo de estudio dentro del CMS, esla única fuente extensa de características de salud en relación con el espectro total de los bene-ficiarios de Medicare.

37. ¿Quién controla los datos médicos obtenidos por la U.S. Military

and the Veterans Administration? ¿Qué información recogen?

El Defense Medical Surveillance System (DMSS) es el depositario central de los datos de vigi-lancia médica en relación con las Fuerzas Armadas. Los datos del DMSS documentan los esta-dos y los cambios en las características demográficas y militares (p. ej., servicio, graduación yocupación militar) de todos los miembros en servicio. Además, documentan experiencias mili-tares significativas (p.ej., asignaciones y despliegues mayores) y médicas (p. ej., visitas a clíni-cas ambulatorias, hospitalizaciones, inmunizaciones y fallecimientos) de los miembros en ser-vicio en el transcurso de sus carreras militares.

El DMSS recibe datos de múltiples fuentes, y los integra en una base de datos de relaciónque se expande continuamente. Se establecen registros longitudinales y constantementeactualizados sobre todos los individuos que han servido en las Fuerzas Armadas desde 1990.Las categorías de especial interés son los despliegues mayores, las valoraciones del estado desalud antes y después del despliegue, las hospitalizaciones (en centros médicos militares fijos)y las visitas ambulatorias (a instalaciones médicas militares fijas). El DMSS mantiene tambiénun depósito central de muestras serológicas.

38. ¿Qué es el Bureau of Labor Statistics?

Bajo el U.S. Department of Labor, el Bureau of Labor Statistics es el principal organismo querecopila datos para el Gobierno Federal en el amplio campo de los aspectos económicos yestadísticos del trabajo. Proporciona una cantidad importante de información en todos losaspectos de la fuerza laboral de Estados Unidos, incluidos temas como la inflación, los sala-rios, la productividad, la salud, los datos demográficos y el desempleo.

39. ¿Qué rama del U.S. Department of Labor se centra en la seguridad

del trabajador?

La Occupational Safety and Health Administration (OSHA). Su misión es velar por la seguridady la salud de los trabajadores estadounidenses, al fijar y hacer cumplir las normas, aportar pre-

FUENTES DE DATOS Y VIGILANCIA 67

PUNTOS CLAVE: FUENTES DE DATOS

1. El National Center of Health Statistics (NCHS) es la rama de los Centers for Disease Control andPrevention (CDC) responsable de la recogida de las estadísticas vitales.

2. El censo de Estados Unidos es un programa federal que se lleva a cabo cada década con dosversiones, una larga y otra corta. Aproximadamente, un sexto de los hogares reciben la versiónlarga.

3. El CDC tiene una lista definida de enfermedades de declaración obligatoria, que se recogen bajo el National Notifiable Disease Surveillance System (NNDSS).

4. La misión del National Center for Injury Prevention and Control (NCICP) es reducir la morbilidad, la mortalidad, la discapacidad y los costes asociados con la lesión.

5. El Bureau of Labor Statistics (BLS), bajo el Department of Labor, recoge datos relacionados con el trabajo sobre inflación, salarios, productividad, salud, características demográficas y desempleo.

Page 70: Epidemiología y bioestadística secretos   nordness1ed

*Por 100.000 trabajadores. No se han calculado las tasas en relación con las categorías «desconocido» o «no clasi ficado».

TA B L A 4 - 3 . N Ú M E R O Y TA S A * D E M U E RT E S P O R T R A U M AT I S M O L A B O R A L . P O R S E X O , R A Z A Y G R U P O E TA R I O . E S TA D O S U N I D O S , 1 9 8 0 - 1 9 9 7

Característica

Sexo

Hombre

Mujer

Desconocido

Raza

Blanca

Negra

Otra

Desconocida

Grupo etario (años)

16-17

18-19

20-24

25-34

35-44

45-54

55-64

≥ 65

Desconocida

Total

paración, alcance e instrucción, establecer asociaciones y alentar a la mejora continua en la

seguridad y salud en el puesto de trabajo.

40. Cite el organismo federal responsable de efectuar investigaciones

y de realizar recomendaciones sobre la prevención de las lesiones

y enfermedades relacionadas con el puesto de trabajo.

El National Institute for Occupational Safety and Health (NIOSH). Es parte del CDC Department

of Health and Human Services y no tiene poderes ejecutivos.

41. Desglose el número y tasa de muertes laborales en Estados Unidos por sexo,

raza y grupo etario.

Véase la Tabla 4-3.

FUENTES DE DATOS Y VIGILANCIA68

Tasa

8,6

0,8

5,0

5,6

4,8

2,1

3,8

4,5

4,7

4,5

5,2

6,9

13,3

5,1

N.º

97.053

6.886

6

88.392

11.478

3.167

908

969

2.714

10.791

26.390

22.881

18.213

14.108

7.779

100

103.945

(%)

(93)

(7)

(< 1)

(85)

(11)

(3)

(1)

(1)

(3)

(10)

(25)

(22)

(18)

(14)

(7)

(< 1)

(100)

42. Compare el número de lesiones laborales fatales en Estados Unidos durante

los años 1992-2003.

Véase la Figura 4-2.

Page 71: Epidemiología y bioestadística secretos   nordness1ed

FUENTES DE DATOS Y VIGILAN

CIA69

Figura 4-2. Número de accidentes laborales con muerte en Estados Unidos, 1992-2003. El número de muertes laborales, 5.559, registradas en 2003 representanun pequeño aumento con relación al total revisado en 2002. Los casos de 2001 excluyen los casos mortales registrados el 11 de septiembre por los ataques terro-ristas. (Fuente: U.S. Department of Labor, Bureau of Labor Statistics, Census of Fatal Occupational Injuries, 2003.)

1992

6.800

6.600

6.400

6.200

6.000

5.800

5.600

5.400

5.200

5.000

4.800

1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003

6.217

6.331

6.632

6.2756.202

6.238

6.055 6.0545.920 5.915

5.534 5.559

Page 72: Epidemiología y bioestadística secretos   nordness1ed

43. ¿Qué industrias tienen, históricamente, el mayor número de muertes laborales?

■ Construcción (19.179 muertes, o 19% de los fallecimientos notificados).■ Transporte, comunicaciones y servicios públicos (17.489 o 17% de los fallecimientos

notificados).■ Manufacturación (15.490 o 15% de los fallecimientos notificados).

44. ¿Qué industrias tienen, históricamente, las tasas más elevadas de mortalidad

laboral?

■ Minería (30 muertes por cada 100.000 trabajadores).■ Agricultura, ingeniería forestal y pesca (19 muertes por cada 100.000 trabajadores).■ Construcción (15 muertes por cada 100.000 trabajadores).

45. ¿Qué industrias tuvieron el mayor número de muertes laborales en 2003?

■ Construcción (1.126 muertes).■ Transporte y almacenes (805 muertes).■ Agricultura, ingeniería forestal pesca y caza (707 muertes).

46. ¿Qué industrias tuvieron las mayores tasas de mortalidad laboral en 2003?

■ Agricultura, ingeniería forestal, pesca y caza (31,2 muertes por cada 100.000 traba-jadores).

■ Minería (26,9 muertes por cada 100.000 trabajadores).■ Transporte y almacenes (17,5 muertes por cada 100.000 trabajadores).

La Figura 4-3 resume el número y la tasa de las lesiones laborales fatales por sectoresindustriales en 2003.

47. ¿Qué estados tienen, históricamente, las cifras y tasas más elevadas de

muerte laboral?

El mayor número de lesiones laborales fatales se ha producido en California (10.712 muertes,o 10% del total de las lesiones laborales fatales en EE.UU.), Texas (10.294, o 10%),Florida (6.269, o 6%), Illinois (4.582, o 4%), y Pensilvania (4.402, o 4%). Las tasas más eleva-das por lesiones laborales fatales se han dado en Alaska (22,7 por cada 100.000 trabajadores),Wyoming (15,8% por cada 100.000), Montana (11,8 por cada 100.000), Idaho (10,4 por cada100.000) y Virginia Occidental (10,1 por cada 100.000).

48. ¿Qué estados tuvieron el mayor número de lesiones laborales fatales en 2002?

En 2002, el mayor número de lesiones laborales fatales se produjo en California (478 muertes),Texas (417 muertes), Florida (354 muertes), Ohio (202 muertes), Georgia (197 muertes),Illinois (190 muertes) y Pensilvania (188 muertes). (Véase la Tabla 4-4.)

49. ¿Qué característica vital del trabajador dio cuenta de la mayoría de las

muertes laborales en Estados Unidos desde 1992 a 2002?

Aunque las razas, sexos, edades y estado de empleo de estos trabajadores, ciertamente, com-prenden una lista panabarcativa, la mayoría de los sucesos fatales laborales en Estados Unidosdesde 1992 a 2003 se produjeron en varones blancos asalariados de edades comprendidasentre 25 y 34 años (Véase la Tabla 4-5.)

50. ¿De qué información se dispone en relación con las iniciativas de salud a nivel

mundial?

La Organización Mundial de la Salud (OMS) proporciona una amplia gama de información útilen relación con numerosos programas de salud en todo el mundo. El mejor modo de acceder a

FUENTES DE DATOS Y VIGILANCIA70

Page 73: Epidemiología y bioestadística secretos   nordness1ed

FUENTES DE DATOS Y VIGILAN

CIA71

Figura 4-3. Número y tasa de lesiones laborales fatales por sectores industriales en 2003. Aunque el sector de la construcción registró el mayor número de lesioneslaborales fatales, las mayores tasas de mortalidad por accidente se dieron en agricultura, ingeniería forestal, pesca y caza. (Fuente: http://www.bls.gov/iif/oshwc(cfoi/cfch0002.pdf.)

Construcción

Transporte y almacenes

Agricultura, ingeniería forestal, pesca y caza

Gobierno

Servicios profesionales y negocios

Industria manufacturera

Comercio al por menor

Tiempo libre y hospitalidad

Otros servicios (excepto administr. pública)

Comercio al por mayor

Servicios educativos y sanitarios

Minería

Actividades financieras

Información

Servicios

Número de accidentes mortales Tasa de letalidad (por 100.000 trabajadores)

1.250 1.000 750 500 250

32

64

130

141

143

191

194

274

343

416

452

532

707

805

1.126

3,7

1,8

1,4

26,9

0,8

4,2

2,8

2,4

2,1

2,5

3,3

2,5

31,2

17,5

11,7

0 10 20 30 40

Page 74: Epidemiología y bioestadística secretos   nordness1ed

FUENTES DE DATOS Y VIGILAN

CIA72

TA B L A 4 - 4 . I N C I D E N T E S L A B O R A L E S FATA L E S , P O R E S TA D O D E L I N C I D E N T E

Características

Total

Estado del incidente

Alabama

Alaska

Arizona

Arkansas

California

Colorado

Connecticut

Delaware

Distrito de Columbia

Florida

Georgia

Hawai

Idaho

Illinois

Indiana

Iowa

Kansas

Kentucky

Louisiana

Maine

2002

5.534

102

42

101

80

478

123

39

11

8

354

197

24

39

190

136

57

89

146

103

30

1992

6.217

145

91

67

82

644

103

42

11

8

329

204

28

45

250

148

110

82

117

153

19

1993

6.331

138

66

55

71

657

99

31

13

25

345

230

26

43

252

136

88

99

143

171

20

2001

5.915

138

64

87

68

515

139

41

10

11

368

237

41

45

231

152

62

94

105

117

23

2000

5.920

103

53

118

106

553

117

55

13

13

329

195

20

35

206

159

71

85

132

143

26

1999

6.054

123

42

70

76

602

106

38

14

14

345

229

32

43

208

171

80

87

120

141

32

1998

6.055

135

43

74

86

626

77

57

11

13

384

202

12

51

216

155

68

98

117

159

26

1997

6.238

139

51

61

102

651

120

32

17

23

366

242

19

56

240

190

80

93

143

137

19

1996

6.202

155

63

77

88

641

90

35

18

19

333

213

27

62

262

143

70

85

141

134

23

1995

6.275

150

78

86

92

646

112

32

12

16

391

237

24

53

250

156

54

95

140

139

18

1994

6.632

153

60

79

85

639

120

35

15

21

358

249

21

50

247

195

74

106

158

187

22

Page 75: Epidemiología y bioestadística secretos   nordness1ed

FUENTES DE DATOS Y VIGILAN

CIA73

Maryland

Massachusetts

Michigan

Minnesota

Mississippi

Missouri

Montana

Nebraska

Nevada

New Hampshire

New Jersey

New Mexico

New York (excepto N.Y.C.)

Nueva York, Ciudad

Carolina del Norte

Dakota del Norte

Ohio

Oklahoma

Oregón

Pensilvania

Rhode Island

Carolina del Sur

Dakota del Sur

Tennessee

Texas

102

46

152

81

94

175

51

83

47

19

129

63

140

100

169

25

202

92

63

188

8

107

36

140

417

103

67

143

103

123

140

65

43

49

10

138

35

127

187

169

20

203

78

88

242

17

100

28

145

536

82

85

160

113

121

131

38

78

38

13

145

55

154

191

214

30

190

86

84

241

16

87

28

154

529

64

54

175

76

111

145

58

57

40

9

129

59

120

100

203

25

209

115

44

225

17

91

35

136

536

84

70

156

68

125

148

42

59

51

13

115

35

122

111

234

34

207

82

52

199

7

115

35

160

572

82

83

182

72

128

165

49

66

58

14

104

39

121

120

222

22

222

99

69

221

11

139

46

154

468

78

44

179

88

113

145

58

56

60

23

103

48

149

94

228

24

186

75

72

235

12

111

28

150

523

82

69

174

72

104

123

56

46

55

23

101

50

155

109

210

35

201

104

84

259

11

131

23

168

459

82

62

155

92

103

140

50

56

52

11

100

60

169

148

191

23

201

87

85

282

6

109

32

152

514

86

66

149

84

128

125

34

54

51

12

118

58

158

144

187

28

186

200

73

233

11

115

26

179

475

80

74

180

82

126

155

50

83

41

14

114

54

180

184

226

21

209

97

80

354

12

83

31

170

497

(Continúa)

Page 76: Epidemiología y bioestadística secretos   nordness1ed

Fuente: Bureau of Labor Statistics, 2003.

TA B L A 4 - 4 . I N C I D E N T E S L A B O R A L E S FATA L E S , P O R E S TA D O D E L I N C I D E N T E ( C o n t . )

Características

FUENTES DE DATOS Y VIGILAN

CIA74

20021992 1993 20012000199919981997199619951994

Utah

Vermont

Virginia

Washington

Virginia Occidental

Wisconsin

Wyoming

52

11

142

86

40

91

33

59

11

175

97

77

135

26

66

7

135

112

66

138

36

65

6

146

102

63

110

40

61

15

148

75

46

107

36

54

14

154

88

57

105

32

67

16

177

113

57

97

33

66

9

166

112

53

114

29

64

7

153

128

66

108

28

51

16

132

109

56

117

32

66

8

164

118

61

109

35

Page 77: Epidemiología y bioestadística secretos   nordness1ed

FUENTES DE DATOS Y VIGILAN

CIA75

TA B L A 4 - 5 . C A R A C T E R Í S T I C A S V I TA L E S D E L O S T R A BA J A D O R E S

Características

Estado del trabajador

Trabajadores con salarios y sueldos

Trabajadores autónomos

Sexo

Hombres

Mujeres

Edad

Menos de 16 años

16-17 años

18-19 años

20-24 años

25-34 años

35-44 años

45-54 años

55-64 años

≥ 65 años

2002

4.481

1.053

5.092

442

16

25

92

436

1.023

1.403

1.253

784

495

1992

4.975

1.242

5.774

443

27

41

107

544

1.556

1.538

1.167

767

467

1993

5.025

1.303

5.842

489

29

39

102

508

1.521

1.584

1.204

811

522

2001

4.781

1.134

5.442

473

20

33

122

441

1.142

1.478

1.368

775

530

2000

4.736

1.184

5.471

449

29

44

127

446

1.163

1.473

1.313

831

488

1999

4.904

1.150

5.612

442

26

46

122

451

1.175

1.510

1.333

816

565

1998

4.804

1.251

5.569

486

33

32

137

421

1.238

1.525

1.279

836

541

1997

4.970

1.268

5.761

477

21

41

113

503

1.325

1.524

1.302

875

520

1996

4.977

1.225

5.688

514

27

43

125

444

1.362

1.586

1.242

855

504

1995

5.074

1.201

5.736

539

26

42

130

486

1.409

1.571

1.256

827

515

1994

5.370

1.262

6.104

528

25

42

114

545

1.567

1.619

1.310

866

525

(Continúa)

Page 78: Epidemiología y bioestadística secretos   nordness1ed

TA B L A 4 - 5 . C A R A C T E R Í S T I C A S V I TA L E S D E L O S T R A BA J A D O R E S ( C o n t . )

Características 20021992 1993 20012000199919981997199619951994

Raza u origen étnico

Blanca

Negra o afroamericana

Estadounidenses de origen hispánico

Indios norteamericanos o nativos de Alaska

Asiático, nativo de Hawai o de las Islas

del Pacífico

Múltiples razas

Otras razas no notificadas

3.926

491

841

40

140

4

92

4.711

618

533

36

192

127

4.665

649

634

46

206

131

4.175

565

895

48

182

6

44

4.244

575

815

33

185

68

4.410

616

730

54

180

63

4.478

583

707

28

164

95

4.576

661

658

34

218

91

4.586

615

638

35

188

140

4.599

684

619

27

188

158

4.954

695

624

39

211

109

FUENTES DE DATOS Y VIGILAN

CIA76

Fuente: Bureau of Labor Statistics, 2003.

Page 79: Epidemiología y bioestadística secretos   nordness1ed

estos datos es por medio de la World Health Organization Library Service (WHOLIS) o del

World Health Organization Statistical Information Service (WHOSIS).

51. Enumere el sistema de datos de biblioteca que contiene las publicaciones de

la OMS.

La WHOLIS es la base de datos de biblioteca de la OMS disponible en la red de Internet. La

WHOLIS indexa todas las publicaciones de la OMS desde 1948 en adelante, y artículos de

revistas y documentos técnicos producidos por la OMS desde 1985 hasta el presente. Un catá-

logo de tarjetas en el sitio proporciona acceso a los documentos técnicos previos a 1986.

52. Cite el sistema electrónico de base de datos que contiene información

epidemiológica y estadística de la Organización Mundial de la Salud.

El WHOSIS es una guía de información epidemiológica y estadística en la OMS. La mayoría de

los programas técnicos de la OMS desarrollan información epidemiológica y estadística rela-

cionada con la salud, accesible en el sitio de la red de la OMS.

53. ¿Qué tipo de información puede encontrarse en el WHOSIS?

La información disponible incluye:■ Carga de estadísticas por enfermedades.■ Base de datos de mortalidad de la OMS.■ Anexos estadísticos del World Health Report.■ Estadísticas por enfermedad o afección.■ Personal sanitario.■ Fuentes externas de información estadística relacionada con la salud.

FUENTES DE DATOS Y VIGILANCIA 77

PÁGINAS WEB

1. http://www.bls.gov/iif/oshwc/cfoi/cfch0002.pdf

2. http://www.bls.gov/iif/oshwc/cfoi/cftb0186.pdf

BIBLIOGRAFÍA

1.• Jekel JF, Katz DL, Elmore JG: Epidemiology, Biostatistics, and Preventive Medicine. Philadelphia, W.B.Saunders, 2001, pp 20–39.

2.• Rom WM (ed): Environmental and Occupational Medicine, 3rd ed. Philadelphia, Lippincott-Raven, 1998, pp 19–25.

3.• Rothman KJ, Greenland S: Modern Epidemiology. Philadelphia, Lippincott Williams & Wilkins, 1998, pp 435–447.

4.• Wallace RB (ed): Maxcy-Rosenau-Last’s Public Health and Preventive Medicine, 14th ed. Stamford, CT,Appleton & Lange, 1998.

Page 80: Epidemiología y bioestadística secretos   nordness1ed

79

CA

PÍT

ULO

5

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIASThomas H. Winters, MD, y Ann M. Zaia, NP-C, MSN, MHA

CONCEPTOS GENERALES

1. ¿Cuáles son los componentes del triángulo epidemiológico?

El huésped, el agente y el ambiente. Un huésped es un organismo vivo capaz de infectarse, unagente es un factor que ha de estar presente (o potencialmente ausente) para que se produzcala enfermedad, y el ambiente es una fuerza o situación extrínseca que afecta a la oportunidadde que el huésped esté expuesto al agente. Puede estar presente un vector para transportar oconducir el agente al huésped (Fig. 5-1).

Figura 5-1. Modelo de causalidad del triángulo epidemiológico.(De Principles of Epidemiology, 2nd ed. Atlanta, U.S. Depart-ment of Health and Human Services, Public Health Service,Centers for Disease Control and Prevention, Epidemiology Pro-gram Office, Public Health Practice Program Office, 1992.)

2. Explique la relación entre los lados del triángulo epidemiológico.

Bien conocido como uno de los modelos ecológicos elementales en salud pública, se empleacon frecuencia el triángulo epidemiológico para explicar el concepto de causalidadde enfermedad. El huésped, el agente y el ambiente son los componentes necesarios deltriángulo. Cuando se observa como triángulo equilátero, cualquier cambio en un lado alterade modo inevitable uno o los dos lados restantes, lo que causa un aumento o disminución en lafrecuencia del estado de enfermedad.

Ambiente

Agente

Huésped

Page 81: Epidemiología y bioestadística secretos   nordness1ed

3. Enumere algunas de las características que afectan a la frecuencia

de la enfermedad en relación con los tres componentes del triángulo

epidemiológico.

Características del huésped■ Edad. ■ Estado socioeconómico.■ Genética. ■ Inmunidad.■ Sexo.Características del agente■ Estabilidad ambiental. ■ Infectividad.■ Virulencia. ■ Patogenicidad.■ Resistencia.Características del ambiente■ Biológicas (p. ej., vectores y reservorios).■ Físicas (p. ej., calor y densidad poblacional).■ Sociales (p. ej., cultura).

4. ¿Cuál es el único reservorio conocido del virus del sarampión?

Recibe la consideración de reservorio el lugar en que sobrevive una enfermedad infecciosa.Aunque los reservorios pueden incluir organismos animados o materia inanimada, los geneshumanos son el único reservorio conocido del virus del sarampión.

5. Explique cómo se transmiten los agentes infecciosos, y describa la

transmisión directa y la indirecta.

La transmisión de la enfermedad se clasifica como directa o indirecta. La transmisión directaentraña la transferencia del agente infeccioso por contacto físico con lesiones, sangre, saliva uotra secreción. La transferencia infecciosa a partir de una aerosolización directa, como unestornudo en la cara de otra persona, también se considera clásicamente directa. La transmi-sión indirecta se produce cuando el agente infeccioso pasa un período intermedio variable en elinterior de una sustancia o sobre su superficie, o en un organismo, antes de causar enferme-dad en el huésped.

6. ¿Por qué mecanismos puede tener lugar la transmisión directa y la indirecta?

La transmisión directa implica un contacto íntimo, que clásicamente se describe como una dis-tancia inferior a 1 metro del individuo infectado en la fase de diseminación por gotitas (p. ej., al toser, estornudar o hablar). Las actividades que pueden causar una transferenciainmediata de un agente infeccioso a una puerta de entrada susceptible, como besarse, morder-se o la relación sexual, son métodos de transmisión directa. La transmisión indirecta, por otraparte, es transmitida por un vehículo o por un vector. Un vehículo puede ser un objeto inanima-do o material biológico (p. ej., sangre o tejido) que actúa como intermediario en la transferen-cia del agente infeccioso al huésped.

7. ¿La hepatitis A, se adquiere por transmisión directa o indirecta?

La hepatitis A se adquiere por la ruta fecal-oral, que se considera transmisión indirecta. Lospatógenos han de ser capaces de resistir el ambiente fuera de su huésped natural durante cier-to período de tiempo para ser una fuente viable de transmisión indirecta.

Un ejemplo de este tipo de transmisión puede ser cuando un empleado (es decir, un reser-vorio) con hepatitis A, que trabaja en un restaurante local de comida rápida no se lava lasmanos después de haber ido al servicio. A continuación, el empleado vuelve a su sitio de pre-paración de alimentos y le prepara una hamburguesa de gran tamaño. En el proceso, se trans-fiere al alimento materia fecal infectada por el virus de la hepatitis A. Hambriento como

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS80

Page 82: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS 81

de costumbre, usted se come toda la hamburguesa. Aproximadamente un mes después,observa que tiene unos síntomas de tipo gripal y las escleróticas de color amarillo. Su astutacapacidad de autodiagnóstico le revela que tiene hepatitis A. Dado que usted no se puso nuncaen contacto directo con la persona que le preparó la hamburguesa, contrajo la hepatitis A pormedio de una transmisión indirecta.

Por el contrario, podría producirse una transmisión directa cuando su mejor amigo, queestá incubando un resfriado, le muestra poca consideración y estornuda en plena cara. Por lotanto, recuerde: para ayudar a prevenir tanto la transmisión directa como la indirecta, siempredebe cubrirse la boca cuando tosa y lavarse después bien las manos.

8. ¿Qué es la cadena de la infección?

La cadena de la infección es el mecanismo por el cual se produce la transmisión de un agentedesde su reservorio hasta su huésped. La Figura 5-2 es un esquema útil que ilustra la cadenade la infección.

Figura 5-2. Cadena de la infección. (De Principles of Epidemiology, 2nd ed. Atlanta, U.S. Departmentof Health and Human Services, Public Health Service, Centers for Disease Control and Prevention,Epidemiology Program Office, Public Health Practice Program Office, 1992.)

9. ¿En qué se diferencian infecciosidad, patogenicidad y virulencia?

Según los Centers for Disease Control and Prevention (CDC), la infecciosidad es la proporciónde personas expuestas a un agente causal que llegan a padecer una enfermedad infecciosa.Puede medirse la infecciosidad por la tasa de ataques secundarios. La patogenicidad es lacapacidad de un organismo para causar un estado de enfermedad (morbilidad), mientras quela virulencia es la capacidad para causar la muerte (mortalidad). Se puede alterar la virulenciade un patógeno. Por ejemplo, el descubrimiento de la penicilina a finales de la década de 1930redujo de modo significativo la mortalidad de la bacteriemia neumocócica desde el 90 al 10%,aproximadamente.

HUÉSPEDSUSCEPTIBLE

PUERTASDE ENTRADA

RESERVORIO

GOTITACONTACTODIRECTO

AGENTE

CADENA DE INFECCIÓN

MODO DE TRANSMISIÓN

VECTOR

VEHÍCULOVEHICULADO

POR AIRE

Page 83: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS82

10. ¿Qué porcentaje de infecciones bacterianas adquiridas en el hospital es

resistente por lo menos a uno de los antibióticos prescritos con mayor

frecuencia para su tratamiento?

Se conoce como resistencia el grado en que un microorganismo causante de enfermedad noresponde a los fármacos ideados para su erradicación. La prescripción excesiva de antibióticosha llevado a la mutación de muchas bacterias como mecanismo de supervivencia frente anuestros esfuerzos para erradicarlas. Esta compleja estrategia por parte de las bacterias ha lle-vado a la reducción o, en algunos casos, a la completa inefectividad de los regímenes terapéu-ticos actuales. En más del 70% de las infecciones bacterianas adquiridas en el hospital puededemostrarse cierto nivel de resistencia a, por lo menos, un fármaco empleado habitualmentepara tratarlas. En el huésped, son múltiples los factores que determinan la resistencia, como elsexo, la edad, el estado socioeconómico, la salud basal y el estado nutricional. Además, elcomponente genético determina la resistencia individual a varias enfermedades (denominadaresistencia innata).

11. ¿Quién recibió el Premio Nobel de Medicina en 1928 por establecer

el concepto de infección aparente e inaparente?

El ganador de dicho premio fue el Dr. Charles Jules Henry Nicolle. Mientras llevaba a cabo unainvestigación con cobayas, se infectó con el tifus. Nicolle hizo un descubrimiento muy sorpren-dente: algunas de las cobayas, a pesar de no mostrar síntomas aparentes de tifus, erancapaces de diseminar la enfermedad. En la actualidad, las infecciones aparentes o inaparentessuelen denominarse como infecciones sintomáticas o asintomáticas.

12. Cite los dos tipos de inmunidad.

■ Inmunidad pasiva: se transfieren a un individuo los anticuerpos formados en otra persona oanimal. Este tipo de inmunidad tiene corta duración.

■ Inmunidad activa: se transfieren antígenos a un individuo a través de una puerta de entrada.Una vez ha penetrado el antígeno en el cuerpo, estimula su propio sistema inmunitario paraproducir anticuerpos. La exposición inicial de un antígeno y la posterior formación de anti-cuerpos por parte del huésped reciben la denominación de respuesta primaria. La inmuno-globulina M (IgM) es el principal anticuerpo producido durante la respuesta inmunitaria pri-maria, mientras que la inmunoglobulina G (IgG) domina en el momento de la reexposición,cuando contribuye la memoria celular. Esta formación de IgG explica la razón de que lainmunidad activa sea más persistente que la inmunidad pasiva.

PUNTOS CLAVE: TRANSMISIÓN DE LA ENFERMEDAD

1. El huésped, el agente y el ambiente componen el triángulo epidemiológico.

2. Los agentes infecciosos pueden ser transmitidos directa o indirectamente.

3. La patogenicidad es la capacidad para causar enfermedades, mientras que la virulencia es la capacidad para causar la muerte.

4. La tasa de ataques primarios es el número de personas que enferman, dividido por el número de las que se encuentran en riesgo.

5. Tanto la inmunidad pasiva como la activa puede adquirirse por medios naturales o artificiales.

6. Una epidemia es una situación en la que la frecuencia de una enfermedad es mayor de la esperadaen relación con una población determinada en un período de tiempo.

Page 84: Epidemiología y bioestadística secretos   nordness1ed

13. ¿Qué tipos de inmunidad pueden adquirirse artificialmente?

Tanto la inmunidad pasiva como la activa pueden adquirirse por medios naturales o artificiales.

14. La inmunidad adquirida puede ser conferida por dos modos posibles: artificial

o natural. Indique el método empleado para proporcionar inmunidad adquirida

artificialmente a un individuo.

La administración de una vacuna profiláctica, como la vacuna frente al sarampión-parotiditis-rubéola (MMR), la poliomielitis inactivada o la neumonía neumocócica, confiere inmunidadartificial al exponer el individuo a los antígenos de un patógeno vírico o bacteriano particular.

15. Un médico del servicio de urgencias de un hospital local llega a su consulta y

afirma que se ha pinchado con una aguja de un paciente que se conoce es

positivo a la hepatitis B. Está preocupado porque nunca ha recibido la vacuna

frente a la hepatitis B (siempre ha estado «demasiado ocupado»). Como parte

del protocolo estándar de patógenos transmisibles por la sangre en su

consulta, ¿le administra usted inmediatamente inmunoglobulina frente a la

hepatitis B, a tenor de su conocimiento del tipo de inmunidad que le conferirá?

¿Cuál es este tipo de inmunidad?

Inmunidad pasiva adquirida artificialmente. La inmunoglobulina frente a la hepatitis B está indi-cada para exposiciones agudas al antígeno de superficie del virus de la hepatitis B (HBsAg) enun individuo que no haya recibido nunca la vacuna de la hepatitis B o que se sepa que no harespondido a la vacuna. Esta forma provisional de inmunidad promueve el desarrollo de anti-cuerpos frente al antígeno de superficie del virus de la hepatitis B en, aproximadamente, 1-6 días, con una duración de protección de 2-6 meses. Para que sea efectiva, es convenienteadministrarla en las primeras 24 horas, y no debe administrarse pasados los 7 días después dela exposición. En el caso de un médico previamente no vacunado o de un paciente cuyo títulohaya descendido por debajo del nivel de protección, debe administrarse una serie completa dela vacuna frente a la hepatitis B, al mismo tiempo que se administra la inmunoglobulina para lahepatitis (en sitios distintos) para conferir una inmunidad activa, adquirida artificialmente y delarga duración.

16. Se conoce como calostro el líquido inicial segregado por las glándulas

mamarias después del nacimiento de un niño. Usted anima a las nuevas madres

a que den el pecho a sus hijos porque sabe que el calostro proporciona un tipo

de inmunidad. ¿Cuál?

El calostro proporciona una inmunidad pasiva adquirida de forma natural. Este fenómeno seproduce cuando el niño ingiere los anticuerpos contenidos en el calostro, que atraviesan lamucosa intestinal y son transportados a la sangre.

17. ¿Qué es la inmunidad de grupo?

La inmunidad de grupo es la inmunidad de un grupo o comunidad (Fig. 5-3). En otras palabras,es la resistencia de un grupo a la invasión y diseminación de un agente infeccioso, basada en laresistencia que presenta una elevada proporción de los miembros de dicho grupo. Incluye ungrupo vacunado.

18. ¿Por qué en Estados Unidos constituye una preocupación creciente en la

salud pública la pérdida de inmunidad de grupo frente a la viruela en relación

con la guerra biológica?

Desde que la Organización Mundial de la Salud declarase oficialmente que la viruela había que-dado erradicada en todo el mundo en 1980, y con el último caso natural registrado en 1977, los

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS 83

Page 85: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS84

programas de inmunización frente a esta enfermedad se han interrumpido. Sin el beneficio deuna enfermedad de producción natural o de la inmunidad activa artificial en forma de vacuna-ción, no puede desarrollarse la inmunidad de grupo. Por tanto, en el caso de que se liberaseviruela en forma de arma biológica, la ausencia de inmunidad de grupo puede convertirla enuna amenaza mortal.

19. ¿Qué modificación molecular condiciona un cambio en la antigenicidad del

virus de la inmunodeficiencia humana (VIH), que hace difícil el desarrollo

de una vacuna efectiva frente a este virus?

El responsable es un proceso conocido como deriva antigénica o variaciones antigénicasmenores. Las variaciones antigénicas menores consisten en el desarrollo de mutacionesespecíficas en el tiempo. En ciertos virus, como el VIH, puede producirse muy fácilmente estefenómeno debido a una elevada tasa de replicación. Las variaciones antigénicas menores cau-san pequeños cambios en el virus, lo que hace disminuir la respuesta inmunitaria del huésped,al disminuir la eficacia de la memoria celular de las células T y B.

20. ¿Es la deriva antigénica el mismo fenómeno que las variaciones antigénicas

mayores?

No. Las variaciones antigénicas mayores son más importantes e inmediatas que las variacio-nes antigénicas menores (deriva antigénica) en las proteínas de superficie de un virus, lo quelleva a una gran alteración de la información genética. El virus de la gripe es notorio por su ten-dencia a desarrollar unas variaciones antigénicas menores y mayores, lo que ha dado lugar amuchas epidemias históricamente muy significativas.

Figura 5-3. Efecto de la inmunidad de grupo sobre la diseminación de la infección. El diagrama ilus-tra el modo de diseminación de una enfermedad infecciosa, como el sarampión, en una poblaciónsusceptible si cada persona infectada estuviera expuesta a otras dos personas. En ausencia de inmu-nidad de grupo (A), el número de casos se duplicaría en cada generación de la enfermedad. En pre-sencia de inmunidad de grupo del 50% (B), el número de casos permanecería constante. El signomás (+) representa una persona infectada, el signo menos (–) representa una persona no infectada,y el signo menos dentro de un círculo ( – ) representa una persona inmune que no transmite la infec-ción a otras personas. (De Jekel JF, Katz DL, Elmore JG: Epidemiology, Biostatistics, and PreventiveMedicine, 2nd ed. Philadelphia, W.B. Saunders, 2001.)

Caso inicial

Primera generaciónde la enfermedad

Segunda generaciónde la enfermedad

Tercera generaciónde la enfermedad

AUSENCIA DE INMUNIDAD DE GRUPOA B

PRESENCIA DEINMUNIDAD DE GRUPOEN EL 50%

Page 86: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS 85

21. Como médico recientemente nombrado de un Departamento de Salud Pública

local, su primera misión es investigar un patrón de casos repetitivos de menin-

gitis aséptica en la comunidad. Seguro que recuerda, por su sobresaliente

conocimiento de la asignatura de epidemiología en la facultad, la terminología

apropiada para este patrón de exceso de casos. ¿Cuál es?

Periodicidad. La Figura 5-4 muestra el patrón de meningitis aséptica en Estados Unidos desde1986 hasta 1994.

Figura 5-4. Meningitis aséptica. Casos notificados por 100.000 personas por mes, EstadosUnidos, 1986-1993. (De CDC: Summary of notifiable diseases, United States, 1993. MMWR49:49, 1994.)

Cas

os

notif

icad

os

po

r 10

0.00

0 ha

bita

ntes

Año (mes)1986

1,2

1,1

1,0

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0,01987 1988 1989 1990 1991 1992 1993 1994

22. A medianoche le llaman y le notifican que uno de sus pacientes, una mujer de

65 años de edad con historia de insuficiencia cardíaca congestiva y enferme-

dad pulmonar obstructiva crónica, acaba de ser ingresada en el Servicio de

Urgencias con infección por Streptococcus pneumoniae. El médico que le

atiende en el Servicio de Urgencias le asegura que acaba de empezar a tratar

a su paciente con penicilina, y que todo irá bien. Confortado por su tono tran-

quilizador, vuelve a la cama. La tarde siguiente, la enfermera de planta le

llama, y le dice que su paciente ha desarrollado un cuadro séptico y que ha

sido trasladada a la Unidad de Cuidados Intensivos. ¿Qué pudo ocurrir?

Resistencia a los antibióticos. En 1967, se notificó en Nueva Guinea el primer casode Streptococcus pneumoniae resistente a la penicilina y, posteriormente, en la década de1980, apareció en Estados Unidos.

La resistencia bacteriana es una consecuencia natural del proceso evolutivo, y se adquierepor medio del proceso de adaptación. Aunque el antibiótico no sea en sí mismo la verdaderacausa de la resistencia, los esfuerzos del antibiótico para eliminar la infección desencadenanlos instintos de supervivencia de la bacteria, que, en último término, comporta cambios genéti-cos. Esencialmente, la resistencia se produce porque la bacteria realiza un intento final paradetener nuestros esfuerzos, ya sea por resistencia natural (es decir, evolución vertical por

Page 87: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS86

medio de una mutación espontánea) o por resistencia adquirida (es decir, evolución horizontalpor medio de la adquisición de genes de resistencia a partir de otro organismo, por medio detransducción, conjugación o transformación).

En el caso de la resistencia a penicilina, las bacterias se reinventan a sí mismas con el fin desobrevivir, y producen enzimas que destruyen el fármaco o alteran su estabilidad de unión ylesionan las paredes celulares. Aunque es crucial que realicemos todos los esfuerzos posiblespara enlentecer este proceso, la realidad es que, debido al rápido crecimiento de la célula bac-teriana y a la complejidad de los procesos genéticos, como la mutación y la selección, esimprobable que seamos capaces de detenerlo.

23. ¿Cuál es el mejor término epidemiológico para describir el aumento de las

infecciones neumocócicas durante los meses de invierno?

La variación estacional es el patrón cíclico de las tasas de ataques relacionados con patógenoscomunes. Hay ciertos patógenos que tienen una mayor probabilidad de infectar en determina-dos momentos del año. Streptococcus pneumoniae, Staphylococcus aureus y los virus influen-za A y B tienen mayor probabilidad de aparecer en invierno; la legionelosis suele darse en vera-no, y las especies de Mycoplasma aparecen más en verano y otoño en el hemisferio norte. LaFigura 5-4 muestra tanto la periodicidad de la meningitis aséptica como la variación estacionalde la enfermedad.

24. Como jefe de enfermedades infecciosas de un pequeño hospital rural, el

personal le pregunta con frecuencia sobre aspectos relacionados con temas

de exposición. Recibe una llamada de la jefa de Enfermería del Servicio de

Urgencias, y le notifica que un paciente acaba de ser ingresado con neumonía

por varicela. La jefa de Enfermería se muestra preocupada porque el

Departamento de Salud le comunica que una de las nuevas enfermeras, que

había atendido a este paciente, tiene un título de varicela que se ha negativizado.

A tenor de sus conocimientos sobre el período de incubación de la varicela,

¿qué consejo le daría a la jefa de Enfermería?

Los trabajadores del Departamento de Salud Pública vigilan a los pacientes con varicela debidoal largo período de incubación y a la necesidad de conceder un permiso por baja laboral a lostrabajadores no inmunizados (es decir, aquellos que no tienen inmunidad natural y los trabaja-dores no inmunes que no recibieron la vacuna del virus de la varicela vivo atenuado) de 10 a 21 días después de la exposición. El período de incubación es el intervalo de tiempo entre elcontacto inicial con el agente infeccioso y la manifestación inicial de síntomas asociados con lainfección varicelosa. El virus de la varicela tiene un largo período de incubación, de 14 a 21 días. Según el Massachusetts Department of Public Health, los trabajadores en el área sani-taria susceptibles a la varicela deben ser separados del trabajo desde los días 10 a 21 tras laúltima exposición. Sin embargo, si la enfermera mencionada recibe inmunoglobulina frente alvirus de la varicela-zóster (VZIG), su exclusión debe prolongarse hasta 28 días después de laexposición. Se subraya con frecuencia la necesidad de dar la baja a los trabajadores 4 díasantes del comienzo del período de incubación, porque el virus de la varicela es contagiosodesde 2 días antes del comienzo de la erupción. Si la enfermera contrajese la enfermedad, debepermanecer alejada del trabajo hasta que ya no sea contagiosa, clásicamente 6-8 días, o hastaque todas las vesículas hayan pasado a la fase de costras.

25. ¿Qué es una tasa de ataque?

Una tasa de ataque es parecida a la tasa de incidencia. Clásicamente, se emplean las tasas deataque en relación con un grupo de población específico durante cierto período de tiempo. Seemplea, con frecuencia, para cuantificar las epidemias.

Page 88: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS 87

N.º de personas en riesgo en las que se desarrolla la enfermedad

Índice de ataque primario =Número total de personas en riesgo

Un ejemplo de tasa de ataque primario es el proporcionado por un brote de infección porSalmonella que se produjo en octubre de 2004 en un restaurante de East Oshkosh. De las 200 per-sonas que comieron allí, 100 enfermaron. La tasa de ataque sería de 100/200 = 0,5 = 50%.

26. Un centenar de niños en edad escolar estuvieron expuestos a la varicela, y

10 contrajeron la enfermedad. Se recomendó a los niños que permanecieran

en sus domicilios con sus hermanos menores que no estuviesen en edad

escolar y que nunca habían estado expuestos a la varicela. Lamentablemente

para los padres, entre los 20 hermanos de menor edad ninguno había recibido

la vacuna de la varicela. Con posterioridad, 5 de ellos contrajeron la varicela.

A tenor de esta información, ¿cuál sería la tasa de ataques secundarios en

este brote de varicela?

La tasa de ataques secundarios es el cociente entre el número de nuevos casos entre los con-tactos que se producen durante el período de incubación especificado después de la exposi-ción a un caso primario, y el número total de contactos expuestos (es decir, diseminación de laenfermedad de persona a persona a partir de los casos primarios a otras personas). La fórmulade la tasa de ataques secundarios es la siguiente:

N.º de casos que padecen la enfermedad dentro del período de incubaciónN.º de individuos susceptibles que estuvieron expuestos a los casos primarios

La tasa de ataques secundarios de la varicela entre los contactos íntimos no vacunados en estegrupo de hermanos sería de 5/20 o 25%.

27. ¿Qué constituye un ejemplo de tasa de letalidad (TL o CFR)?

La TL o CFR se expresa clásicamente como el porcentaje de individuos que son diagnosticadosde una cierta enfermedad y, posteriormente, fallecen de dicha enfermedad en particular dentrode un período de tiempo especificado. Por ejemplo, 1.000 estudiantes universitarios de Bostonpadecieron meningitis meningocócica, y en el año 2003, 10 de los estudiantes fallecieron porcomplicaciones directamente relacionadas con la enfermedad. La tasa de letalidad sería 10 muertes/1.000 casos diagnosticados; es decir, una TL o CFR del 1% en 2003.

28. ¿Cómo se pueden recordar las diferencias entre epidemia, endemia y

pandemia?

Podría intentar recordar las clases de lengua del instituto y mirar el origen de estas palabras.■ Epidemia: en latín, epi- significa «además» o «encima de». Al definir una epidemia, nos

referimos al hecho de que cada persona infectada está infectando a otros múltiples indivi-duos, de modo que el número de personas infectadas crece de modo exponencial. En otraspalabras, cada persona infectada se «suma» rápidamente al problema.

■ Endemia: el significado en latín de esta raíz es «en». Recuerde que endemia hace referenciaa una enfermedad que siempre está presente, en mayor o menor medida, en las personasque viven «en» una localización geográfica particular.

■ Pandemia: en griego pan significa «todo». Una pandemia es una epidemia que se diseminapor una gran área geográfica o «toda». Recuerde que vista panorámica es la vista de uncuadro «grande» o de «toda» el área geográfica.Y, por supuesto, recuerde que «-demia» es la raíz de «población» o «pueblo» en griego.

Page 89: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS88

29. ¿Qué significado tiene la palabra epidemia en español básico?

Una epidemia es, sencillamente, una situación en la que se observa una mayor frecuencia de la enfermedad o lesión de la que se espera, para una población y período de tiempo determinados.

30. ¿Qué es un brote?

Es otro término para designar una epidemia.

PUNTOS CLAVE: DETECCIÓN DE UNA ENFERMEDADINFECCIOSA

1. Considere siempre una enfermedad multisistémica, y revise todos los factores de confusión, al diagnosticar una enfermedad infecciosa.

2. Ponga en primer término de la lista de los diagnósticos diferenciales las enfermedades infecciosasnuevas tratables.

3. En este ambiente y era de enfermedad potencialmente inducida por el bioterrorismo, es precisoconsiderar las enfermedades por agentes físicos, biológicos y laborales, así como por agentesquímicos.

4. Son más comunes las formas de presentación inusuales de enfermedades infecciosas patológicasconocidas.

31. Si tenemos en cuenta que los histogramas son herramientas útiles, usted

puede elegir representar gráficamente un brote reciente de gripe utilizando

este método. ¿Cómo se denominaría, en términos epidemiológicos, tal

diagrama?

El empleo de un histograma para ilustrar el curso de una epidemia (representando el númerode casos según el tiempo de comienzo) recibe la denominación de curva epidémica. Una epide-mia causada por una exposición común única (es decir, una epidemia de origen único) estácausada, con frecuencia, por un alimento o agua contaminados. La curva epidémica de unbrote de origen único tiene una elevación y una caída bruscas, con un período de incubacióncomún en los afectados (Fig. 5-5). Las epidemias propagadas, con frecuencia diseminadas porcontacto de persona a persona, presentan una meseta, que representa la superposición de lasexposiciones y de los períodos de incubación (Fig. 5-6). Las epidemias propagadas no contro-ladas tienen unos picos progresivamente más altos.

32. ¿Qué es el período de incubación de una enfermedad?

Es el tiempo transcurrido desde los cambios inaparentes entre la exposición del huésped alagente infeccioso hasta el comienzo de la enfermedad clínica en el huésped. Con frecuencia, elperíodo de incubación es una herramienta poderosa para determinar el origen de una epidemiade origen único, al hacer un cálculo retrospectivo para determinar el período de exposiciónprobable de los afectados y desarrollar una lista de causas probables.

33. A las 4 de la madrugada le llama la enfermera de una escuela local y le comen-

ta que tiene 52 estudiantes en la sala de espera con náuseas, vómitos y diarrea

Page 90: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS 89

de comienzo brusco. Teme que se trate de una intoxicación por Salmonella

por un pollo ingerido en la cena celebrada la noche pasada. ¿Qué debe hacer?

Debe dar comienzo a las 10 etapas de una investigación de un brote, relacionadas más adelan-te, tal como indica el Center for Disease Control and Prevention:1) Prepararse para el trabajo de campo; 2) establecer la existencia de un brote; 3) comprobar eldiagnóstico; 4) definir e identificar los casos; 5) describir y orientar los datos en términos detiempo, lugar y persona; 6) desarrollar hipótesis; 7) evaluar hipótesis; 8) depurar las hipótesisy llevar a cabo estudios adicionales; 9) poner en práctica medidas de control y de prevención, y 10) comunicar los resultados.

34. Una enfermera de 62 años de edad de un centro hospitalario se pone en

contacto con el Departamento de Salud Laboral, alegando que fue diagnosticada

por su médico de atención primaria de neumonía por Staphylococcus aureus

resistente a la meticilina (MRSA). La enfermera estaba segura de que había

contraído la infección a partir de un paciente que acababa de ser

diagnosticado portador de MRSA. ¿Cómo puede saberse si la enfermera

contrajo el MRSA a partir de dicho paciente?

Se pueden recuperar cepas de MRSA tanto a partir de la enfermera como del paciente. Enton-ces, puede llevarse a cabo un genotipado mediante el empleo de electroforesis en gel decampo pulsado (PFGE) en las cepas de ambos individuos. Si los patrones por PFGE son idénti-cos, la enfermera tiene razón.

35. A su consulta acude un trabajador sanitario después de una exposición a un

patógeno transmitido por sangre de un paciente que se sabe es positivo al

virus de la hepatitis C. Evalúa al trabajador, comienza el tratamiento y el

Figura 5-5. Curva epidémica de origen único de un brote de gripe en una residencia de ancianos. Loui-siana, agosto de 1993. (De CDC: Influenza A outbreaks – Louisiana, August, 1993. MMWR42[36]:689-692, 1993.)

Personalde plantilla

Residentes

Fecha de comienzo

10

40

30

20

10

012 14 16 18 20 22 24 26 28 30

Cas

os

Page 91: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS90

seguimiento de acuerdo a las recomendaciones de los CDC. Se muestra usted

interesado en seguir al paciente debido a la historia comentada del paciente

origen. ¿Qué puede hacer, además de seguir las recomendaciones de los

CDC, en términos de vigilancia?

En este contexto, puede ser útil un programa de vigilancia médica reforzado por las siguientesrazones:■ Hasta el 20% de las seroconversiones de la hepatitis C revierten a ausencia de carga vírica.■ Es crítico efectuar un diagnóstico precoz en caso de que se produzca la reversión; es crítico

también realizar un consejo precoz en caso de producirse una conversión postexposición,porque el tratamiento entre 6 meses y un año mejora el desenlace y previene frente a unarespuesta vírica mantenida en el 98% de los trabajadores sanitarios.

■ La prueba de anticuerpos frente al virus de la hepatitis C por análisis de inmunoabsorciónligada a enzimas (ELISA) tiene una baja especificidad, con una tasa de falsos positivos dehasta el 40%.A tenor de estos hechos, tal vez debería solicitar una prueba de anticuerpos frente al virus

de la hepatitis C en el momento inicial, y luego solicitar una prueba de reacción en cadena de lapolimerasa (PCR) con el virus ARN de la hepatitis C, y una prueba de anticuerpos frente al virusde la hepatitis C en los meses 1, 3 y 6.

ENFERMEDADES INFECCIOSAS EN LA GUERRA BIOLÓGICA Y BIOTERRORISMO

36. ¿Qué características de las enfermedades infecciosas las hacen atractivas

para el empleo como armas biológicas y en el bioterrorismo?

Cualquiera o todas las características que se exponen a continuación pueden hacer atractivauna enfermedad infecciosa particular:

Figura 5-6. Epidemia propagada de infección por Escherichia coli (E. coli) 0104:H21 como conse-cuencia de una exposición continuada a leche contaminada. Helena, Montana, 1994. (De CDC:Outbreak of acute gastroenteritis attributable to Escherichia coli Serotype 0104:H21 – Helena,Montana, 1994. MMWR 44[27]:501-504.

Casos confirmados

Casos sospechosos

Cas

os

Fecha de comienzo (intervalo a días alternos)

Feb. 28-Mar. 1

4

3

2

1

0

Mar. 10-11 Ma.r 20-21 Mar. 30-31 Abr. 9-10 Abr. 19-20 Abr. 29-30

Page 92: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS 91

■ Capacidad de contagio.■ Período de incubación.■ Métodos de distribución viables (p. ej., aerosolización).■ Inmunidad de grupo inadecuada o ausencia total.■ Sociedad móvil, lo que permite una rápida diseminación de la enfermedad a zonas distantes

del área de distribución.

37. ¿Qué enfermedad o enfermedades de la lista que sigue podrían ser utilizadas

en un ataque bioterrorista?

■ Viruela. ■ Botulismo.■ Carbunco. ■ Tularemia.■ Peste bubónica. ■ Fiebre hemorrágica vírica.■ Fiebre Q. ■ Brucelosis.

Según los CDC, todos los agentes de la lista tienen el potencial de ser utilizados en la guerrabiológica.

38. Según los CDC, ¿cuáles son los organismos que representan la máxima

amenaza con respecto al bioterrorismo?

Los CDC designan los organismos de este tipo como categoría A. Estos agentes incluyen loscausantes de carbunco, peste, viruela, tularemia y fiebre hemorrágica vírica, así como la toxinadel botulismo.

39. ¿Qué es la vigilancia sindrómica?

De acuerdo con la Division of Public Health Surveillance and Informatics de los CDC, la vigilan-cia sindrómica es el proceso de recogida e interpretación de los datos de salud que preceden aun diagnóstico de certeza y puede indicar un caso o un brote que desencadenaría una nuevarespuesta de salud pública.

40. ¿Por qué los escolares podrían ser un buen origen en relación con los datos

epidemiológicos de un posible ataque bioterrorista?

Con el empleo de la vigilancia sindrómica, una población específica, como los niños en edadescolar, pueden ser monitorizados en busca de síntomas relacionados con la exposición aagentes infecciosos. Una asistencia combinada durante cinco días por semana, notificación yregistro de bajas y, en muchos casos, la disponibilidad de enfermeras en las escuelas paraefectuar la recogida de datos, hacen que los niños en edad escolar constituyan una excelentepoblación para la vigilancia epidemiológica. Además, los escolares pueden servir como vecto-res eficientes para la transmisión de los patógenos relacionados con el bioterrorismo, ya queun niño puede, potencialmente, infectar a una familia entera. La detección precoz de las ten-dencias de la enfermedad puede llevar a estrategias de intervención para prevenir un problemade mayor extensión.

41. ¿Cómo se puede conseguir información en tiempo real sobre la preparación

y respuesta al empleo de agentes infecciosos en sucesos terroristas?

El registro clínico de los CDC en relación con el terrorismo y respuesta de emergencia pro -porciona actualizaciones sobre el estado de preparación en bioterrorismo y oportunidades de formación gratis a los usuarios registrados enhttp://www.bt.cdc.gov/clinregistry/index.asp.

Page 93: Epidemiología y bioestadística secretos   nordness1ed

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS92

42. ¿Por qué las partículas de tamaño intermedio (menores de 5 µm) son

importantes en la aerosolización de los agentes infecciosos?

Las partículas de un tamaño inferior a 5 μm pero mayor que 1 μm tienen mayor probabilidadde transmitir la infección. Estas partículas de tamaño intermedio pueden ser inhaladas másfácilmente y depositarse en las regiones pulmonares profundas del intercambio gaseoso.Aunque las partículas mayores de 5 μm son capaces de transmitir la infección a través de lafaringe o de la cavidad nasal, suelen quedar suspendidas y son eliminadas con la exhalación.Los métodos sugeridos para la aerosolización han incluido el empleo de fumigadores y dearrastre en el espacio aéreo ambiental a través de los sistemas de ventilación en oficinas yescuelas.

43. ¿Por qué los agentes infecciosos podrían ser más nocivos que los agentes

químicos?

Los agentes infecciosos tienen capacidad de replicarse, y algunos son contagiosos. Una vezhan sido liberadas las armas químicas y se logra la descontaminación, no continúa exponién-dose ya a ellas una gran población. Sin embargo, como sucede en la viruela, puede continuar latransmisión del agente infeccioso hasta que se controla el último caso. El control puede serdifícil, debido a los diferentes períodos de incubación y a la inmunidad individual.

44. ¿Durante cuánto tiempo puede permanecer viable el virus de la viruela fuera

del huésped humano?

El virus de la viruela puede permanecer en estado viable durante meses sobre objetos inanima-dos, como ropas y almohadas. Durante las guerras contra los franceses y los indios, los britá-nicos distribuyeron mantas infectadas con viruela, con lo que se aniquiló a casi el 50% de lastribus indias.

45. Dado que la vacuna de la viruela es una vacuna viva, ¿puede desarrollarse

viruela en los pacientes a partir de ella?

No. Aunque los virus de la variola-vacuna y de la viruela son ortopoxvirus, son organismosdiferentes. Aunque el virus de la variola puede causar reacciones graves, como vaccinia gene-ralizada, que puede ser muy similar a la viruela, no causa la auténtica enfermedad.

PÁGINAS WEB

1. http://www.aidworkers.net/technical/health/epidemiology.html

2. http://www.brown.edu/Courses/Bio_160/Projects1999/av/mainpage.html

3. http://www.bt.cdc.gov/Agent/agentlist.asp

4. http://www.fda.gov/fdac/features/795_antibio.html

5. http://www.syndromic.org/syndromicconference/2002/Supplementpdf/Pavlin.pdf

6. http://www.niaid.nih.gov/factssheets/antimicro.htm.

7. http://www.nobelprize.org/medicine/laureates/1928/press.html

8. http://www.microbeworld.org.htm/cissues/resist/resist_1.htm

9. Wikipedia:http://en.wikipedia.org/wiki/World_War_I

Page 94: Epidemiología y bioestadística secretos   nordness1ed

BIBLIOGRAFÍA

1.• Daigle CC, Chalupa DC, Gibb FR, et al: Ultrafine particle deposition in humans during rest andexercise. Inhal Toxicol 15(6):539–552, 2003.

2.• Fenner F, Henderson DA, Arita I, et al. Smallpox and its Eradication. Geneva, Switzerland,World Health Organization, 1988.

3.• Gates RA. Infectious Disease Secrets, 2nd ed. Philadelphia, Hanley & Belfus, 2003.4.• Jaeckel E. Treatment of hepatitis C with interferon alfa-2b. N Engl J Med 345:1252–1257, 2001.5.• MacFarlane J. Community-acquired pneumonia. Br J Dis Chest 81, 116–127, 1987.

TRANSMISIÓN DE ENFERMEDADES E INVESTIGACIÓN DE EPIDEMIAS 93

Page 95: Epidemiología y bioestadística secretos   nordness1ed

95

ASOCIACIÓN Y CAUSALIDADChristopher Jankosky, MD, MPH

1. ¿Es lo mismo la asociación que la causalidad?

No. Una asociación es una relación estadística entre dos o más sucesos, características u otrasvariables. Para apoyar la existencia de causalidad se requiere un nivel probatorio superior. Lacausalidad implica que un cambio en una variable es responsable, directa o indirectamente, deun cambio observado en otra variable.

2. ¿Demuestran causalidad los estudios epidemiológicos?

No. Los estudios epidemiológicos no pueden demostrar que exista causalidad. Tales estudios,no obstante, pueden ser útiles para apoyar una asociación causal.

3. ¿A qué cuatro mecanismos puede deberse una asociación entre una

exposición y un desenlace?

■ Carácter espurio (es decir, artefacto): la asociación es el resultado de un error o sesgo enel diseño, la ejecución o el análisis del estudio.

■ Factor de confusión: la relación entre una exposición y el desarrollo de una enfermedad sedistorsiona por una variable adicional. Para ser una variable de confusión, dicha variableha de asociarse tanto con la exposición como con la enfermedad. Si se identifican los fac-tores de confusión, en ocasiones se pueden utilizar ajustes para reducir al mínimo suimpacto.

■ Azar: siempre existe la posibilidad de que una asociación observada sea debida sólo al azar.Por ejemplo, un valor de p de 0,05 corresponde a la probabilidad de que el 5% de la asocia-ción se deba sólo al azar. Aun cuando se obtengan valores pequeños de p, siempre existe laposibilidad de que una asociación no exista realmente y que la relación observada lo sea porpura casualidad.

■ Causalidad: una asociación debida a un mecanismo causal puede determinarse general-mente después de que se hayan considerado los tres mecanismos anteriores y se empleencriterios como los postulados de Hill. Una asociación causal hace referencia a un factor que,de modo directo o indirecto, causa el desenlace observado.

4. ¿Qué es un factor de riesgo?

Una condición, elemento o actividad que puede afectar de modo adverso a la salud de un indi-viduo. Se asocia de modo consistente con una mayor probabilidad de desarrollo de una enfer-medad. Por otra parte, los factores protectores son aquellas condiciones que disminuyen lasprobabilidades para que se desarrolle una enfermedad en una persona concreta.

5. ¿Es lo mismo un factor de riesgo que una causa?

No. Los factores de riesgo en un paciente determinado sólo se asocian con una mayor probabi-lidad de desarrollo de una enfermedad o afección. No implican necesariamente una relación decausa a efecto.

CA

PÍT

ULO

6

Page 96: Epidemiología y bioestadística secretos   nordness1ed

6. ¿De qué modo cuantifican los epidemiólogos el riesgo?

Con frecuencia, los epidemiólogos consideran el riesgo bajo los conceptos siguientes:■ Riesgo absoluto: la magnitud del riesgo de enfermedad en un grupo de personas con una

exposición específica.■ Riesgo relativo: la fuerza de la asociación entre una exposición y una enfermedad.■ Riesgo atribuible: la proporción de riesgo de enfermedad que puede atribuirse a una

exposición.

ASOCIACIÓN Y CAUSALIDAD96

7. ¿Cuáles son los diseños de estudio que se utilizan habitualmente para

determinar si existe asociación entre una característica específica y una

enfermedad?

Los dos diseños más habituales son el estudio de casos y controles y el estudio de cohortes.Ambos evalúan las características individuales, y por ello son extraordinariamente útiles paradeterminar si existe una asociación. Para cada sujeto individual, se dispone de informaciónsobre las características y el desenlace de la enfermedad. Como es posible el emparejamientode datos individuales, puede utilizarse un análisis más potente y constante para evaluar el fac-tor de confusión, la modificación del efecto y el sesgo. Por ello, los estudios de las característi-cas individuales son el método epidemiológico utilizado con mayor frecuencia para evaluar lasasociaciones.

8. ¿Qué es un estudio ecológico?

Un estudio ecológico evalúa las características de grupo en una población. Los datos utilizadosen estos estudios no corresponden a un individuo concreto en cuanto a factor de riesgo ydesenlace. Estos estudios incluyen sólo datos de grupos, o de una población en su totalidad,con frecuencia obtenidos a partir de grandes bases de datos centralizadas.

Un ejemplo de estudio ecológico es la asociación entre las tasas crecientes de obesidad ylas tasas crecientes de diabetes en Estados Unidos. Aunque un estudio así no demuestra queen los individuos obesos se esté desarrollando diabetes, genera una hipótesis que puede serexplorada mediante un estudio de casos y controles o un estudio de cohortes de las caracterís-ticas individuales.

9. ¿Qué es la falacia ecológica?

Los estudios ecológicos evalúan características de grupo en una población. Dado que no sesigue a los individuos, no es posible atribuir una relación causal a una asociación observada.Por ejemplo, los países con una elevada ingesta promedio de grasa en la alimentación tiendentambién a tener mayores tasas de cáncer de mama. Sin embargo, donde hay mayores tasas deingesta de grasa y mayores tasas de cáncer de mama es en los países más industrializados. Nopueden tomarse en consideración todas las diferencias entre los países industrializados y los

PUNTOS CLAVE: TIPOS DE ASOCIACIÓN

1. Causalidad.

2. Carácter espurio (es decir, artefacto).

3. Factor de confusión.

4. Azar.

Page 97: Epidemiología y bioestadística secretos   nordness1ed

que se encuentran en vías de desarrollo. Por ello, quedan necesariamente excluidos otrosmuchos factores causales potenciales.

Además, no puede considerarse la variabilidad entre los individuos. En el ejemplo preceden-te, no se sabe si las mujeres en las que se estaba desarrollando cáncer de mama eran las mis-mas que tenían una alimentación rica en grasa. Puede que las que padecieran cáncer de mamacomieran predominantemente alimentos bajos en grasa. Los estudios ecológicos son valiosospara sugerir campos de futuras investigaciones, pero, por sí mismos, no pueden demostraruna relación causal.

10. ¿Por qué con frecuencia se hace referencia a Austin Bradford Hill en la

literatura de la causalidad?

Se han propuesto numerosas directrices para permitir una evaluación crítica y derivar inferen-cias causales a partir de estudios epidemiológicos. Mayoritariamente se atienen al empleo detoda la información disponible para establecer si una asociación es causal. Las directrices másampliamente citadas corresponden a los denominados criterios de Hill.

Hill propuso estos criterios en 1965 en forma de lista de estándares, adaptándolos a partirdel informe de 1964 del U.S. General Surgeon sobre tabaquismo y salud. Sirven como guíageneral, y no necesariamente han de cumplirse todos ellos para establecer la causalidad. Aun-que algunos de estos criterios han sido cuestionados en los últimos 40 años, siguen siendo unmarco razonable por el que se pueden determinar asociaciones causales.

ASOCIACIÓN Y CAUSALIDAD 97

11. ¿Cuáles son los criterios de Hill en relación con la causalidad?

■ Fuerza de la asociación: cuanto más fuerte sea la asociación (p. ej., riesgo relativo u opor-tunidad relativa), mayor probabilidad de que la relación sea causal.

■ Consistencia: la asociación se observa de modo repetido en estudios llevados a cabo porpersonas diferentes, en diferentes marcos, entre diferentes poblaciones y con empleo demétodos diferentes.

■ Especificidad: puede aislarse una exposición específica de otras, y asociarse con una enfer-medad específica. Éste es quizá el criterio más difícil de cumplir, porque en la prácticamuchas exposiciones (p. ej., cigarrillos o radiación) se asocian con múltiples efectos, y lasenfermedades específicas tienen con frecuencia, más de una causa.

■ Temporalidad: el factor que se supone ha causado la enfermedad tiene que haberse produ-cido o presentado antes del desarrollo de la enfermedad.

■ Gradiente biológico: existe una relación entre la dosis y la respuesta, de modo que a medi-da que aumenta la exposición, aumenta también el riesgo de desarrollo de la enfermedad osu gravedad.

■ Verosimilitud: la relación es explicable de acuerdo con los conocimientos actuales. Hillreconoció que éste era un criterio que no se puede exigir, ya que habrá asociaciones nuevasque descubran deficiencias en el pensamiento biológico actual.

PUNTOS CLAVE: TIPOS DE CAUSALIDAD

1. Directa o indirecta.

2. Necesaria y/o suficiente.

3. Inmediata o remota.

Page 98: Epidemiología y bioestadística secretos   nordness1ed

■ Coherencia: la asociación no entra seriamente en conflicto con la historia y la biología delproceso de la enfermedad.

■ Prueba experimental: los experimentos apoyan la asociación.■ Analogía: previamente, se han descrito ejemplos de asociaciones similares en relación con

otras entidades morbosas.Hill AB: The environment and disease: Association or causation? Proc R Soc Med 58:295–330, 1965.

12. ¿Cuál es la jerarquía de las pruebas experimentales?

No todas las pruebas experimentales tienen el mismo peso. La jerarquía de los diseños deinvestigación epidemiológica tiene cuatro niveles principales. Del más fuerte al más débil,éstos son:1.• Ensayos clínicos aleatorizados.2.• Estudios de cohortes.3.• Estudios de casos y controles y estudios transversales.4.• Casos clínicos y series de casos.

13. ¿Cuál es la diferencia entre causalidad directa e indirecta?

La causalidad directa describe una vía causal en la que un factor causa directamente una enfer-medad, sin etapas intermedias. La causalidad indirecta describe una relación en la que un fac-tor causa una enfermedad pasando por una o más etapas intermedias. Debido a la complejanaturaleza de la biología y fisiología humanas, casi siempre hay etapas intermedias en las rela-ciones observadas epidemiológicamente.

14. ¿Cuáles son los cuatro tipos de relaciones causales?

■ Necesaria y suficiente: un factor es necesario (es decir, se produce la enfermedad sólo sise halla presente el factor), y suficiente (es decir la exposición siempre lleva a la enferme-dad). Este tipo de relación se observa de modo muy infrecuente.

■ Necesaria pero no suficiente: se requiere más de un factor, por lo general, en una secuen-cia temporal. Los estadios de comienzo y progresión asociados con los modelos de carci-nogénesis son un ejemplo de este tipo de relación causal.

■ Suficiente pero no necesaria: un factor específico puede causar una enfermedad, pero otrosfactores por sí mismos pueden causar la misma enfermedad. Por ejemplo, la deficiencia envitamina B12 puede causar anemia, pero otros factores también pueden dar lugar a anemia.

■ Ni suficiente ni necesaria: un factor específico puede combinarse con otros factores y pro-ducir una enfermedad. Sin embargo, puede producirse la enfermedad incluso en ausenciadel factor. Es éste un modelo causal observado con frecuencia en las enfermedades cróni-cas. Por ejemplo, múltiples factores de riesgo conocidos para el desarrollo de la cardiopatíaaterosclerótica no son ni suficientes ni necesarios.

15. ¿Qué es un factor de confusión?

Existe el denominado fenómeno de confusión cuando se produce la asociación exposición-desenlace únicamente porque un tercer factor distinto se asocia tanto con la exposición comocon el desenlace. La asociación observada es verdadera, pero no es causal (véase la Figura 6-1). Un ejemplo habitual de confusión es la relación entre el consumo de alco-hol, el cáncer de pulmón y fumar cigarrillos. Los individuos que fuman más cigarrillos tienden atomar más bebidas alcohólicas, y los individuos que fuman más cigarrillos tienen mayor riesgode cáncer de pulmón. Los estudios epidemiológicos han puesto de manifiesto una asociaciónentre el consumo de bebidas alcohólicas y el cáncer de pulmón, aunque no hay un nexo causalentre ellos: fumar cigarrillos es pues un factor de confusión. Después de controlar el hecho defumar cigarrillos, desaparece la asociación entre consumo de alcohol y cáncer de pulmón.

ASOCIACIÓN Y CAUSALIDAD98

Page 99: Epidemiología y bioestadística secretos   nordness1ed

16. Indique algunos métodos para minimizar los factores de confusión

(confounding).

■ Se pueden emparejar (matching) los participantes del estudio en relación con la variable deconfusión potencial (p. ej., edad o sexo).

■ Puede recogerse información sobre el factor de confusión potencial durante el estudio, ypuede ajustarse su posible efecto durante el análisis.

■ Puede restringirse el estudio a un grupo poblacional que carezca del factor de confusión,rasgo o conducta.

17. Explique la modificación del efecto.

Se conoce como modificador del efecto un factor que cambia la fuerza de una asociación entredos variables. La interacción por el tercer factor (el modificador del efecto) lleva a una asocia-ción mayor o menor de la que se esperaría en su ausencia.

18. ¿Qué es el sinergismo?

El sinergismo es un tipo de modificación del efecto. Hace referencia a una situación en la quedos factores de riesgo, cuando se hallan presentes juntos, dan lugar a un efecto mayor que unsimple efecto aditivo. Por ejemplo, tanto el fumar cigarrillos como la exposición al asbestoaumenta el riesgo de cáncer de pulmón. Sin embargo, cuando un individuo se halla expuesto alos dos factores, el riesgo de cáncer de pulmón es muy superior al que se esperaría al sumarsimplemente los dos riesgos. Este concepto se basa, generalmente, en consideracionesestadísticas y, bajo circunstancias ideales, debe ser validado por el conocimiento biológico.

19. Defina qué es un sesgo.

Un sesgo es un error sistemático en el diseño, desarrollo o análisis de un estudio, que da lugar aun resultado que difiere de la verdad. El sesgo no es, sencillamente, un error en el cálculo. Porejemplo, supongamos un diseño de estudio con un sesgo inherente que fue realizado de modoimpecable por cinco instituciones de investigación diferentes. El promedio de sus resultadospodría producir un cálculo equivocado del efecto de una exposición sobre el riesgo de enfermedad.

20. Indique las dos categorías principales de sesgo.

Sesgo de información y sesgo de selección.

ASOCIACIÓN Y CAUSALIDAD 99

Figura 6-1. Relación causal frente a relación debida a uno o varios facto-res de confusión. (De Gordis L. Epidemiology. 3rd ed. St. Louis: Elsevier-Saunders, 2004.)

Aso

cia

ció

n o

bserv

ad

aA

so

cia

ció

n o

bserv

ad

a

A. Causal

Factor X

B. Debida a algúnfactor de confusión

Característicaen estudio

Enfermedad Enfermedad

Característicaen estudio

Page 100: Epidemiología y bioestadística secretos   nordness1ed

21. ¿Qué es un sesgo de información?

Un sesgo de información es el resultado de unos procedimientos imperfectos en la recogida dedatos o en definiciones imperfectas de las variables del estudio.

22. ¿Qué es un sesgo de selección?

Puede producirse un sesgo de selección cuando un investigador selecciona inadecuadamentesu fuente de población o sus criterios de elegibilidad, o cuando hay condiciones que puedeninfluir sobre la elección de los individuos que participan. Aunque en algunos casos de sesgo deselección la validez interna del estudio puede no verse afectada, es probable que afecte a lageneralización o validez externa del estudio.

El sesgo de exclusión es un tipo de sesgo de selección en el que los investigadores aplicancriterios de elegibilidad diferentes a los casos y a los controles. Por ejemplo, consideremos unestudio de casos de abuso de drogas en la sala de urgencias del centro de una ciudad. En rela-ción con una población control, los investigadores deciden utilizar entrevistas telefónicas delos individuos cuyas direcciones se hallan en el mismo vecindario. Un estudio así excluiría alos que no tienen domicilio o a los que no disponen de teléfono.

El denominado sesgo de Berkson es otro tipo de sesgo de selección. Surge a partir de unfenómeno matemático cuando los estudios utilizan las tasas de ingreso hospitalario. Las tasasde hospitalización en los individuos con la enfermedad objeto de estudio difieren de las tasasde los que tienen la enfermedad empleada como control.

23. ¿Cuáles son los cuatro tipos principales de sesgo de información?

■ Sesgo de clasificación errónea (misclassification bias).■ Sesgo de recuerdo (recall bias).■ Sesgo de notificación (reporting bias).■ Sesgo de vigilancia (surveillance bias).

24. Describa el sesgo de clasificación errónea (misclassification bias).

Los participantes en el estudio pueden ser asignados de modo erróneo a un grupo de estudioincorrecto. Por ejemplo, en un estudio de casos y controles algunos de los casos pueden clasi-ficarse erróneamente como controles y algunos de los controles pueden ser clasificados demodo erróneo como casos.

ASOCIACIÓN Y CAUSALIDAD100

PUNTOS CLAVE: TIPOS DE SESGO

1. Sesgo de información.

2. Sesgo de clasificación errónea.

3. Sesgo de recuerdo.

4. Sesgo de notificación.

5. Sesgo de vigilancia.

6. Sesgo de selección.

7. Sesgo de exclusión.

8. Sesgo de tiempo de inclusión.

9. Sesgo de Berkson.

Page 101: Epidemiología y bioestadística secretos   nordness1ed

Puede introducirse el sesgo de modo aleatorio (es decir, no diferencial), como cuando unode los diferentes entrevistadores realiza más encuestas a pacientes que los otros entrevistado-res. En la clasificación errónea no diferencial existe un error en el método de recogida de datosque afecta por igual a los casos y a los controles. Este hecho puede equilibrar ambos grupos,disminuyendo el sesgo global en la asociación resultante.

O el sesgo puede ser sistémico (es decir, diferencial), como cuando todos los entrevis -tadores preguntan a los pacientes casos más preguntas de encuesta que las que preguntan a los pacientes controles. En la clasificación diferencial errónea, la tasa de clasificación errónea es mayor en los casos o en los controles, con lo que se introduce un posible errorsignificativo.

25. Describa el sesgo de recuerdo.

El sesgo de recuerdo es un recuerdo diferencial entre los casos y los controles. Una informa-ción importante puede ser recordada por el paciente caso, pero olvidada fácilmente por el con-trol. Existe una tendencia natural a que un individuo afectado de una enfermedad intente identi-ficar una exposición infrecuente que pueda haber contribuido a su enfermedad, lo que confrecuencia da lugar a un sesgo de clasificación errónea.

26. Describa el sesgo de notificación.

Se produce el sesgo de notificación cuando un mayor porcentaje de sujetos casos o controlesse muestran reacios a notificar una exposición debido a actitudes, percepciones u otras preo-cupaciones. Esta retirada de información también puede dar lugar a un sesgo de clasificaciónerrónea.

27. Describa un sesgo de vigilancia.

Es mejor descubrir una enfermedad en una población monitorizada que en la población gene-ral. La subpoblación de pilotos de aviones es sometida a evaluaciones médicas de rutina fre-cuentes e intensivas. Algunas afecciones pueden tener una mayor prevalencia en los pilotosque en la población global, en la que no se efectúa esta vigilancia de rutina.

28. ¿Qué es el sesgo del tiempo de inclusión (lead-time bias)?

Es un hecho reconocido que el cribado médico adelanta la fecha de diagnóstico de una enfer-medad. Considere que, como promedio, las mujeres sometidas a cribado en busca de cáncerde mama dispondrán de un estadio de su enfermedad más pronto que las que acuden fuera deun programa de cribado. Se define como tiempo de inclusión la diferencia en el tiempo entre lafecha del diagnóstico con cribado y la fecha del diagnóstico sin cribado.

Considere, por ejemplo, un nuevo tratamiento anticanceroso que se está probando en ungrupo de pacientes sometidos a cribado. A menos que se considere el tiempo de inclusión, sutiempo de supervivencia no debe ser comparado con un grupo de pacientes control no someti-do a cribado. De otro modo, el aumento en el tiempo de supervivencia debido solamente a lafecha avanzada del diagnóstico dará lugar a un sesgo en el tiempo de inclusión.

29. ¿Qué es el efecto del trabajador sano?

Las subpoblaciones de trabajadores suelen ser más sanas que la población general. No sólolos sanos tienen una mayor probabilidad de obtener empleo sino que, una vez lo han consegui-do, tienen una mayor probabilidad de tener un seguro médico pagado por su empresa, lo quemejora el acceso al sistema sanitario en comparación con los que no tienen trabajo. Así, hayque ser cauteloso al interpretar estudios en los que se comparan poblaciones trabajadoras conpoblaciones generales.

ASOCIACIÓN Y CAUSALIDAD 101

Page 102: Epidemiología y bioestadística secretos   nordness1ed

30. Cuando los tamaños de las muestras son pequeños, quizá debido a una

exposición o enfermedad infrecuente, puede ser difícil tener suficiente poder

estadístico para demostrar una asociación. Describa un método para estudiar

este problema.

Puede efectuarse una revisión sistemática cuantitativa, que recibe la denominación habitual demetaanálisis. En este análisis, se suman los resultados de estudios múltiples que se conside-ran combinables, para obtener un cálculo más preciso de la relación en estudio. Aunque elmetaanálisis no puede superar las limitaciones y sesgos potenciales de los estudios individua-les, puede ser un método muy útil para aclarar una asociación.

ASOCIACIÓN Y CAUSALIDAD102

PÁGINAS WEB

1. http://www.acepidemiology.org

2. http://www.apic.org

BIBLIOGRAFÍA

1.• Gordis L: Epidemiology, 2nd ed. Philadelphia, W.B. Saunders, 2000.2.• Greenberg RS, Daniels RD, Flanders WD, et al: Medical Epidemiology. New York, Lange Medical

Books/McGraw-Hill, 2001.3.• Hill AB: The environment and disease: Association or causation? Proc R Soc Med 58:295–300, 1965.4.• Lilienfeld DE, Stolley PD: Foundations of Epidemiology, 3rd ed. New York, Oxford University Press, 1994.5.• Rothman KJ: Epidemiology: An Introduction. Oxford, Oxford University Press, 2002.

Page 103: Epidemiología y bioestadística secretos   nordness1ed

103

DISEÑOS DE MODELOS DE INVESTIGACIÓNAshita Tolwani, MD, MSc

1. ¿Qué es un diseño de investigación?

Es el planteamiento específico que mejor se ajusta para responder a una cuestión de investiga-

ción concreta.

2. Indique las dos estrategias de diseño básico utilizadas en la investigación

epidemiológica.

■ Diseño de estudio descriptivo.■ Diseño de estudio analítico.

3. ¿Qué describen los estudios descriptivos?

Las características generales de la distribución de una enfermedad o afectación en relación con

una persona, lugar y tiempo.

4. ¿Qué son los estudios analíticos?

Los estudios analíticos evalúan sistemáticamente las relaciones que se sospechan entre una

exposición y un desenlace en salud. Con frecuencia, prueban hipótesis formuladas a partir de

estudios descriptivos, con el fin de determinar si una exposición particular causa o previene

una enfermedad. Como consecuencia, suelen aportar una prueba más sólida sobre las posibles

relaciones.

5. ¿En qué medida son útiles los estudios descriptivos?

■ Pueden ayudar a las autoridades sanitarias y a los administradores a asignar los recursos

de modo eficiente.■ Son útiles para desarrollar programas de prevención y educación efectivos.■ Ayudan a formular hipótesis que pueden ser probadas con el empleo de un diseño

analítico.

6. ¿Por qué son más baratos y más rápidos los estudios descriptivos que los

estudios analíticos?

Utilizan información que se recoge de modo rutinario y de la que se dispone fácilmente, como

los datos de la producción y ventas, historias clínicas de hospitales, datos del censo y registros

de estadísticas vitales.

7. Enumere los tipos de estudios descriptivos.

■ Estudios de correlación (p. ej., estudios de poblaciones o estudios ecológicos).■ Casos clínicos.■ Series de casos.■ Estudios transversales.

CA

PÍT

ULO

7

Page 104: Epidemiología y bioestadística secretos   nordness1ed

8. ¿Qué son los estudios de correlación?

Los estudios de correlación utilizan datos a partir de poblaciones completas para comparar fre-

cuencias de enfermedades, ya sea entre grupos diferentes durante el mismo período de tiempo

o en la misma población en tiempos diferentes.

9. ¿Cuáles son las limitaciones de los estudios de correlación?

Dado que los estudios de correlación utilizan datos a partir de poblaciones completas en lugar

de individuos, no pueden asociar una exposición a la incidencia de una enfermedad en una

misma persona. Otra limitación es la incapacidad para controlar los efectos de otros factores

que pueden estar asociados con el desenlace. (Estos factores se conocen también con el nom-

bre de variables de confusión).

10. Defina un caso clínico.

Es una descripción detallada de la experiencia de un único paciente.

11. Defina una serie de casos.

Una serie de casos describe las características de un número de pacientes con una enferme-

dad, característica o exposición determinadas.

12. ¿Cuáles son las limitaciones de los casos clínicos y de las series de casos?

■ Los casos clínicos se basan en la experiencia de una sola persona; es decir, la información

es anecdótica.■ Las series de casos carecen de un grupo de comparación apropiado.

13. ¿Qué es un estudio transversal?

Un estudio transversal valora el estado de un individuo con respecto a la presencia o ausencia

tanto de exposición como de enfermedad en el mismo momento. Proporciona una instantánea

de la experiencia de una población en un tiempo especificado.

14. Indique la solidez de un estudio transversal.

■ Proporciona estimaciones de la prevalencia de una enfermedad o de otros desenlaces de

salud.■ Puede estudiar poblaciones completas o una muestra representativa de las mismas.■ Proporciona una mayor capacidad para generalizar los resultados.

15. Indique las limitaciones de un estudio transversal.

■ Dado que se valoran, al mismo tiempo, la exposición y la enfermedad, no puede determinar-

se la relación temporal entre una exposición y una enfermedad.■ Está sujeto a sesgo de selección y de observación (comentado más adelante).

16. Cite los dos tipos principales de estudios analíticos.

■ Estudios observacionales.■ Estudios de intervención (es decir, estudios clínicos).

17. Describa el formato del estudio de observación.

Los estudios de observación examinan la asociación entre los factores de riesgo y los desenla-

ces. Los investigadores no interfieren con ninguno de los factores del estudio ni los manipulan

sino que, sencillamente, observan el curso natural de los acontecimientos y explican lo que

observan con medidas de asociación.

DISEÑOS DE MODELOS DE INVESTIGACIÓN104

Page 105: Epidemiología y bioestadística secretos   nordness1ed

18. Describa el formato de los estudios de intervención (es decir, estudios

experimentales).

Los estudios de intervención exploran la asociación entre intervenciones y desenlaces. Los

investigadores intentan demostrar que A causa B al manipular factores específicos que podrían

tener algo que ver con la causalidad de algún desenlace.

19. ¿Cuál es la diferencia entre los dos tipos de estudio (observacional

y de intervención)?

La influencia activa del estado de exposición por parte del investigador.

20. ¿Cuáles son los diferentes tipos de estudios observacionales?

■ Estudios con casos y controles.■ Estudios de cohortes.

21. ¿Qué es un estudio de casos y controles?

En un estudio con casos y controles se seleccionan sujetos en los que se desarrolla una afecta-

ción (es decir, una enfermedad) y sujetos en los que no se ha desarrollado la enfermedad, y se

comparan los dos grupos con respecto a su exposición previa. Los sujetos con la afectación

reciben la denominación de casos; los sujetos sin la afección reciben la denominación de

controles.

22. Represente esquemáti-

camente el momento de

inicio de la investigación

en un estudio con casos

y controles en relación

con la exposición y con

el desenlace.

Véase la Figura 7-1.

23. Ponga un ejemplo de

diseño de estudio con

casos y controles.

Para probar la hipótesis de que el estrógeno es un factor potencial del cáncer uterino, se selec-

ciona para su evaluación un grupo de mujeres con cáncer de útero (es decir, casos) y un grupo

de mujeres sin cáncer de útero que, de modo exacto, reflejan la población de la que proceden

los casos (es decir, controles). Se compara la utilización de estrógeno por las mujeres del

grupo de casos, con el consumo de estrógenos por las mujeres del grupo control.

24. ¿Cuáles son los factores más importantes al elegir el grupo control en un

estudio de casos y controles?

Los factores de riesgo de las pacientes control deben ser representativos de los que hay en la

población «en riesgo» de convertirse en casos. En otras palabras, las pacientes control habrían

sido incluidas en el estudio como casos si tuviesen la enfermedad. Igualmente, sus exposicio-

nes deben ser medibles con la misma exactitud que la de los casos.

25. Enumere las ventajas de los estudios de casos y controles.

■ Los estudios de casos y controles son más baratos y más rápidos, en comparación con los

otros diseños analíticos.■ Son útiles para estudiar enfermedades con largos períodos de latencia.

DISEÑOS DE MODELOS DE INVESTIGACIÓN 105

Figura 7-1. Estudio de casos y controles clásico. (De Vetter N,Matthews I. Epidemiology and Public Health Medicine. NewYork: Churchill Livingstone, 1999.)

Suceso/factor

de riesgo

Proporción

de expuestos Casos: todos tienen

la enfermedad

Controles: ninguno

tiene la enfermedad

Proporción

de expuestosSuceso/factor

de riesgo

Page 106: Epidemiología y bioestadística secretos   nordness1ed

■ Son útiles para estudiar enfermedades infrecuentes, ya que los sujetos son seleccionados

atendiendo al estado de su enfermedad.■ Permiten la investigación de múltiples exposiciones simultáneamente.

26. ¿Cuáles son las limitaciones de los estudios de casos y controles?

■ No son adecuados para evaluar una exposición infrecuente, a menos que el estudio sea muy

amplio o la exposición sea habitual entre los que tienen la enfermedad. ■ No puede efectuarse un cálculo de la incidencia de enfermedad en los grupos expuesto y no

expuesto, a menos que el estudio de casos y controles se base en la población. ■ No siempre puede establecerse la relación temporal entre exposición y enfermedad.■ Están sujetos a sesgo (comentado más adelante).

27. ¿En qué difiere el análisis de los estudios de casos y controles con respecto

a otros tipos de estudios?

Dado que en los estudios de casos y controles se desconoce la tasa de enfermedad, no puede calcu-

larse el riesgo relativo. Se emplea la posibilidad relativa (odds ratio) para calcular el riesgo relativo.

28. ¿Cuándo la posibilidad relativa es un estimador razonable del riesgo relativo?

La posibilidad relativa y el riesgo relativo son comparables en magnitud cuando la enfermedad

es infrecuente.

29. ¿Qué son los estudios de cohortes?

En un estudio de cohortes los sujetos se definen por la presencia o ausencia de una exposición

a un factor que se supone de riesgo de una enfermedad, y luego se les sigue en el tiempo.

30. ¿Qué otro nombre reciben los estudios de cohortes?

Estudios longitudinales o estudios prospectivos.

31. Cite dos tipos de estudios de cohortes.

■ Prospectivo.■ Retrospectivo.

32. ¿Cuáles son las diferencias entre los estudios de cohortes prospectivos

y los estudios de cohortes retrospectivos?

■ En un estudio de cohortes prospectivo se identifica a un grupo de sujetos expuestos a un

factor de riesgo (es decir, casos), junto con un grupo de sujetos no expuestos (es decir,

controles). A continuación, se sigue prospectivamente a los dos grupos, y se determina la

incidencia de la enfermedad en cada grupo. ■ En un estudio de cohortes retrospectivo se identifica a un grupo de sujetos en los que ya se han

producido las exposiciones y los desenlaces de interés cuando se comienza el estudio; sin

embargo, las exposiciones y los desenlaces no constituyen un factor para agrupar a los sujetos.

33. Muestre un esquema que ilustre la diferencia entre el diseño de los estudios

de cohortes prospectivos y los retrospectivos.

Véanse las Figuras 7-2 y 7-3.

34. Mencione un factor importante en el diseño de un estudio de cohortes

retrospectivo.

La elección de los sujetos del estudio ha de realizarse atendiendo únicamente al estado de

exposición, sin ningún conocimiento del desenlace.

DISEÑOS DE MODELOS DE INVESTIGACIÓN106

Page 107: Epidemiología y bioestadística secretos   nordness1ed

35. ¿Cómo deben relacionarse los grupos expuestos y no expuestos

en un estudio de cohortes?

Los dos grupos deben ser similares en todos los aspectos, a excepción del estado de exposi-

ción al factor o factores de riesgo potenciales.

36. Indique las ventajas de los estudios de cohortes.

■ Son útiles para estudiar exposiciones infrecuentes.■ Pueden examinar múltiples efectos de una exposición. ■ Pueden demostrar una asociación temporal entre exposición y enfermedad.■ Posibilitan la determinación de la incidencia de la enfermedad en los grupos expuestos y no

expuestos.

DISEÑOS DE MODELOS DE INVESTIGACIÓN 107

Figura 7-2. Marco temporal para un estudio hipotético con controles decarácter prospectivo comenzado en 2004. (De Gordis L. Epidemiology.3rd ed. Philadelphia: Elsevier-Saunders, 2004.)

Figura 7-3. Marco temporal para un estudio hipotético de cohortes decarácter retrospectivo comenzado en 2004. (De Gordis L. Epidemiology.3rd ed. Philadelphia: Elsevier-Saunders, 2004.)

Prospectivo

2004

2014

2024

1984

1994

2004

Población

definida

Expuestos No expuestos

Expuestos No expuestos

SIN ALEATORIZAR

Enfermedad EnfermedadSin

enfermedad

Sin

enfermedad

Enfermedad EnfermedadSin

enfermedad

Sin

enfermedad

Poblacióndefinida

SIN ALEATORIZAR

Retrospectivo

Page 108: Epidemiología y bioestadística secretos   nordness1ed

37. Enumere las limitaciones de los estudios de cohortes.

■ Se requieren estudios grandes, de mucho tiempo de duración y costosos, si la enfermedad

es infrecuente o de desarrollo lento. ■ Si son retrospectivos, se requiere disponer de registros adecuados.■ Si durante el estudio se pierden casos, la pérdida puede dar lugar a un sesgo de selección

(comentado más adelante).

38. Describa el estudio de casos y controles anidado (nested).

Es un tipo de estudio de casos y controles que obtiene sus casos y controles a partir de una

población cohorte que ha sido seguida durante un período de tiempo.

39. Aporte un esquema de un estudio de casos y controles anidado (nested).

Véase la Figura 7-4.

DISEÑOS DE MODELOS DE INVESTIGACIÓN108

Figura 7-4. Diagrama de un estudio de casos y controles anidado (nested).(De Gordis L. Epidemiology. 3rd ed. Philadelphia: Elsevier-Saunders, 2004.)

«Casos»

Desarrollo dela enfermedad

Sin desarrollode la

enfermedad

Población

Años

Datos iniciales y/osuero, orina u otrasmuestras obtenidas

ESTUDIO DE CASOS Y CONTROLES

Subgruposeleccionado

como «controles»

40. ¿Qué son los estudios de intervención?

Se realiza una intervención terapéutica o preventiva a un grupo de sujetos y se comparan sus

experiencias posteriores con las de los sujetos no sometidos a dicha intervención.

41. ¿Cuál es la estrategia básica de un estudio experimental?

Para demostrar que el tratamiento es efectivo, la tasa de mejoría en el grupo tratado debe ser

mayor que la tasa de mejoría en el grupo no tratado. Además, debe ser improbable que las dife-

rencias en las tasas estén causadas sólo por el azar.

42. ¿Cómo debe relacionarse el grupo control con el grupo de tratamiento?

El grupo control debe ser similar al grupo de tratamiento en todas las características asociadas

con el desenlace esperado, a excepción de que no deben recibir el tratamiento estudiado. El

grupo control puede estar recibiendo el tratamiento estándar para el factor de riesgo o, en su

lugar, un placebo.

Page 109: Epidemiología y bioestadística secretos   nordness1ed

43. Cite los tipos de estudios de intervención.

■ Ensayo clínico aleatorio controlado (RCT).■ Estudio cuasiexperimental (o semiexperimental).

44. ¿Qué es un ensayo clínico controlado (RCT)?

Es un diseño de estudio utilizado para evaluar la efectividad de intervenciones (p. ej., trata-

mientos farmacológicos y pruebas diagnósticas). Un RCT incluye un grupo de tratamiento y un

grupo control. El grupo de tratamiento recibe el tratamiento en investigación, mientras

que el grupo control no recibe tratamiento alguno o un tratamiento estándar actual. Los

pacientes se asignan a los grupos de modo aleatorio.

45. ¿Por qué se necesita un RCT para evaluar los tratamientos?

Cuando los RCT son suficientemente grandes y tienen un diseño cuidadoso pueden proporcio-

nar la mejor prueba de la existencia de una relación causa-efecto.

46. ¿Cuál es la finalidad de la aleatorización?

La asignación aleatoria ayuda a asegurar que los grupos de los estudios clínicos sean compa-

rables. Cada sujeto ha tenido la misma probabilidad de haber sido asignado a uno de los dos

grupos del estudio, de modo que ambos grupos sean similares en todas las características

(p. ej., sexo, edad, raza y gravedad de la enfermedad) que puedan afectar al desenlace.

47. ¿Garantiza la aleatorización que los grupos sean comparables?

No. El azar puede desempeñar un papel, y hacer que los grupos no sean comparables. Puede

reducirse el efecto de este error aleatorio utilizando muestras de tamaño suficientemente

grande.

48. Represente esquemáticamente un diseño de estudio aleatorio.

Véase la Figura 7-5.

DISEÑOS DE MODELOS DE INVESTIGACIÓN 109

Figura 7-5. Esquema de un estudio aleatorio con controles. (DeVetter N, Matthews I. Epidemiology and Public Health Medicine.New York: Churchill Livingstone, 1999.)

49. ¿Cuáles son los cuatro desenlaces posibles del esquema anterior?

1.• Los tratamientos no difieren, y se concluye de modo correcto que no difieren.

2.• Los tratamientos no difieren, pero se concluye de modo incorrecto que sí difieren.

3.• Los tratamientos difieren, pero se concluye de modo incorrecto que no difieren.

4.• Los tratamientos difieren, y se concluye de modo correcto que sí difieren.

50. ¿Cuáles son las ventajas de los RCT?

■ Su diseño es prospectivo.■ Eliminan sesgos al comparar dos grupos por lo demás idénticos.

Grupode

estudio

Aleatorio

Intervención

1

Intervención

2

Desenlace

1

Desenlace

2

Page 110: Epidemiología y bioestadística secretos   nordness1ed

51. ¿Cuáles son las desventajas de los RCT?

Son relativamente caros y laboriosos.

52. ¿Qué es un sesgo?

El sesgo (es decir, error sistemático) es un error en un estudio consecuencia de una valoración

incorrecta de la asociación entre exposición y riesgo de enfermedad.

53. Indique los dos tipos principales de sesgo.■ Sesgo de selección.■ Sesgo de observación (es decir, información).

54. ¿Es el error aleatorio una forma de sesgo?

No. El error aleatorio se produce por azar.

55. ¿Qué es un sesgo de selección?

Se produce un sesgo de selección cuando se selecciona a los participantes en el estudio de

modo que la asociación entre la exposición y la enfermedad difiere en relación con los partici-

pantes y los no participantes en el estudio.

56. Indique los modos diferentes en que puede producirse un sesgo de selección.■ Selección de un grupo de comparación inapropiado por el investigador.■ Autoselección por parte del sujeto (es decir, ofrecerse voluntario).■ Falta de respuesta por el sujeto (es decir, rechazo).■ Pérdida del seguimiento de los sujetos durante el estudio.■ Los sujetos fallecen durante el estudio.

57. ¿Qué tipos de estudio son susceptibles de sesgo de selección?■ Estudios de casos y controles.■ Estudios transversales.■ Estudios de cohortes (el sesgo de selección es menos habitual en los estudios de cohortes).

58. Proporcione un ejemplo de sesgo de selección.

Suponga que la eficacia de una nueva prueba de cribado para detectar un cáncer fue evaluada

en la comunidad comparando la tasa de incidencia de cáncer entre los que se ofrecieron volun-

tarios para la prueba con la tasa de incidencia entre los miembros de la comunidad que no fue-

ron sometidos a la prueba. Tal comparación sufre un sesgo de selección, ya que los sujetos

que se ofrecieron voluntarios para el cribado del cáncer pueden diferir con respecto a los que

no se ofrecieron voluntarios. Por ejemplo, los que se ofrecieron voluntarios pueden tener una

mayor conciencia en relación con la salud que los que no se ofrecieron voluntarios: los volun-

tarios pueden tener un régimen de alimentación y un régimen de ejercicio físico que reduce el

riesgo de cáncer y, por consiguiente, se podría esperar que tuvieran una menor tasa de cáncer.

59. ¿Cómo se produce un sesgo de observación?

El sesgo de observación es un error sistemático que se produce porque la información recogi-

da sobre los sujetos del estudio es errónea. Unos datos inexactos o incompletos pueden llevar

a aceptar unas asociaciones incorrectas.

60. Cite los tipos de sesgo de observación.■ Sesgo de recuerdo.■ Sesgo de entrevistador.■ Sesgo misceláneo.

DISEÑOS DE MODELOS DE INVESTIGACIÓN110

Page 111: Epidemiología y bioestadística secretos   nordness1ed

61. Defina cada tipo de sesgo de observación.

■ El sesgo de recuerdo se produce cuando los sujetos con una afectación o enfermedad

particular recuerdan su experiencia de exposición previa de modo diferente a como lo hacen

los que no tienen la enfermedad.■ El sesgo del entrevistador se produce cuando el investigador obtiene o interpreta la infor-

mación de modo diferente a partir de los que tienen la afectación y de los que no la tienen.■ El sesgo de clasificación errónea se produce cuando se comenten errores en la clasifica-

ción de la exposición o del estado de la enfermedad.

62. Proporcione un ejemplo de sesgo de recuerdo.

Suponga que se realiza un estudio para obtener información sobre la exposición en las malfor-

maciones al nacimiento al entrevistar a las mujeres que han tenido hijos con malformaciones al

nacimiento y a mujeres que no han tenido hijos con malformaciones al nacimiento. Las madres

que han dado a luz a niños con malformaciones al nacimiento tienen una mayor probabilidad

de recordar detalles sobre exposiciones, como medicamentos tomados, porque se hallan muy

motivadas para descubrir por qué los niños nacieron con malformaciones. Las madres que han

experimentado nacimientos normales de sus hijos no encuentran una razón convincente para

recordar tales detalles y pueden olvidar estas exposiciones.

63. ¿Cuál es el mejor diseño de estudio para responder a la pregunta anterior?

De casos y controles.

64. ¿Por qué el sesgo es más problemático en los estudios de casos y controles

que en cualquier otro diseño analítico?

Dado que tanto la exposición como el desenlace ya se han producido cuando se obtiene la

información de los pacientes del estudio, el conocimiento del estado de exposición puede

influir sobre la selección de los individuos para el estudio, lo que da lugar a sesgo de selección.

DISEÑOS DE MODELOS DE INVESTIGACIÓN 111

PUNTOS CLAVE: DISEÑOS DE LOS MODELOS DE INVESTIGACIÓN

1. Las dos estrategias básicas del diseño epidemiológico son el diseño del estudio descriptivo

y el diseño del estudio analítico.

2. Los estudios descriptivos examinan la distribución de las enfermedades en las poblaciones;

los estudios analíticos examinan los determinantes de las enfermedades en las poblaciones.

3. Los estudios descriptivos incluyen los estudios de correlación, los casos clínicos, las series

de casos y los estudios transversales.

4. Los estudios analíticos incluyen estudios observacionales y estudios intervencionistas.

5. Los estudios observacionales examinan el modo en que la exposición a los factores de riesgo

influye sobre la probabilidad de desarrollo de la enfermedad; en los estudios intervencionistas,

el investigador controla qué tratamiento recibe cada uno de los sujetos.

6. Los estudios observacionales incluyen estudios de cohortes y estudios de casos y controles,

y se hallan sujetos a sesgo de selección y a sesgo de observación.

7. Los estudios aleatorios controlados, un tipo de estudio intervencionista, proporcionan la prueba

más fiable de la efectividad del tratamiento.

Page 112: Epidemiología y bioestadística secretos   nordness1ed

Igualmente, el conocimiento del estado de la enfermedad puede influir sobre el modo en que se

describe la información sobre la exposición por parte de los sujetos o por parte del investiga-

dor, lo que causa un sesgo de recuerdo y un sesgo del entrevistador.

65. ¿Qué significa un estudio ciego o con enmascaramiento?

Se produce enmascaramiento del estudio cuando se oculta la asignación del tratamiento al

sujeto, pero no al observador.

66. ¿Qué significa un doble y un triple enmascaramiento?

El doble enmascaramiento (doble ciego) significa que ni el observador ni el sujeto son conoce-

dores de la asignación del tratamiento. El triple enmascaramiento (triple ciego) significa que el

observador, el sujeto y el sujeto que administra el tratamiento no son conocedores de las asig-

naciones del tratamiento.

67. ¿Cuál es la finalidad del enmascaramiento?

La finalidad del enmascaramiento es minimizar la posibilidad del sesgo de observación al

determinar el desenlace.

68. ¿Qué es un factor de confusión?

Un factor de confusión es un factor que se asocia con la exposición de interés y con el riesgo

de desarrollo de la enfermedad. Por tanto, puede ser incorrecta la asociación observada entre

la exposición de interés y el desenlace de la enfermedad. El factor de confusión causa también

error en las comparaciones entre los grupos si éstos no son verdaderamente comparables

debido a diferencias en la edad, el sexo, el estado de salud y otros factores de riesgo.

69. Indique un ejemplo de factor de confusión.

Suponga que un investigador está estudiado la relación entre cierta medicación y muerte. El

estudio demuestra una relación entre el empleo de la medicación y un mayor riesgo de muerte.

Sin embargo, la edad es un factor adicional que puede afectar a la asociación observada. Las

personas de mayor edad tienen un mayor riesgo de muerte que las personas más jóvenes. En

este ejemplo, la edad confunde la relación entre el empleo de la medicación y el riesgo de

fallecimiento.

70. ¿Qué métodos pueden emplearse en el diseño de estudios para controlar un

factor de confusión?

■ Aleatorización.■ Restricción.■ Emparejamiento.

71. Describa cómo los tres métodos arriba indicados controlan el factor de

confusión.

■ Ya se ha comentado la aleatorización, y es aplicable sólo a estudios de intervención. Con

una muestra de tamaño suficiente, la aleatorización permite controlar todos los factores de

confusión potenciales (incluidos los desconocidos al investigador) al ser distribuidos

de modo homogéneo entre los grupos de tratamiento.■ La restricción supone limitar la selección de los sujetos a los que tienen el mismo valor que

el factor que puede ser factor de confusión. Por ejemplo, si el sexo es un factor de confu-

sión potencial, la selección de los sujetos del estudio puede limitarse a un sexo específico.■ El emparejamiento implica la selección de pacientes de modo que queden distribuidos

idénticamente los factores de confusión potenciales entre los grupos de tratamiento.

DISEÑOS DE MODELOS DE INVESTIGACIÓN112

Page 113: Epidemiología y bioestadística secretos   nordness1ed

Por ejemplo, si la edad y el sexo son factores de confusión, para cada paciente de una cierta

edad y sexo en el grupo de enfermedad se selecciona un paciente de la misma edad y sexo

en el grupo control.

72. ¿Cuáles son las desventajas del emparejamiento?

■ Puede ser difícil, laborioso y caro encontrar un sujeto de comparación con todas las carac-

terísticas de emparejamiento apropiadas para cada sujeto del estudio.■ No puede determinarse el efecto de la característica emparejada sobre el desenlace. ■ El emparejamiento no controla el efecto de los potenciales factores de confusión para los

que no se efectuó emparejamiento.

73. ¿Qué es un metaanálisis?

Es una revisión sistemática con empleo de métodos estadísticos para combinar y resumir los

resultados de varios estudios.

74. ¿Cuál es la jerarquía de los diseños de estudios basados en pruebas?

■ Nivel I: se acepta, generalmente, que los ensayos clínicos controlados y aleatorios (RCT)son la prueba más fiable para determinar si el tratamiento es efectivo.

■ Nivel II: estudios de casos y controles y de cohortes1.• Los mejores estudios son los de casos y controles o de cohortes con un buen diseño,

que son de naturaleza prospectiva, comparan grupos similares y corrigen los factores

de confusión en el análisis.

2. Menos preferibles son los estudios de casos y controles o de cohortes con un mal

diseño: los que son de naturaleza retrospectiva, comparan grupos mal emparejados o

no intentan corregir los factores de confusión.■ Nivel III: series de casos u otros estudios sin grupos control.

BIBLIOGRAFÍA

1.• Altman DG: Practical Statistics for Medical Research. London: Chapman & Hall, CRC, 1990.2.• Gordis L: Epidemiology, 3rd ed. Philadelphia, Elsevier-Saunders, 2004.3.• Greenberg RS, Daniels SR, Flanders WD, et al: Medical Epidemiology, 3rd ed. New York, Lange Medical

Books / McGraw Hill, 2001.4.• Hennekens CH, Buring JE: Epidemiology in Medicine. Philadelphia, Lippincott Williams & Wilkins, 1987.5.• Jekel JF, Katz DL, Elmore JG: Epidemiology, Biostatistics, and Preventive Medicine, 2nd ed. Philadelphia, W.B.

Saunders, 2001.6.• Rothman KJ: Epidemiology: An Introduction. Oxford, Oxford University Press, 2002.7.• Vetter N, Matthews I: Epidemiology and Public Health Medicine. New York, Churchill Livingstone, 1999.

DISEÑOS DE MODELOS DE INVESTIGACIÓN 113

Page 114: Epidemiología y bioestadística secretos   nordness1ed

115

CAPÍ

TULO

8

MEDICINA BASADA EN EVIDENCIASLee Okurowski, MD, MPH, MBA

1. ¿Qué es la medicina basada en evidencias (EBM)?

La EBM es un enfoque de la medicina que integra las mejores evidencias disponibles actuales,

la pericia clínica y los valores del paciente para optimizar los desenlaces clínicos y la calidad de

vida. Con la EBM llega el reconocimiento explícito de que la intuición, la pericia clínica no sis-

temática y la base fisiopatológica teórica especulativa son bases insuficientes para la toma de

decisiones clínicas. En su lugar, la EBM mantiene que existe una jerarquía de las mejores prue-

bas de investigación. Estas mejores pruebas de investigación, que se basan en investigaciones

clínicamente relevantes, son las que sirven como fundamento para la toma de decisiones

clínicas.

2. ¿Cuándo y cómo se desarrolló por primera vez la EBM?

Las raíces de la EBM datan de finales de la década de 1970, cuando un grupo de epidemiólogos

clínicos, liderados por David Sackett y sus colegas de la Universidad McMaster, comenzaron

a preparar una serie de artículos en los que aconsejaban a los clínicos el modo de leer las

revistas clínicas y aplicar los datos de la literatura científica a la atención médica directa del

paciente.

3. ¿Quién utilizó por primera vez el término medicina basada en la evidencia?

El término fue utilizado por primera vez por Gordon Guyatt en 1990, mientras realizaba funcio-

nes de director de residentes del programa de Medicina Interna en la Universidad McMaster.

4. ¿De qué modo la investigación, la pericia clínica y los valores del paciente se

relacionan en la EBM?

La EBM reconoce que las pruebas de investigación nunca son el único determinante para la

toma de decisiones clínicas. Las pruebas de investigación deben ser combinadas con la pericia

clínica para identificar el estado de salud de cada paciente individual, así como su diagnóstico.

También es necesaria una comprensión de los valores del paciente, de modo que puedan inte-

grarse las singulares preferencias, intereses y esperanzas que trae cada paciente a un encuen-

tro clínico, con el fin de que pueda lograrse la decisión clínica óptima.

5. ¿Qué constituye la prueba en la EBM?

En la EBM, cualquier observación empírica sobre la relación entre un suceso y el desenlace clí-

nico constituye una prueba potencial. No obstante, no toda prueba debe ser vista como igual a

la hora de tomar decisiones clínicas.

6. ¿Cuál es la jerarquía de las pruebas que se emplea en la EBM?

La fuerza de las pruebas aportadas por las observaciones no sistemáticas de un clínico indivi-

dual no debe ser considerada igual a las pruebas proporcionadas por los estudios clínicos sis-

temáticos y controlados. Se relaciona a continuación un ejemplo de jerarquía de la fuerza de las

pruebas en relación con las decisiones terapéuticas, de las más preferibles a las menos:

Page 115: Epidemiología y bioestadística secretos   nordness1ed

MEDICINA BASADA EN EVIDENCIAS116

1.• Estudios controlados aleatorios de N = 1.

2.• Revisión sistemática de estudios controlados aleatorios.

3.• Un único estudio aleatorio.

4.• Revisión sistemática de estudios de observación.

5.• Un único estudio observacional.

6.• Estudios fisiológicos.

7.• Una observación clínica no sistemática.

Guyatt GH, Haynes B, Jaeschke R, et al: Introduction: The philosophy of evidence-based medicine. En

Guyatt GH, Rennie D (eds): Users’ Guides to the Medical Literature: A Manual for Evidence-Based Clinical

Practice. Chicago, American Medical Association, 2002, pp 5–20.

7. ¿De qué modo clasifica la jerarquía las pruebas de los estudios controlados

aleatorios frente a los estudios observacionales? ¿De qué modo clasifica

múltiples estudios frente a estudios únicos?

La jerarquía demuestra que, en general, la fuerza de las pruebas aumenta con los estudios con-

trolados aleatorios, en comparación con los estudios observacionales. La jerarquía demuestra

también que la fuerza de las pruebas aumenta con múltiples estudios, en comparación con

estudios individuales.

8. ¿Qué deben recordar los clínicos al generalizar los resultados de estudios a

los pacientes individuales?

Al considerar las pruebas de investigación disponibles en la toma de decisiones sobre el trata-

miento de sus pacientes, los clínicos generalizan con mucha frecuencia los resultados de estu-

dios de otras personas, lo que puede debilitar las inferencias causales sobre la efectividad del

tratamiento. Los clínicos deben recordar que hay aún cuestiones importantes que deben ser

respondidas sobre la aplicabilidad de los hallazgos de investigación a partir del grupo de estu-

dio al tratamiento de un paciente individual fuera del estudio.

9. ¿Cómo se lleva a cabo el estudio aleatorio controlado de n = 1?

Un paciente individual es sometido a pares de períodos de tratamiento: el paciente recibe un

tratamiento experimental en un período, y un placebo o tratamiento alternativo en el siguiente

período. Si es factible, tanto el clínico como el paciente desconocen la asignación del trata-

miento, y se aleatoriza el orden del tratamiento. Clásicamente, los clínicos y los pacientes

hacen valoraciones cuantitativas de los desenlaces y, a continuación, se alternan los períodos

de tratamiento hasta que el clínico y el paciente se hallan convencidos de que el paciente consi-

gue o no consigue beneficio a partir del tratamiento experimental.

10. ¿Cuáles son los puntos fuertes y los puntos débiles de los estudios clínicos

aleatorizados controlados de n = 1?

Los puntos fuertes son que proporcionan una prueba definitiva de la efectividad en los pacien-

tes individuales, que son factibles, y que pueden llevar a cambios a largo plazo en la adminis-

tración de tratamiento y efectos.

Los puntos débiles incluyen el hecho de que tales estudios requieren un elevado grado de

interés, tiempo y cooperación entre el clínico y el paciente. Los estudios de n = 1 no suelen ser

apropiados para los problemas a corto plazo, curas terapéuticas, determinación de desenlaces

a largo plazo o trastornos infrecuentes.

Guyatt GH, Keller JL, Jaeschke R, et al: The n-of-1 randomized control trial: Clinical usefulness. Our three-

year experience. Ann Intern Med 112:293–299, 1990.

Mahon J, Laupacis A, Donner A, Wood T: Randomised study of n of 1 trials versus standard practice. BMJ

312:1069–1074, 1996.

Page 116: Epidemiología y bioestadística secretos   nordness1ed

MEDICINA BASADA EN EVIDENCIAS 117

11. ¿Cuál es la diferencia entre preguntas básicas o preparatorias, y preguntas

clínicas o de acción, en la EBM?

Uno de los aspectos más difíciles de la aplicación de la EBM a la práctica clínica es la formula-

ción de cuestiones clínicas que puedan ser respondidas y de las que se dispone de las mejores

pruebas actuales. La EBM considera las cuestiones clínicas en dos grandes categorías: cues-

tiones básicas y de acción. Las cuestiones básicas hacen referencia a un conocimiento general

sobre un trastorno, y tratan de responder el quién, el qué, el cuándo, el dónde, el porqué y el

cómo del trastorno o un aspecto del trastorno. Las preguntas de acción hacen referencia a una

información específica sobre el tratamiento de los pacientes con un trastorno, y clásicamente

preguntan sobre el paciente, el problema, las intervenciones y los desenlaces clínicos. General-

mente, a medida que aumenta la experiencia con un trastorno, el clínico pasa de hacerse pre-

guntas de preponderancia o básicas a hacerse preguntas de acción o clínicas.

12. ¿Cuáles son las mejores fuentes para encontrar las mejores pruebas actuales?

Las bases de datos de la evidencia o pruebas científicas, las revistas basadas en evidencias

científicas y los servicios en línea electrónicos son las fuentes que proporcionan las mejores

pruebas significativas actuales. Estas fuentes contrastan con los libros de texto médicos tradi-

cionales, que con frecuencia no son el método más apropiado para encontrar la mejor prueba

disponible. Aunque la mayoría de los libros de texto médicos proporcionan con frecuencia

información útil sobre la fisiopatología, es característico que rápidamente queden anticuados

en relación con la información sobre causalidad, diagnóstico, pronóstico, prevención y trata-

miento de un trastorno dado.

13. Enumere algunos de los recursos en línea particularmente útiles para la

medicina basada en la evidencia.

Véase la Tabla 8-1.

14. ¿Cuáles son las etapas a seguir para desarrollar una estrategia de búsqueda

general?

1.• Determinar el problema clínico.

2.• Definir una pregunta de investigación importante y que pueda ser respondida en relación

con el problema clínico de interés.

3.• Determinar los recursos probatorios más probables.

4.• Diseñar una estrategia de investigación.

5.• Resumir las pruebas.

6.• Aplicar las pruebas.

15. ¿Cuáles son las tres preguntas que siempre hay que plantear cuando se utiliza

un artículo de la literatura médica para responder a una cuestión clínica?

1.• ¿Son válidos los resultados del estudio?

2.• ¿Es importante la prueba aportada?

3.• ¿De qué modo pueden aplicarse a la atención médica del paciente los resultados válidos e

importantes?

16. ¿Cuáles son las principales áreas de la atención médica al paciente a las que

con mayor frecuencia se aplican las herramientas de la EBM?

1.• Diagnóstico y cribado.

2.• Pronóstico.

3.• Tratamiento.

4.• Lesiones o resultados adversos.

Page 117: Epidemiología y bioestadística secretos   nordness1ed

MEDICINA BASADA EN EVIDENCIAS118

17. Se encuentra usted revisando los resultados de un artículo sobre una nueva

prueba de cribado de cáncer de tiroides. El estudio fue llevado a cabo con un

total de 2.500 pacientes, de los que 800 fueron diagnosticados por biopsia

quirúrgica de cáncer de tiroides, y 1.700 que no tenían la enfermedad por biopsia

quirúrgica. La nueva prueba de cribado fue positiva en 1.000 pacientes, pero

sólo 750 con resultado positivo dieron, en último término, un resultado

positivo en la biopsia quirúrgica. Construya una tabla de 2 � 2 y determine lo

siguiente: sensibilidad, especificidad, cociente de verosimilitudes positivo

(LR+), cociente de verosimilitudes negativo (LR–), valor predictivo

positivo, valor predictivo negativo, prevalencia, posibilidad preprueba,

posibilidad posprueba y probabilidad posprueba.

TA B L A 8 - 1 . • R E C U R S O S E N L Í N E A PA RT I C U L A R M E N T E Ú T I L E S PA R A L A M E D I C I N A BA S A DA E N E V I D E N C I A S

Recurso

ACP Journal Club

ACP Medicine

Best Bets

Centre for Evidence-Based Medicine

Clinical Evidence

Clinical practice guidelines

Cochrane Library

emedicine

Evidence-Based Medicine Reviews (OVID)

Evidence-Based

Harrisons Online

London Links journal listings

MD Consult

Medical Matrix

Medline/PubMed

Medscape

ScHarr Netting the Evidence

United Health Foundation

UpToDate

WebMD

URL

http://www.acpjc.org

http://www.acpmedicine.com

http://www.bestbets.org

http://www.cebm.net/index.asp

http://www.clinicalevidence.org/

http://www.guidelines.gov

http://www3.interscience.wiley.com/cgi-bin/

mrwhome/106568753/HOME

http://www.emedicine.com

http://www.ovid.com

http://cebm.jr2.ox.ac.uk

http://www.harrisonsonline.com

http://www.londonlinks.ac.uk

http://www.mdconsult.com

http://www.medmatrix.org

http://www.pubmed.gov

http://www.medscape.com

http://www.shef.ac.uk/-scharr/ir/netting

http://www.unitedhealthfoundation.org

http://www.uptodate.com

http://www.webmed.com

Enfermedad � Enfermedad – Totales

Prueba � 750 [A] 250 [B] 1.000 [A � B]

Prueba – 50 [C] 1.450 [D] 1.500 [C � D]

Totales 800 [A � C] 1.700 [B � D] 2.500 [A � B � C � D]

Page 118: Epidemiología y bioestadística secretos   nordness1ed

■ Sensibilidad = A/(A � C) = 750/800 = 94%.■ Especificidad = D/(B � D) = 1.450/1.700 = 85%.■ LR� = sensibilidad/(1 – especificidad) = 94%/15% = 6,27.■ LR– = (1 – sensibilidad)/especificidad = 6%/85% = 0,07.■ Valor predictivo positivo = A/(A � B) = 750/1.000 = 75%.■ Valor predictivo negativo = D/(C � D) = 1.450/1.500 = 97%.■ Prevalencia = (A � C)/(A � B � C � D) = 800/2.500 = 32%.■ Posibilidad preprueba = prevalencia/(1 – prevalencia) = 32%/68% = 47%.■ Posibilidad posprueba = posibilidad preprueba � cociente de verosimilitudes = 0,47 � 6,27

= 2,9.■ Probabilidad posprueba = posibilidad posprueba/(posibilidad posprueba � 1) =

2,9/3,9 = 74%.

18. Una paciente acude para evaluación de un trastorno tiroideo, y usted

sospecha que tiene una probabilidad de 50:50 de tener un cáncer de tiroides

antes de aplicar la prueba de cribado. Aplica la prueba de cribado y el resultado

es positivo. ¿Cuál es la posibilidad preprueba de la paciente?

Una probabilidad de 50:50 traduce una posibilidad preprueba de 1:1; por consiguiente, la posi-

bilidad preprueba de la paciente es 1.

19. ¿Cuál es la posibilidad posprueba de la paciente?

Para determinar la posibilidad posprueba de la paciente, se multiplica la posibilidad preprueba

de 1 por el LR+ de 6,27; 1 � 6,27 = 6,27.

20. ¿Cuál es la probabilidad posprueba?

La probabilidad posprueba = posibilidad posprueba/(posibilidad posprueba � 1). De modo que

la probabilidad posprueba = 6,27/(6,27 � 1) = 6,27/7,27 = 86,2%.

21. ¿Qué es el cociente de verosimilitudes positivo (LR�)?

LR� es, sencillamente, el cociente resultante de colocar la sensibilidad en el numerador y la

tasa de falsos positivos en el denominador. Observe que estos dos términos no se ven influi-

dos por la prevalencia, y por ello, tampoco lo es el LR�.

22. ¿Por qué un LR� alto hace que sea mejor predictiva una prueba?

Se busca la calidad de una sensibilidad elevada en una prueba que se emplea para descartar la

enfermedad en aquellos pacientes que tienen unos resultados negativos; la sensibilidad es el

numerador en el cociente LR�. La tasa de falsos positivos (1 – especificidad), será el denomina-

dor. Claramente, no se desean resultados falsos positivos, porque de modo erróneo «introducen»

a los pacientes sin la enfermedad de interés. Globalmente, maximizar las características deseadas

y minimizar las indeseadas aumenta el cociente LR+ y, por tanto, la probabilidad posprueba.

23. ¿Qué es el cociente de verosimilitudes negativo (LR–)?

Es el resultado de dividir la tasa de falsos negativos (numerador) por la especificidad (denomi-

nador). Empleando la misma lógica que arriba, se puede apreciar cualitativamente que se

desea un LR– bajo, porque este cociente representa los «casos pasados por alto» (es decir, los

falsos negativos) sobre los casos «introducidos» apropiadamente.

24. ¿Pueden dar los LR� y LR– una indicación de la utilidad de una prueba?

Sí. Se ha determinado que una prueba útil debe dar un LR� alto y un LR– bajo. Por consi-

guiente, se puede tener una idea de la fuerza de una prueba observando el cociente LR�/LR–.

MEDICINA BASADA EN EVIDENCIAS 119

Page 119: Epidemiología y bioestadística secretos   nordness1ed

MEDICINA BASADA EN EVIDENCIAS120

Cuanto mayor sea la cifra, mejor será la prueba. En el problema del ejemplo, LR�/LR– es

6,27/0,07, es decir, 89,6. No hay una regla fija, pero, clásicamente, se considera aceptable un

cociente LR�/LR– mayor de 50.

25. ¿Por qué son útiles las pruebas con valores de sensibilidad y especificidad

muy elevados?

Las pruebas diagnósticas con unos valores de sensibilidad muy elevados son útiles para des-

cartar una enfermedad o afectación dada cuando los resultados son negativos. Puede recordar-

se este hecho por el nemónico SnNout: una prueba Sensible con un resultado Negativo descar-

ta (out) una enfermedad. Las pruebas diagnósticas con unos valores de especificidad muy

elevados son útiles para incluir una enfermedad o afectación dada cuando los resultados son

positivos. Puede recordarse con el nemónico SpPin: una prueba Específica con un resultado

Positivo incluye una enfermedad.

26. Describa las limitaciones de exactitud al utilizar la sensibilidad y especificidad

de las pruebas diagnósticas para determinar los pacientes con o sin un

trastorno dado. ¿Qué medidas estadísticas pueden utilizarse para superar estas

limitaciones?

La sensibilidad y la especificidad de una prueba se hallan clásicamente restringidas a los resul-

tados de la prueba que son dicotómicos (es decir, positivo o negativo). Como consecuencia,

puede perderse la exactitud de muchas pruebas que tienen valores a lo largo de un continuo de

valores. Las limitaciones de la sensibilidad y especificidad tradicionales pueden verse supera-

das al comparar cocientes de verosimilitud pasando por los diferentes niveles de los resultados

de la prueba.

27. La Tabla 8-2 presenta los resultados de la gammagrafía de ventilación

perfusión (V/Q) pulmonar para determinar la presencia de embolia pulmonar.

Calcule los cocientes de verosimilitud pasando por cada uno de los diferentes

niveles de los resultados de la prueba gammagráfica en pacientes con embolia

pulmonar, comparados con un paciente sin embolia pulmonar. Interprete

estos resultados.

Véase la Tabla 8-3.

28. ¿De qué modo ayudan clínicamente los cocientes de verosimilitudes?

Los cocientes de verosimilitudes proporcionan una medida de hasta qué punto una prueba

diagnóstica eleva o disminuye la probabilidad preprueba en la determinación de la probabilidad

posprueba en relación con una enfermedad o trastorno dado. Un cociente de verosimilitudes

de 1 significa que la probabilidad preprueba y la probabilidad posprueba son iguales. Unos

cocientes de verosimilitudes mayores de 1,0 aumentan la probabilidad preprueba de que la

enfermedad esté presente. Cuanto mayor sea el cociente de verosimilitud, mayor será el

aumento en la probabilidad a partir de la probabilidad preprueba con respecto a la probabilidad

posprueba. Unos cocientes de verosimilitudes menores de 1,0 disminuyen la probabilidad pre-

prueba de que la enfermedad esté presente. Cuanto menor sea el cociente de verosimilitud,

menor será el aumento en la probabilidad a partir de la probabilidad preprueba con respecto a

la probabilidad posprueba.

29. ¿Qué es un nomograma de verosimilitud?

Un nomograma de verosimilitud, como se muestra en la Figura 8-1, es un método gráfico para

convertir la probabilidad preprueba a la probabilidad posprueba utilizando los cocientes de

verosimilitudes.

Page 120: Epidemiología y bioestadística secretos   nordness1ed

MEDICINA BASADA EN EVIDENCIAS 121

30. ¿Cómo se utiliza un nomograma de verosimilitud?

La columna de números de la izquierda (véase la Figura 8-1) muestra la gama de las probabili-

dades preprueba, la columna central muestra los cocientes de verosimilitudes, y la columna

derecha muestra las probabilidades posprueba. Para utilizar el nomograma de verosimilitud, se

comienza con la probabilidad preprueba y se traza una línea recta a través de la columna del

cociente de verosimilitudes correspondiente, para obtener la probabilidad posprueba.

31. Si un paciente tiene una probabilidad preprueba del 50% de embolia pulmonar,

y también tiene una gammagrafía de ventilación/perfusión de alta probabilidad,

¿cuál es la probabilidad posprueba del paciente, utilizando el nomograma de

verosimilitud?

Al trazar una línea recta a partir de la probabilidad preprueba del 50% a través de un cociente

de verosimilitudes de 20,0 se demuestra una probabilidad posprueba de, aproximadamente,

el 95%.

32. ¿Qué significa el término «número que es necesario tratar» (NNT)?

El NNT es una expresión numérica del número necesario de pacientes que han de recibir un

tratamiento activo para demostrar un beneficio con respecto a la ausencia de tratamiento y pre-

TA B L A 8 - 3 . R E S U LTA D O S D E L A G A M M A G R A F Í A D E V E N T I L A C I Ó N / P E R F U S I Ó N ( V / Q )

Embolia

pulmonar

Resultados de

la gammagrafía

Probabilidad alta

Probabilidad

intermedia

Probabilidad baja

Normal

Total

Cociente de

verosimilitudes

20

1,2

0,37

0,10

Proporción

15/625 = 0,02

215/625 = 0,34

270/625 = 0,43

125/625 = 0,20

Ausente

#

15

215

270

125

625

Proporción

100/250 = 0,40

105/250 = 0,42

40/250 = 0,16

5/250 = 0,02

Presente

#

100

105

40

5

250

TA B L A 8 - 2 . R E S U LTA D O S D E L A G A M M A G R A F Í A D E V E N T I L A C I Ó N / P E R F U S I Ó N ( V / Q )

Embolia pulmonar

Resultados de la gammagrafía

Probabilidad alta

Probabilidad intermedia

Probabilidad baja

Normal

Total

Cociente de verosimilitudes

?

?

?

?

Presente

#

100

105

40

5

250

Ausente

#

15

215

270

125

625

Page 121: Epidemiología y bioestadística secretos   nordness1ed

MEDICINA BASADA EN EVIDENCIAS122

venir un mal desenlace. Es una medida útil empleada en las decisiones médicas sobre un

paciente individual cuando se resumen los resultados de los estudios clínicos.

33. ¿Cómo se calcula el NNT?

El NNT es el inverso de la reducción del riesgo absoluto (ARR) y lo proporciona la expresión:

NNT = 1/ARR

ARR = ARC – ART

donde ARC = riesgo atribuible en el grupo control, y ART = riesgo atribuible en el grupo de

tratamiento.

Expresado en estos términos, el NNT se convierte en

NNT = 1/(ARC – ART)

Chatellier G, Zapletal E, Lemaitre D, et al: The number needed to treat: A clinically useful nomogram in its

proper context. BMJ 321:426–429, 1996.

34. ¿Cuáles son las preguntas clave que deben considerarse al evaluar

los estudios sobre diagnóstico y cribado?

1. ¿Son válidos los resultados del estudio?

Figura 8-1. Nomograma de verosimilitud. (Del Centre for Eviden-ce-Based Medicine: http://www.cebm.net/likelihood_ratios.asp#example.)

0,1

0,2

0,5

1

2

5

10

20

30

40

50

60

70

80

90

95

98

99

99

98

95

90

80

70

60

50

40

30

20

10

5

2

1

0,5

0,2

0,1

2.000

1.000

500

20010050

20

105

21

0,5

0,20,10,05

0,020,010,005

0,002

0,0010,0005

Probabilidadpreprueba (%)

Cociente deverosimilitudes

Probabilidadposprueba (%)

Page 122: Epidemiología y bioestadística secretos   nordness1ed

MEDICINA BASADA EN EVIDENCIAS 123

■ ¿Hubo incertidumbre diagnóstica en todo el espectro de los estados de la enfermedad?■ ¿Se realizó la comparación con enmascaramiento y se dispuso de un patrón de referen-

cia para el diagnóstico aplicado en los dos grupos, el de tratamiento y el de control?■ ¿Se aplicó el patrón de referencia con independencia de los resultados de la prueba

diagnóstica en evaluación?

2. ¿Son importantes las pruebas válidas?■ ¿Se obtuvieron las pruebas válidas por medio de la prueba diagnóstica o de cribado

capaz de distinguir de modo exacto a los pacientes con y sin enfermedad?

3. ¿Cómo se pueden aplicar a la atención médica al paciente los resultados válidos

e importantes?■ ¿Está disponible la prueba diagnóstica o de cribado, tiene un precio razonable, es acep-

table, exacta y precisa?■ ¿Es posible efectuar cálculos sensatos de las probabilidades preprueba en pacientes

individuales?■ ¿Afectarán las probabilidades posprueba posteriores al manejo o tratamiento

del paciente?

Jaeschke R, Guyatt GH, Lijmer J: Diagnostic tests. In Guyatt GH, Rennie D (eds): Users’ Guides to the

Medical Literature: A Manual for Evidence-Based Clinical Practice. Chicago, American Medical Association,

2002, pp 187–217.

Sackett DL, Straus S, Richardson S, et al: Evidence-based Medicine: How to Practice and Teach EBM,

2nd ed. London, Churchill Livingstone, 2000, pp 67–94.

35. ¿Cuáles son las preguntas clave que deben considerarse al evaluar

los estudios sobre el pronóstico?

1. ¿Son válidos los resultados del estudio?■ ¿Se trataba de una muestra representativa de pacientes?■ ¿Son homogéneos los pacientes con respecto al riesgo y pronóstico?■ ¿Fue el seguimiento suficientemente largo y completo?■ ¿Se aplicaron criterios del desenlace de modo objetivo, sin sesgos y con ocultación?

PUNTOS CLAVE: MEDICINA BASADA EN EVIDENCIAS (EBM)

1. La EBM integra las mejores pruebas actuales, la pericia clínica y los valores del paciente, para

optimizar los desenlaces clínicos y la calidad de vida.

2. La EBM reconoce que la fuerza de las evidencias proporcionadas por observaciones

no sistemáticas de un clínico individual no debe ser considerada como igual a la de las pruebas

proporcionadas por los estudios clínicos sistemáticos y controlados. En general, la fuerza

de las pruebas aumenta con los estudios aleatorios controlados, en comparación

con la de los estudios observacionales.

3. Las bases de datos electrónicas de evidencias, las revistas basadas en evidencias y los servicios

en línea son fuentes que, con mucha frecuencia, proporcionan las mejores pruebas disponibles.

4. Cuando se utiliza un artículo de la literatura médica para responder cuestiones clínicas, siempre

deben formularse tres cuestiones útiles: 1) ¿son válidos los resultados del estudio?;

2) ¿son importantes las pruebas?, y 3) ¿cómo pueden aplicarse los resultados válidos e

importantes a la atención médica del paciente?

5. Las herramientas de la EBM se aplican con mucha frecuencia al examinar aspectos clínicos

relacionados con el diagnóstico y cribado, pronóstico y lesiones.

Page 123: Epidemiología y bioestadística secretos   nordness1ed

2. ¿Son importantes las pruebas válidas?■ ¿Son probables los desenlaces observados en el tiempo?■ ¿Qué precisión tienen los cálculos sobre el pronóstico?

3. ¿Cómo pueden aplicarse a la atención médica del paciente los resultados válidos

e importantes?■ ¿Son similares los pacientes individuales a los que se hallan en estudio?■ ¿Lograrán las pruebas un impacto clínicamente relevante sobre la atención médica al

paciente?

Randolph A, Bucher H, Richardson WS, et al: Prognosis. In Guyatt GH, Rennie D (eds): Users’ Guides to

the Medical Literature: A Manual for Evidence-Based Clinical Practice. Chicago, American Medical

Association, 2002, pp 219–240.

Sackett DL, Straus S, Richardson S, et al: Evidence-based Medicine: How to Practice and Teach EBM,

2nd ed. London, Churchill Livingstone, 2000, pp 95–104.

36. ¿Cuáles son las preguntas clave que deben considerarse al evaluar

los estudios del tratamiento?

1. ¿Son válidos los resultados del estudio?■ ¿Quedaron asignados de modo aleatorio los pacientes?■ ¿Existió enmascaramiento para los pacientes y los clínicos?■ ¿Fue el seguimiento suficientemente largo y completo?■ ¿Fueron analizados los pacientes a lo largo del estudio en sus respectivos grupos

de aleatorización inicial?■ ¿Fueron tratados los grupos de igual modo, a excepción del tratamiento en estudio?

2. ¿Son importantes las pruebas válidas?■ ¿Cuál es la magnitud del efecto del tratamiento?■ ¿Qué precisión tienen los cálculos del efecto del tratamiento?

3. ¿Cómo pueden aplicarse a la atención médica al paciente los resultados válidos

e importantes?■ ¿Son los pacientes individuales similares a los sometidos a estudio?■ ¿Conseguirá el tratamiento un impacto clínicamente relevante sobre la atención al

paciente?■ ¿Cuáles son los beneficios, daños y costes potenciales del tratamiento?

Guyatt GH, Cook D, Devereaux PJ, et al: Therapy. In Guyatt GH, Rennie D (eds): Users’ Guides to the

Medical Literature: A Manual for Evidence-Based Clinical Practice. Chicago, American Medical Association,

2002, pp 81–120.

Sackett DL, Straus S, Richardson S, et al: Evidence-based Medicine: How to Practice and Teach EBM,

2nd ed. London, Churchill Livingstone, 2000, pp 105–154.

37. ¿Cuáles son las preguntas clave que deben considerarse al evaluar

los estudios sobre los daños o efectos adversos?

1. ¿Son válidos los resultados del estudio?■ ¿Estuvieron claramente definidos los grupos de pacientes en todos los aspectos impor-

tantes del desenlace?■ ¿Se ajustó para el análisis cualquier diferencia entre los grupos?■ ¿Fue el seguimiento suficientemente largo y completo para que se produjera el

desenlace?■ ¿Se determinaron de modo similar los desenlaces y las exposiciones entre los grupos de

comparación?■ ¿Reunió el estudio los criterios necesarios para el establecimiento de la causalidad?

2. ¿Son importantes las pruebas válidas?■ ¿Cuál es la magnitud de la asociación entre exposición y desenlace?

MEDICINA BASADA EN EVIDENCIAS124

Page 124: Epidemiología y bioestadística secretos   nordness1ed

■ ¿Cuál es la precisión de la asociación de exposición y desenlace?

3. ¿Cómo pueden aplicarse a la atención médica a los pacientes los resultados válidos e

importantes?■ ¿Son similares los pacientes individuales a los sometidos a estudio?■ ¿Cuáles son los beneficios del tratamiento?■ ¿Hay alternativas al tratamiento?■ ¿Cuáles son los riesgos del paciente en relación con un suceso adverso?■ ¿Se han considerado de modo adecuado las preferencias, intereses y expectativas de los

pacientes?

BIBLIOGRAFÍA

1.• Dalla Vecchia LK, Grosfeld JL, West KW, et al: Intestinal atresia and stenosis: A 25-year experience with 277cases. Arch Surg 133:490–496, 1998.

2.• Guyatt GH, Haynes B, Jaeschke R, et al: Introduction: The philosophy of evidence-based medicine. In GuyattGH, Rennie D (eds): Users’ Guides to the Medical Literature: A Manual for Evidence-Based Clinical Practice.Chicago, American Medical Association, 2002, pp 5–20.

3.• Guyatt GH, Keller JL, Jaeschke R, et al: The n-of-1 randomized control trial: Clinical usefulness. Our three-year experience. Ann Intern Med 112:293–299, 1990.

4.• Guyatt G, Rennie D: Users’ Guides to the Medical Literature: A Manual for Evidence-Based Clinical Practice.Chicago, American Medical Association, 2002.

5.• Larson EB, Ellsworth AJ, Oas J: Randomized clinical trials in single patients during a 2-year period. JAMA270:2708–2712, 1993.

6.• Levine M, Haslam D, Walter S, et al: Harm. In Guyatt GH, Rennie D (eds): Users’ Guides to the MedicalLiterature: A Manual for Evidence-Based Clinical Practice. Chicago, American Medical Association, 2002, pp 121–153.

7.• Mahon J, Laupacis A, Donner A, Wood T: Randomised study of n of 1 trials versus standard practice. BMJ312:1069–1074, 1996.

8.• Millar AJ, Cywes S: Caustic strictures of the esophagus. In O’Neill JA, Rowe MI, Grosfeld JL, Coran AG (eds):Pediatric Surgery, 5th ed. St. Louis, Mosby, 1998, pp 969–979.

9.• Sackett DL, Straus S, Richardson S, et al: Evidence-based Medicine: How to Practice and Teach EBM, 2nd ed.London, Churchill Livingstone, 2000.

MEDICINA BASADA EN EVIDENCIAS 125

PÁGINA WEB (Véase también la Tabla 8-1)

1. http://www.aso.org

Page 125: Epidemiología y bioestadística secretos   nordness1ed

127

INTRODUCCIÓN A LOS CONCEPTOSBIOESTADÍSTICOSRichard I. Wittman, MD, MPH, y Sue Kim, MD, MS

1. ¿Qué es la bioestadística?

La bioestadística proporciona un marco para el análisis de datos. Por medio de la aplicación de

los principios estadísticos a las ciencias biológicas, los bioestadísticos (y otros profesionales

familiarizados con la recogida, organización, análisis e interpretación de datos) son capaces de

distinguir de manera sistemática las verdaderas diferencias entre observaciones y las variacio-

nes aleatorias cuya única causa es el azar.

2. ¿Para qué es útil la bioestadística?

Desde un punto de vista práctico, el conocimiento de la bioestadística y de la epidemiología

permite realizar conclusiones válidas a partir de conjuntos de datos. Con esta información se

determinan las asociaciones entre los factores de riesgo y la enfermedad y, en último término,

se utilizan para reducir la enfermedad y la lesión. Mediante el empleo de estos métodos, los

científicos y los bioestadísticos fueron capaces de demostrar la relación entre la exposición al

benceno y un mayor riesgo de sufrir leucemia, y también entre la exposición al asbesto y un

mayor riesgo de mesotelioma.

3. ¿Qué diferencia hay entre las variables nominales y las ordinales?

■ Las variables nominales (es decir, categóricas) representan datos clasificados únicamen-

te por el nombre, sin considerar el orden o la magnitud de la variable. Estos datos no suelen

ser numéricos. Entre los ejemplos figuran los siguientes: grupo sanguíneo (A, B, AB, O),

sexo (hombre o mujer), color de los ojos y sucesos dicotómicos (sí/no).■ Las variables ordinales pueden considerarse como variables nominales clasificadas en

categorías ordenadas o jerarquizadas, pero no necesariamente de acuerdo con la magnitud.

Los intervalos (es decir, diferencias) entre las categorías pueden no ser iguales. Entre los

ejemplos figuran los siguientes: nivel de estudios (p. ej., ESO, bachillerato y estudios uni-

versitarios), y clasificación por cuestionarios (p. ej., malo, aceptable, bueno o excelente).

4. Describa en qué difieren las variables de intervalos, las variables de cocientes,

las variables discretas y las variables continuas.

■ Las variables de intervalos son similares a las variables ordinales, pero las variables de

intervalo están separadas por intervalos o distancias iguales; el punto cero no se considera

significativo. Un ejemplo puede ser la puntuación en el cociente de inteligencia (IQ).■ Las variables de cocientes se clasifican también en grupos ordenados, con intervalos equi-

valentes entre las variables, pero su punto cero es significativo. El peso corporal es un

ejemplo.■ Las variables numéricas discretas representan datos con un orden o magnitud asignado,

pero se restringen a números enteros; entre los ejemplos figuran el dinero y el número de

habitaciones de un hotel.■ Las variables numéricas continuas representan datos capaces de tomar cualquier valor en

una escala determinada, como la presión arterial, la temperatura y el peso.

CA

PÍT

ULO

9

II. BIOESTADÍSTICA

Page 126: Epidemiología y bioestadística secretos   nordness1ed

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS128

5. ¿De qué maneras se pueden representar estos tipos de datos en forma

de gráfico?

El mejor modo de describir y representar los datos nominales y ordinales es por medio de

histogramas (gráficos de barras agrupadas) y gráficos de sectores. El mejor modo

de representar los datos discretos y los continuos es por medio de histogramas, polígo-nos de frecuencias, diagramas de dispersión, diagramas de cajas y gráficos de líneas.

6. ¿Qué es una medida de tendencia central?

Las medidas de tendencia central, como son la media, la mediana y la moda, ofrecen unos

aspectos concretos, rápidos y concisos de la distribución de datos, y es un método sencillo

que permite comunicar los datos pertinentes. En pocas palabras, estas medidas proporcionan

información de los datos mayoritarios de una distribución.

7. ¿De qué modo se determina el valor de la mediana?

La mediana se utiliza para los datos ordinales, de intervalo, de cocientes, discretos o conti-

nuos. Se define como el percentil 50 de un conjunto de mediciones, y por debajo de dicho nivel

se encuentra la mitad de las observaciones. Por ejemplo, la mediana de los siguientes cinco

números (1, 1, 4, 9, 25) es el 4. Si hay un número par de variables que están siendo determina-

das, la mediana será el promedio de los dos valores centrales.

La mediana está menos afectada por los valores extremos (es decir, por los valores excep-

cionalmente altos o bajos) que la media. En otras palabras, es una mejor medida de la tenden-

cia central para los datos sesgados. Como tal, se considera la medida más potente de la ten-

dencia central.

8. ¿En qué difieren la media, la mediana y la moda en su expresión de la

tendencia central?

■ La media se utiliza para los datos de intervalo y de cocientes, y se computa como la media

aritmética (es decir, promedio) de los datos. Por ejemplo, la media de las cinco siguientes

variables (1, 1, 4, 9, 25) es 40/5 = 8. La media está más afectada que la mediana por los

valores sesgados.■ La moda se utiliza para todos los tipos de datos, y representa la observación que aparece

con mayor frecuencia. Por ejemplo, la moda de las cinco siguientes variables (1, 1, 4, 9, 25)

es 1.■ La mediana se explica en detalle en el punto 7.

9. ¿Qué es una medida de dispersión?

Las medidas de dispersión describen la distribución o reparto de los datos. Utilizadas junto con

las medidas de tendencia central, facilitan una descripción más completa de los datos. Cuatro

medidas de dispersión que suelen utilizarse son el recorrido, el recorrido intercuartiles,la varianza y la desviación estándar.

PUNTOS CLAVE: TRES MEDIDAS DE TENDENCIA CENTRAL

1.• Media.

2.• Mediana.

3.• Moda.

Page 127: Epidemiología y bioestadística secretos   nordness1ed

10. ¿Qué diferencia hay entre el recorrido y el recorrido intercuartiles?

■ El recorrido es la diferencia entre el valor mayor y el menor en una distribución de datos.■ El recorrido intercuartiles describe el 50% de las observaciones centrales (es decir, los

datos situados entre los percentiles 25 y 75).

11. ¿Qué diferencia hay entre la varianza y la desviación estándar?

■ La varianza (s2) describe la cantidad de variabilidad global alrededor de la media (en todas

las direcciones) y se mide como el promedio de las distancias al cuadrado entre cada varia-

ble y la media. Se calcula del siguiente modo:

1 n

s2 = • (xi – x –)2

(n – 1) i=1

Se tratará con mayor detalle en capítulos posteriores.■ La desviación estándar (s) se calcula como la raíz cuadrada positiva de la varianza: (s = • s2).

Dado que la desviación estándar describe la variabilidad de los datos sólo en una dirección,

tiene las mismas unidades que medida de la media; por ello, se utiliza con más frecuencia

que la varianza para describir la amplitud de los datos.

12. ¿Qué es la distribución gaussiana? ¿Cómo se relaciona con la regla empírica?

Una distribución gaussiana es una distribución de datos normal o «en campana», que es simé-

trica alrededor de la media; en este tipo de distribución, la media, la mediana y la moda tienen

el mismo valor (Fig. 9-1). En una distribución de este tipo, la regla empírica indica que, aproxi-

madamente, el 68% de los datos se encuentran comprendidos entre una desviación estándar a

cada lado de la media (entre las dos líneas interiores, dibujadas en la figura), aproximadamente

el 95% de la distribución está comprendida entre dos desviaciones estándares a ambos lados

de la media (entre las dos líneas exteriores), y aproximadamente el 99,7% de los datos se

hallan comprendidos entre tres desviaciones estándares a ambos lados de la media. Recuerde

que en una distribución normal o gaussiana, las medidas de tendencia central son iguales y se

localizan en el pico de la curva de distribución. (Véase también la Figura 10-2.)

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS 129

Figura 9-1. Distribución gaussiana.

13. ¿Quién fue Gauss?

Karl Friedrich Gauss (1777-1855) fue uno de los matemáticos más destacados de su tiempo,

y avanzó descubrimientos en la teoría de números, álgebra, geometría, cálculo de probabilida-

des y otras áreas.

14. ¿Qué es la desigualdad de Chebyshev?

Cuando la distribución de los datos no es simétrica y no se puede describir mediante una dis-

tribución gaussiana, aún es posible generalizar en relación con la distribución o dispersión de

Page 128: Epidemiología y bioestadística secretos   nordness1ed

los datos. En esta situación, puede emplearse la desigualdad de Chebyshev como una estima-

ción conservadora de la regla empírica arriba comentada. Se demuestra que [1 – (1/k)2] de los

datos se hallan comprendidos entre k desviaciones estándares a ambos lados de la media.

Puede ser de gran utilidad para su aplicación a conjuntos de datos sesgados.

15. ¿Cómo se puede determi-

nar en qué dirección se

hallan sesgados los datos?

Se dice que una curva de distri-

bución está sesgada si los datos

están distribuidos de forma

asimétrica. Se califica la curva

de datos como sesgada a la

izquierda (o sesgada negativa-

mente) si la parte más larga de la

curva se prolonga hacia la

izquierda, y como sesgada positi-

vamente si se extiende hacia la

derecha. En una curva así, la

moda se encuentra en el punto

más alto de la curva, la media se

localiza hacia la parte más larga, y la mediana se sitúa entre la moda y la media, como se repre-

senta en la Figura 9-2.

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS130

Figura 9-2. Distribución sesgada.

Sesgo negativo

Media

Mediana

Moda

PUNTOS CLAVE: CUATRO MEDIDAS DE LA DISPERSIÓN*

1.• Recorrido o intervalo.

2.• Recorrido intercuartiles.

3.• Varianza.

4.• Desviación estándar.

* Se aplica una lógica similar al analizar una curva sesgada (positivamente) a la derecha.

16. ¿Cuándo se puede decir que una distribución de datos presenta curtosis?

El término curtosis hace referencia al aspecto del pico de una curva, así como a su cola, en

relación con una distribución normal. Las distribuciones de datos con curtosis alta muestran

unos picos altos y «puntiagudos» cerca de la media, con colas anchas. En cambio, los datos

con curtosis baja tienen unos picos más anchos y planos que la distribución normal. Una curva

de distribución gaussiana tiene un sesgo cero y una curtosis cero. En una distribución curtósi-

ca, la varianza de los datos se mantiene inalterable.

17. ¿Qué es una determinación de probabilidades?

■ La probabilidad (P) hace referencia al hecho de que ocurra o no un suceso, a tenor de otros

factores.■ La determinación de probabilidades es el cálculo matemático real del hecho de que ocurra

un suceso.

Page 129: Epidemiología y bioestadística secretos   nordness1ed

18. ¿Qué es una probabilidad condicional?

Una probabilidad condicional refleja el hecho de que ocurra un suceso B una vez ha ocurrido

un suceso A; en otras palabras, el desenlace del suceso B depende de la producción y del

desenlace del suceso A. Se representa por P(A|B), o «probabilidad de que ocurra el suceso B

una vez se ha producido el suceso A»: un ejemplo podría ser la probabilidad de que mientras

se conduce se pasen de forma secuencial dos semáforos en verde. La probabilidad de pasar

el segundo semáforo en verde requiere que se haya podido pasar el primer semáforo en verde.

19. ¿Qué son los sucesos mutuamente excluyentes?

Se considera que unos sucesos son mutuamente excluyentes si la ocurrencia de un suceso o

desenlace impide que se produzca el otro suceso. En otras palabras, los sucesos mutuamente

excluyentes no pueden producirse de modo simultáneo. Un ejemplo común es el resultado de

obtener «cara» o «cruz» después de lanzar una moneda al aire. En los sucesos mutuamente

excluyentes, la suma de probabilidades de los sucesos es siempre menor o igual a 1. En cam-

bio, se considera que los sucesos son independientes si la ocurrencia de un suceso no afecta

al resultado del otro.

20. ¿Qué son los términos unión, intersección y complemento al determinar

la probabilidad?

■ La unión (∪) de dos sucesos, A y B, se representa por P(A∪B). En el diagrama de Venn

(Fig. 9.3), la unión de A y B se representa por la totalidad del área en el interior de ambos

círculos, o A + B – C. La unión representa la probabilidad de la producción del suceso A

solo, del suceso B solo o de ambos sucesos A y B simultáneamente.■ La intersección (∩) de dos sucesos se define como el suceso que es, a la vez, de A y de B.

La intersección de A y B se denota como P(A∩B); gráficamente, puede representarse por el

área C del diagrama de Venn (véase Fig. 9-3).■ El complemento de un suceso A es el suceso que «no es A». Gráficamente, puede repre -

sentarse como la totalidad del área fuera del círculo A. El complemento de A se denota

como Ac o A–

.

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS 131

A C B

Figura 9-3. Diagrama de Venn.

21. ¿Qué es la ley aditiva de probabilidades?

La ley aditiva se aplica cuando los sucesos A y B no pueden producirse simultáneamente,

o sea, cuando son sucesos mutuamente excluyentes. La ley aditiva indica que la probabilidad

Page 130: Epidemiología y bioestadística secretos   nordness1ed

de que se produzca un suceso A o un suceso B es la probabilidad del suceso A más la probabi-

lidad del suceso B. De modo intuitivo tiene sentido, ya que si lanzamos una moneda al aire, la

probabilidad de sacar «cara» (0,5) o «cruz» (0,5) sería igual a 1. La ley aditiva, en este caso, se

expresa del modo siguiente: P(A o B) = P(A) + P(B).

22. ¿Puede aplicarse la ley aditiva cuando los dos sucesos no son mutuamente

excluyentes?

No. En este caso la ley aditiva no se cumple. En cambio, la probabilidad de que ocurra un su -

ceso A o un suceso B es la probabilidad del suceso A más la probabilidad de B, menos la

probabilidad de que ambos sucesos se den simultáneamente, ya que si ambos se producen al

mismo tiempo, ni el suceso A ni el suceso B se pueden producir solos. Se representa por P((Ao B) = P(A∪B) = P(A)+P(B) – P(A∩B), y describe la operación de unión comentada anterior-

mente. La ley aditiva de sucesos mutuamente excluyentes se parece mucho a esta ecuación.

Cuando los sucesos son mutuamente excluyentes, la probabilidad (P) de que A y B se produz-

can al mismo tiempo es igual a 0, o lo que es lo mismo P (A∩B) = 0, si sustituimos esta opera-

ción en la ecuación anterior obtenemos la ley aditiva, P(A) + P(B).

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS132

PUNTOS CLAVE: DISTRIBUCIÓN DE DATOS EN UNA DISTRIBUCIÓN GAUSSIANA NORMAL

1.• Aproximadamente, el 68% de los datos se sitúan entre 1 desviación estándar a ambos lados de la media.

2.• Aproximadamente, el 95% de los datos quedan situados entre 2 desviaciones estándares a amboslados de la media.

3.• Aproximadamente, el 99,7% de los datos se sitúan entre 3 desviaciones estándares a ambos lados de la media.

23. ¿Cómo es la ley multiplicativa de probabilidad?

La ley multiplicativa, se aplica cuando el suceso A y el suceso B son condicionalmente depen-

dientes (y, por tanto, sucesos no mutuamente excluyentes). Según esta ley, la probabilidad (P)

que ambos sucesos se produzcan juntos, A y B, es la probabilidad de A multiplicado por la pro-

babilidad de B, en el supuesto de que el suceso A acabe de producirse. Se presenta del modo

siguiente: P(A y B) = P(A∩B) = P(A) � P(B|A).

Una transformación de esta ecuación da lugar a la siguiente:

(A∩B)P(B|A) = p

P(A)

Esta ley se trata con más detalle en un capítulo posterior.

24. ¿Se aplica la ley multiplicativa cuando los dos sucesos son independientes?

No del todo. Si A y B son sucesos independientes (y, por ello, sucesos ni mutuamente exclu-yentes ni condicionales), la probabilidad de que ambos sucesos ocurran es igual a la probabili-

dad de que se produzca el suceso A multiplicado por la probabilidad del suceso B. Se representa

como P(A y B) = P(A) � P(B). Con el ejemplo de cara (0,5) y cruz (0,5), la probabilidad de

obtener exactamente un «cara» y a continuación exactamente una «cruz» en dos lanzamientos

sucesivos de la moneda sería de 0,5 � 0,5, es decir: 0,25.

Page 131: Epidemiología y bioestadística secretos   nordness1ed

La ley multiplicativa es una forma especial de esta ecuación, porque cuando estos sucesos

A y B son independientes, la probabilidad de que se produzca el suceso B, dado que A haya

ocurrido, o P(B|A), es igual a P(B); al sustituir P(B|A en lugar de P(B) en la ecuación anterior se

obtiene la ley multiplicativa (como se describe en el punto 23).

P(A y B) = P (A) � P (B|A).

25. ¿Qué es la inferencia estadística?

La inferencia estadística es el proceso de extraer conclusiones en relación con una población,

basándose en el estudio de sólo una parte de los miembros de dicha población. Este proceso

de inferencia (es decir, de generalización), basada en relativamente pocos, es más exacto cuan-

do la subpoblación que se estudia es homogénea (es decir, dé carácter uniforme), cuando la

subpoblación es verdaderamente representativa (es decir, refleja correctamente el grupo

mayor), y cuando la subpoblación se elige de forma aleatoria para eliminar el error de mues-

treo o sesgo.

26. ¿Cómo se efectúa la prueba de contraste de hipótesis?

Probar una hipótesis es un modo de efectuar una inferencia estadística. Permite sacar conclu-

siones y hacer afirmaciones basadas en la información obtenida a partir de la muestra que se

analiza. Es muy frecuente que en la prueba de hipótesis se dé por supuesto que la media (es

decir, el promedio) de la muestra que se está estudiando es la misma media que la de la totali-

dad de la población de la que se extrajo la muestra. A continuación, se intenta aceptar o recha-

zar la afirmación obtenida; por ejemplo, se puede intentar demostrar que una nueva medica-

ción es superior al tratamiento estándar para una afección.

27. ¿Qué significa la hipótesis nula?

Al probar una hipótesis, la hipótesis nula afirma que no hay diferencia en los parámetros pobla-

cionales entre los grupos que se comparan y que cualquier diferencia que se observa es, senci-

llamente, el resultado de una variación al azar dé los datos y no el resultado de una disparidad

real en los propios datos. Por convención, se supone que la hipótesis nula es verdadera

(es decir, los investigadores aceptan la hipótesis nula) al comienzo del estudio; a continuación,

los investigadores intentan refutar o rechazar esta hipótesis por medio del análisis estadístico

de los datos.

28. ¿Qué significa la hipótesis alternativa?

La hipótesis alternativa sirve como opción opuesta a la hipótesis nula. Contradice la hipótesis

nula, al afirmar que realmente hay una verdadera diferencia (más allá de la probable por el azar

solo) en los parámetros poblacionales entre los grupos que se comparan.

29. ¿Qué significa que algo es estadísticamente significativo?

Se considera que la diferencia entre grupos o datos que se comparan es estadísticamente sig-

nificativa cuando excede el nivel límite arbitrario que el investigador ha establecido. Este nivel

límite se denomina alfa (α) y, por convención, se fija en 0,05 o 5%; α representa la buena dis-

posición del investigador de aceptar un 5% de posibilidades de no encontrar una diferencia

entre las muestras cuando, en realidad, existe una verdadera diferencia entre los grupos. Una

significación estadística no indica que el estudio por sí mismo sea clínicamente significativo;

los grupos pueden presentar diferencias considerables en las determinaciones que ha realizado

el análisis estadístico pero estas diferencias estadísticas pueden no reflejar las diferencias

entre los grupos en la vida real.

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS 133

Page 132: Epidemiología y bioestadística secretos   nordness1ed

30. ¿Qué es el valor p?

El valor p es una representación numérica del grado con el que el azar sólo podría explicar las

diferencias observadas entre los grupos o datos que se comparan. Un estudio que encuentra un

valor p de 0,05 establece que hay una probabilidad del 5% de obtener un resultado extremo o

más extremo que el observado realmente o valor medido sólo por el azar. Cuanto menor sea el

valor p, más fuerte es la prueba para disputar la hipótesis nula. En otras palabras, cualquier dife-

rencia observada en un estudio tiene mayor probabilidad de ser real, y no deberse sólo al azar.

31. ¿Qué relación hay entre el valor p y α?

Cuando el valor p es inferior al límite α, se dice que el resultado es estadísticamente significati-

vo. En el caso de tener un valor α fijado en 0,05, un valor de p < 0,001 se considera una prueba

muy fuerte en contra de la hipótesis nula. Sin embargo, un valor de p > 0,10, es mayor que α, y

representa una prueba débil para disputar la hipótesis nula, lo cual significa que es más proba-

ble que cualquier diferencia observada o medida se deba al azar y no a una diferencia real entre

los grupos.

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS134

PUNTOS CLAVE: PRUEBA DE HIPÓTESIS

1.• Alfa (α): probabilidad de cometer un error de tipo I.

2.• Error de tipo I: error de rechazo de la hipótesis nula (es decir, no se debería haber rechazado la hipótesis nula).

3.• Beta (β): probabilidad de cometer un error de tipo II.

4.• Error de tipo II: error de aceptación de la hipótesis nula (es decir, se debía haber rechazado la hipótesis nula aceptada).

5.• Potencia = 1 – β.

32. ¿Qué es un error de tipo I en la prueba de hipótesis?

Se produce un error de tipo I (es decir, error de rechazo o error α), cuando se rechaza la hipó-

tesis nula (es decir, que hay una diferencia real entre los grupos o datos) cuando, en realidad,

no hay una verdadera diferencia entre los grupos o datos. Así, se puede considerar que un

error de tipo I es un resultado falso positivo.

33. ¿Qué es un error de tipo II?

Se produce un error de tipo II (es decir, aceptación del error o error β) cuando no se rechaza la

hipótesis nula (es decir, los investigadores afirman que no hay diferencias entre los grupos o

datos) cuando, en realidad, sí hay una diferencia real. Así, puede considerarse que un error de

tipo II es un resultado falso negativo. Hay una especie de equilibrio que se produce al asignar

límites a un error de tipo I y a un error de tipo II (véase la Tabla 9-1)

34. ¿Cuál es la relación entre la potencia y beta (β)?

La potencia (o poder) se define como la probabilidad, ya sea de rechazar correctamente la

hipótesis nula cuando sí existe una diferencia verdadera entre los grupos ya sea de aceptar

correctamente (es decir, no rechazar) la hipótesis nula cuando no hay una diferencia real entre

los grupos; así, la potencia es la probabilidad de evitar un error de tipo II (es decir, no rechazar

la hipótesis nula cuando es falsa) y es igual a 1 – β. Por convención, se considera aceptable

una potencia mayor o igual al 80%.

Page 133: Epidemiología y bioestadística secretos   nordness1ed

35. Cite dos modos de aumentar la potencia del estudio.

Aunque la potencia o poder de un estudio no se halla bajo el control del investigador, es posible

aumentarla en un estudio aumentando el valor de α, lo que lleva a una disminución de β y, por

tanto, a una mayor potencia. También se puede aumentar el poder aumentando el tamaño de lamuestra (es decir, el número de individuos o de artículos implicados en el estudio).

36. ¿Cómo puede aplicarse la bioestadística a los procedimientos de cribado para

determinar la probabilidad de que un individuo tenga una enfermedad?

Las pruebas de cribado se emplean para detectar enfermedades en estadios más precoces de

lo que es posible con el seguimiento de rutina. Por consiguiente, la detección debe producirse

en un momento en el que la intervención pueda alterar el curso natural de la enfermedad y, en

último término, llevar a una mejora de la calidad o cantidad de vida de los individuos afectados.

Es importante considerar que cualquier intervención para prevenir o tratar una enfermedad,

cuando se aplica de modo inapropiado, puede provocar consecuencias adversas; así, las prue-

bas de cribado deben distinguir de modo correcto a los pacientes que realmente tienen la

enfermedad en cuestión de los que no la tienen. Desde un punto de vista bioestadístico, se

consideran efectivas las pruebas de cribado con sensibilidad y especificidad elevadas.

37. ¿Qué significa sensibilidad y especificidad?

■ La sensibilidad es una medida de la capacidad de una prueba para identificar con precisión

una enfermedad cuando está presente. Una prueba con una alta sensibilidad da un elevado

porcentaje de resultados positivos cuando está presente la enfermedad (es decir, verdade-

ros positivos) y produce pocos o ningún resultado falso negativo. Por tanto, la sensibilidad

es la probabilidad de que una prueba dé un resultado positivo cuando la enfermedad está

presente. Puede representarse por P(T+ | D+).■ La especificidad es la probabilidad de obtener una prueba negativa cuando la enfermedad está

ausente. Una prueba con una especificidad elevada tiende a dar un resultado negativo en la

prueba cuando la enfermedad está ausente (es decir, verdaderos negativos) y produce pocos o

ningún resultado positivo. La especificidad pregunta: «Dado que una enfermedad está ausente,

¿cuál es la probabilidad de que una prueba sea negativa?». Se representa como P(T– | D–).

38. ¿Qué significa el valor predictivo de una prueba?

■ El valor predictivo positivo (PPV) es similar a la sensibilidad, pero en lugar de examinar la

probabilidad de un resultado positivo en la prueba cuando la enfermedad está presente, exa-

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS 135

TA B L A 9 - 1 . M O D O D E D E T E R M I N A R E L T I P O D E E R R O R E N L A P R U E BA D E H I P Ó T E S I S

Resultados verdaderos de los datos de la población

Desenlace de la prueba

estadística

No rechaza la hipótesis nula

Rechaza la hipótesis nula

La media de la población total

y la media de la subpoblación

de muestra son diferentes

Error de tipo II (es decir, falso

negativo, aceptación del error,

o error β)

Conclusión correcta

La media de la población total

y la media de la subpoblación

de muestra son iguales

Conclusión correcta

Error de tipo I (es decir, falsa

positiva, error de rechazo,

o error α)

Page 134: Epidemiología y bioestadística secretos   nordness1ed

mina la probabilidad de la enfermedad cuando la prueba es positiva. Pregunta: «Dada una

prueba positiva, ¿cuál es la probabilidad de que la enfermedad esté realmente presente?».

Puede representarse el PPV como P(D+ | T+).■ El valor predictivo negativo (NPV) de una prueba representa la probabilidad de que la

enfermedad esté ausente cuando hay una prueba negativa. Pregunta: «Dada una prueba

negativa, ¿cuál es la probabilidad de que la enfermedad esté realmente ausente?». Puede

representarse el NPV como P(D– | T–).

39. ¿En qué difieren la sensibilidad y la especificidad con respecto al valor

predictivo?

Tal como se ha precisado anteriormente, la sensibilidad y la especificidad hacen referencia a la

probabilidad de obtención de un resultado de la prueba positivo o negativo cuando la enferme-

dad está presente o ausente, respectivamente. El valor predictivo de una prueba hace referen-

cia a la verosimilitud de la enfermedad a tenor del resultado de la prueba. La sensibilidad y la

especificidad son propiedades inherentes a la prueba, y no cambian con la prevalencia de la

enfermedad. Los valores predictivos varían directamente con la prevalencia de la enfermedad

en la población analizada.

40. ¿Qué significa una prueba falsa positiva y una prueba falsa negativa?

■ Una prueba falsa positiva se produce cuando la prueba informa de modo incorrecto de la

presencia de enfermedad cuando, de hecho, la enfermedad está ausente. ■ Una prueba falsa negativa se produce cuando la prueba informa de modo incorrecto de la

ausencia de enfermedad cuando, de hecho, la enfermedad está presente (véase la Tabla 9-2).

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS136

Sensibilidad

= • • TP• •TP � FN

Especificidad

= • • TN• •TN � FP

TA B L A 9 - 2 . • R E P R E S E N TA C I Ó N G R Á F I C A D E M É TO D O S PA R A E L A N Á L I S I S D E L D E S E N L A C E

D E S P U É S D E R E A L I Z A R U N C R I BA D O E N B U S C A D E E N F E R M E DA D

Valor predictivo positivo

= • • TP• • TP � FP

Enfermedad Enfermedad

presente (D+) ausente (D−)

Prueba positiva Verdadero positivo Falso positivo

(T+) TP FP

Prueba negativa Falso negativo Verdadero negativo

(T−) FN TN

Valor predictivo negativo

= • • TN• •TN � FN

41. ¿Qué es una curva de eficacia diagnóstica (ROC)?

La curva ROC es una gráfica que representa la relación entre la sensibilidad y la especificidad.

La «tasa de verdaderos positivos» (es decir, sensibilidad) aparece en el eje de las y, y la «tasa

de falsos positivos» (1 – especificidad) en el eje de las x. Este tipo de gráfico puede ayudar a

los investigadores a valorar la utilidad de una prueba diagnóstica, ya que ayuda a determinar el

punto límite apropiado para una prueba de cribado. En general, el punto de la curva situado

Page 135: Epidemiología y bioestadística secretos   nordness1ed

más próximo al ángulo superior izquierdo de la gráfica se toma como el punto en el que tanto

la sensibilidad como la especificidad de la prueba son máximas.

42. ¿Qué es un intervalo de confianza?

La media de la muestra es sólo una estimación puntual de la media de la totalidad de la pobla-ción en estudio. Aunque la media de esta muestra pueda reflejar realmente la media poblacio-nal, hay incertidumbre en este valor. Los intervalos de confianza son construcciones que se uti-lizan para describir la gama de valores posibles en relación con esta estimación puntual. Elintervalo de confianza del 95% utilizado habitualmente representa una confianza del 95% deque los límites inferior y superior de este intervalo incluyan la media verdadera de la muestra.Por ejemplo, si se seleccionan aleatoriamente 100 muestras de la población y se determinan100 intervalos de confianza diferentes para las medias de estas muestras, 95 de ellos incluiránla media poblacional verdadera y 5 podrían no incluirla.

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS 137

PUNTOS CLAVE: CRIBADO

TP1.• Sensibilidad = = tasa de verdaderos positivos = 1 – tasa de falsos negativos.

TP � FN

TN2.• Especificidad = = tasa de verdaderos negativos = 1 – tasa de falsos positivos.

TP � FNTF

3.• Valor predictivo negativo = TN � FN

TP4.• Valor predictivo positivo =

TP � FP

FN5.• Tasa de falsos negativos = = 1 – sensibilidad = 100 – % sensibilidad.

FN � TP

FP6. Tasa de falsos positivos = = 1 – especificidad = 100 – % especificidad.

FP � TN

43. ¿Qué significa que dos variables se hallan correlacionadas?

La correlación entre variables refleja el grado de relación entre los cambios de una variable ylos cambios de otra variable. Las variables pueden correlacionarse de forma positiva (es decir,un aumento en una variable comporta un aumento en la otra) o negativa (es decir, un aumentoen una variable comporta una disminución en la otra). Las variables se describen como correlacio-nadas al 100% cuando un cambio en una variable comporta siempre implica un cambio pro-porcional en la otra. Un coeficiente de correlación de Pearson igual a + 1 describe variables quese correlacionan al 100%; mientras que un coeficiente de correlación de Pearson de cero deno-ta variables sin correlación alguna.

44. ¿Qué es la regresión? ¿En qué difieren la regresión lineal y la regresión logística?■ La regresión lineal es un tipo de análisis que se emplea para describir la probabilidad de

que se produzca un desenlace, una variable dependiente, a tenor de la relación entre dos omás variables continuas aleatorias independientes. Se emplea para predecir cómo puedenafectar los cambios en una (en el caso de la regresión lineal simple) o en muchas (en elcaso de la regresión lineal múltiple) variables al valor del desenlace de interés dependiente,representado como x.

Page 136: Epidemiología y bioestadística secretos   nordness1ed

■ La regresión logística es una variación de la regresión lineal utilizada para describir la rela-

ción entre dos o más variables cuando la variable de desenlace dependiente es dicotómica y

las variables independientes son de cualquier tipo.

45. ¿Qué es un análisis de supervivencia?

El objetivo de un análisis de la supervivencia es determinar las probabilidades de «superviven-

cia» de los individuos a partir de un punto de partida designado hasta un momento posterior;

este intervalo se denomina tiempo de supervivencia. Nos referimos como fracaso al criterio

de valoración en estudio. El fracaso no siempre significa muerte sino que define también

desenlaces como el desarrollo de una enfermedad concreta o la recidiva de una enfermedad.

46. ¿Por qué es distinto el análisis de supervivencia de otras formas de regresión?

El análisis de supervivencia requiere un enfoque distinto al de la regresión logística y lineal,

por dos razones: 1) los datos carecen de una distribución normal (es decir, la distribución de

los datos de supervivencia tiende a estar sesgada hacia la derecha), y 2) censura de datos

(es decir, hay unos tiempos de observación incompletos debido a pérdidas en el seguimiento

o a la retirada del paciente de un estudio). Las herramientas potenciales para el análisis son las

tablas de vida, el método de Kaplan-Meier (es decir, el método del producto-límite), la prueba

del orden logarítmico, y la regresión de Cox.

INTRODUCCIÓN A LOS CONCEPTOS BIOESTADÍSTICOS138

BIBLIOGRAFÍA

1.• Morton RF, Hebel JR, McCarter RJ: A Study Guide to Epidemiology and Biostatistics, 4th ed. Gaithersburg,Maryland, Aspen Publications, 1996.

2.• Norman GR, Streiner DL: Biostatistics: The Bare Essentials, 2nd ed. Hamilton, Ontario, B.C. Decker, 2000.3.• Pagano M, Gauvreau K: Principles of Biostatistics, 2nd ed. Pacific Grove, CA, Duxbury Press, 2000.

PÁGINA WEB

http://www.aps.nccd.cdc.gov/brfssdatasystems/estimates.asp

Page 137: Epidemiología y bioestadística secretos   nordness1ed

139

DESCRIPCIÓN Y RESUMEN DE LOS DATOSAdam M. Brown, DO, y Robert J. Nordness, MD, MPH

1. Defina «variable».

Una variable es cualquier cosa que pueda medirse y se pueda observar que varía. Cualquiermedida que se mantenga siempre en un único valor no puede ser considerada una variable, y se denomina más apropiadamente como una constante.

2. ¿Cómo se caracterizan clásicamente los datos?

Los datos se caracterizan clásicamente como datos cuantitativos o cualitativos.

3. ¿Qué son los datos cuantitativos?

Se considera que los datos son cuantitativos cuando se miden en una escala numérica o cuan-titativa. Puede medirse la información como valores discretos enteros o sobre una escala con-tinua. Las escalas ordinal, de intervalos y de cocientes son cuantitativas. La población de unpaís, la talla del zapato de una persona y la velocidad de un coche son ejemplos de informacióncuantitativa.

4. Explique qué son las variables continuas.

Las variables que pueden tomar sólo un valor en un cierto recorrido de un continuo se denomi-nan variables continuas. El tiempo y la distancia son continuos, mientras que el sexo, las pun-tuaciones de algunas pruebas y el «tiempo redondeado al segundo más próximo» no lo son.Las variables cuantitativas que no son continuas se conocen como variables discretas. No hayuna variable que sea verdaderamente continua; sin embargo, con fines prácticos, las variablesdiscretas medidas con precisión suficiente pueden considerarse con frecuencia como conti-nuas a fines prácticos.

5. Explique qué son las variables discretas.

Las variables que sólo pueden tomar un número finito de valores se denominan variables dis-cretas. Todas las variables cualitativas son discretas. Algunas variables cuantitativas son dis-cretas, como el rendimiento clasificado como «1, 2, 3, 4 o 5» y la «temperatura redondeada algrado más próximo». Las variables discretas toman como valores números enteros; otro ejem-plo es el número de fracturas presentes en un paciente traumatizado.

En ocasiones, una variable que toma valores discretos suficientes puede considerarse comocontinua a fines prácticos. Un ejemplo es el tiempo redondeado al milisegundo más próximo.Las variables que pueden tomar un número infinito de valores posibles se denominan variablescontinuas.

6. ¿Qué son los datos cualitativos?

También denominados datos categóricos, los datos cualitativos son variables sin un sentido deordenación natural. Por ejemplo, el color del pelo (p. ej., negro, castaño, gris, rojo o amarillo)es una información cualitativa, como lo es el nombre (p. ej., Juan, Luis, Cristina, María). Se

CA

PÍT

ULO

10

Page 138: Epidemiología y bioestadística secretos   nordness1ed

pueden codificar los factores cualitativos para que aparezcan como numéricos, pero sus núme-ros no tienen significado desde un punto de vista cuantitativo, como la codificación del sexo:hombre = 1, mujer = 2.

7. ¿Son cuantitativas o cualitativas las variables?

Las variables pueden ser cuantitativas o cualitativas. El tipo de variable descrita es un factorsignificativo en el análisis estadístico posterior.

8. ¿Qué es lo que determina que una variable sea independiente?

Una variable independiente puede ser conceptualizada como una causa o influencia hipotéticasobre una variable dependiente; clásicamente, el desenlace de interés. Una variable indepen-diente puede ser un factor que se puede controlar, como un tratamiento, o una exposición queno se controla, o quizás un factor demográfico como la edad o el sexo.

9. ¿Qué son las variables dependientes?

La variable dependiente es el desenlace investigado. Un estudio intenta determinar si existe unaasociación entre los factores de riesgo potenciales (es decir, variables independientes) y lavariable dependiente de interés.

10. Describa la relación entre las variables independientes y las variables

dependientes.

El concepto de variables independientes y dependientes es análogo al que se utiliza en el álge-bra elemental. Una o más variables independientes son sometidas a cierto tipo de operaciónaritmética, con frecuencia con la introducción de constantes, para determinar el valor de lavariable dependiente. En la ecuación F = 1,8 � C + 32, C es la variable independiente y F lavariable dependiente porque los cambios en F dependen de los cambios en C. Si se escribiesela ecuación en la forma de C = (F – 32/1,8), C sería la variable dependiente y F la variable inde-pendiente. Este ejemplo también ilustra que se puede considerar una propiedad o característicacomo factor de riesgo en algunos contextos y como desenlace en otros.

11. Mencione algunas de las escalas de medida utilizadas habitualmente.

Las escalas de medida se pueden dividirse en cuatro categorías:■ Escala nominal.■ Escala ordinal.■ Escala de intervalos.■ Escala de cocientes.

12. Describa la escala nominal.

Se emplean las escalas nominales para agrupar datos cualitativos en categorías arbitrarias sinorden inherente. Un buen ejemplo es la raza/etnia, con los siguientes valores: 1 = blanca; 2 = deascendencia hispanoamericana; 3 = indios de Norteamérica; 4 = negra; 5 = otra. Obsérvese quelos valores numéricos asignados y el orden de las categorías es arbitrario. Ciertos conceptosestadísticos carecen de significación en relación con los datos nominales. Por ejemplo, resul-taría absurdo calcular la media y la desviación estándar de la categoría raza/etnia.

13. Describa la escala ordinal.

Las escalas ordinales clasifican los datos categóricos de modo que hay cierto ordenamientológico de las categorías. Un buen ejemplo es la escala de Likert, que se observa en muchasinvestigaciones: 1 = claro desacuerdo; 2 = desacuerdo; 3 = neutral; 4 = acuerdo; 5 = franco

DESCRIPCIÓN Y RESUMEN DE LOS DATOS140

Page 139: Epidemiología y bioestadística secretos   nordness1ed

acuerdo. Las escalas ordinales muestran una clasificación relativa, pero no se pueden hacersuposiciones sobre el grado de diferencia entre dos valores.

14. Describa la escala de intervalos.

La escala de intervalos es similar a la escala ordinal en el sentido de que hay una clasificaciónsecuencial de los valores asignados. Una escala de intervalos también tiene la propiedad deposeer una diferencia con sentido (es decir, una igual) entre los valores sucesivos de la escala.Las escalas de temperatura de Fahrenheit y Celsius son ejemplos clásicos de escalas de inter-valos. La diferencia entre 70 ºF y 80 ºF es la misma que la diferencia entre 30 ºF y 40 ºF.

15. ¿En qué se diferencia la escala de cocientes de la escala de intervalos?

La escala de cocientes es similar a la escala de intervalos en el sentido de que hay una clasifica-ción con sentido de los valores de la escala, y también porque la diferencia entre cualquiera dedos valores tiene sentido e igual magnitud. Lo que hace que la escala de cocientes sea singulares que el valor cero tiene sentido. Por ejemplo, un peso de cero significa ausencia de materia,mientras que una temperatura de 0 ºF es totalmente arbitraria.

16. ¿Cuál es la significación de un valor cero con sentido en la escala de cocientes?

La implicación de un valor cero con sentido es que el cociente de dos valores tiene tambiénsentido. Por ejemplo, consideremos de nuevo el peso, medido en una escala de cocientes. Unobjeto que pesa 10 kg es dos veces más pesado que un objeto que pesa 5 kg. Sin embargo, nopodemos decir que un objeto con una temperatura de 10 ºF sea dos veces más caliente que unobjeto a 5 ºF, ya que el valor cero en la escala Fahrenheit es arbitrario.

DESCRIPCIÓN Y RESUMEN DE LOS DATOS 141

PUNTOS CLAVE: VARIABLES Y ESCALAS DE MEDIDA

1.• Las variables toman diversos valores.

2.• Las variables independientes se utilizan para calcular valores de variables dependientes.

3.• Se utilizan las escalas nominales para agrupar de modo arbitrario los datos cualitativos.

4.• Las escalas ordinales muestran el rango, pero no dan información sobre la distancia entre valores.

5.• Las escalas de intervalos tienen rango y espaciación con sentido entre los valores.

6.• Las escalas de cocientes tienen un cero con sentido, lo que da significado al cociente entre dosvalores.

17. ¿Qué medidas generales se utilizan para describir las distribuciones de

frecuencias en relación con los datos cuantitativos?

Las medidas de tendencia central y las medidas de dispersión. Las medidas de tendencia cen-tral describen un valor clásico de la distribución, mientras que las medidas de dispersión danuna idea de la dispersión de los datos alrededor de la medida central.

18. ¿Cuáles son las medidas de tendencia central utilizadas con mayor frecuencia?

La media, la mediana y la moda.

19. ¿Cuál es la media de una distribución de frecuencias?

La media es, simplemente, el promedio aritmético de todos los elementos de una muestra. Paracalcular la media de una muestra se suman todos los valores de la muestra y se divide por el

Page 140: Epidemiología y bioestadística secretos   nordness1ed

tamaño de la muestra. Por ejemplo, los valores de cotinina de siete fumadores son: 73, 58, 67,93, 33, 18 y 147. La suma de estos valores es 489. Se divide dicha suma por 7 y se obtiene unamedia de 69,9.

•ni = 1 xix = = (73 + 58 + 67 + 93 + 33 + 18 + 147)/7 = 69,9n

20. ¿Qué es la mediana?

La mediana es el valor central de una distribución de frecuencias ordenada, de modo que, aproxi-madamente, la mitad de los datos son más pequeños y, aproximadamente, la mitad son mayores.

21. ¿Cómo se calcula la mediana de una distribución de frecuencias?

Hay dos fórmulas para el cálculo de la mediana, dependiendo de que el tamaño de la muestrasea par o impar. En ambos casos, se ordenan los datos del más pequeño al mayor.■ Si n (es decir, el número de observaciones en la muestra) es impar, se selecciona la obser-

vación (n + 1)/2. Por ejemplo, considere estas cinco lecturas de colesterol, medidas enmg/dl: 128, 168, 188, 202 y 244. Hay cinco valores en la muestra, de modo que el valor(n + 1)/2 es el tercer valor (188) y la mediana.

■ Si n es par, se selecciona el punto medio entre la observación n/2 y (n/2) + 1. En otro ejem-plo de adultos, los valores de colesterol, en mg/dl, son: 164, 186, 222, 230, 272 y 288. Enrelación con estos datos hay un número par de observaciones (n = 6). De modo que selec-cionamos el valor medio entre la tercera observación (222) y la cuarta observación (230).Así, la mediana es (222 + 230)/2 = 226. Obsérvese que el valor de la mediana en este con-junto de datos no corresponde a un valor real de sujeto alguno de la muestra.

22. ¿Cuál es el indicador más estable de la tendencia central, la mediana

o la media?

La mediana es un indicador más estable de la tendencia central. Por ejemplo, 10 estudiantesconsiguieron los siguientes resultados en un examen de estadística: 41, 42, 42, 43, 44, 46, 48,48, 50 y 98. La mediana aquí es 45, y representa un valor típico (aunque no un valor real) enesta muestra. La media, por otra parte, es 50,2, una puntuación superior al 90% de la muestra.

23. ¿Qué es la moda?

La moda es, simplemente, el valor real más frecuente en una distribución de frecuencias. Elvalor máximo en una frecuencia representa la moda. Una distribución puede tener cualquiernúmero de modas. Las distribuciones con una moda se denominan unimodales, las que tienendos, se denominan bimodales, y así sucesivamente.

DESCRIPCIÓN Y RESUMEN DE LOS DATOS142

PUNTOS CLAVE: TENDENCIA CENTRAL

1.• La media, la mediana y la moda son medidas de la tendencia central.

2.• La media es, sencillamente, el promedio aritmético de los valores observados.

3.• La mediana divide la distribución en dos grupos iguales.

4.• La moda es el valor observado con mayor frecuencia en la distribución.

5.• Puede haber más de una moda en un conjunto de datos dado.

6.• La media resulta más afectada por los valores extremos que la mediana.

Page 141: Epidemiología y bioestadística secretos   nordness1ed

24. ¿Qué es una

distribución

sesgada?

Se considera que unadistribución es ses-gada cuando estádesequilibrada porpuntuaciones extre-mas en un extremo oen sus proximidades.En forma gráfica, lasdistribuciones sesga-das se etiquetansegún la dirección dela cola. Cuando lacola va hacia laizquierda, la curva sehalla sesgada negati-vamente; cuando lacola se dirige hacia laderecha, está sesgada positivamente. Las distribuciones con sesgo positivo son más comunesque las distribuciones con sesgo negativo. La Figura 10-1 muestra tres tipos de sesgo distin-tos: la curva A está sesgada positivamente o sesgada hacia la derecha, la curva B es simétricay no tiene sesgo, mientras que la curva C se halla sesgada negativamente o sesgada hacia laizquierda. Como regla general, la media es mayor que la mediana en las distribuciones consesgo positivo e inferiores a la mediana en las distribuciones sesgadas negativamente, comose ha explicado previamente.

25. Describa un ejemplo de distribución sesgada en el mundo real.

Un ejemplo de sesgo es la distribución de ingresos. La mayoría de la gente gana por debajo de40.000 dólares anuales, pero algunos obtienen unos ingresos bastante superiores, y son muypocas las personas que obtienen muchos millones de dólares por año. Por consiguiente, lacola positiva se extiende hacia afuera una gran distancia, mientras que la cola negativa se detie-ne en cero.

26. ¿Cuál es la relación entre media, mediana y moda en una distribución de

frecuencias simétrica?

En una distribución de frecuencias simétrica, la media y la mediana son idénticas. Además, sila distribución es simétrica y unimodal, la moda es igual a la media y a la mediana. La curva dela izquierda de la Figura 10-2 muestra una distribución de frecuencias simétrica en la que lamedia, la mediana y la moda son iguales.

27. ¿Cuál es la relación entre la media y la mediana en las distribuciones

sesgadas?

En las distribuciones sesgadas, los valores extremos afectan a la media en mayor grado que a lamediana. La media «va detrás de la cola» de las distribuciones sesgadas, mientras que la medianatiende a permanecer en su sitio. La curva sesgada negativamente a la derecha de la Figura 10-2ilustra la relación de la media, la mediana y la moda cuando la distribución es sesgada.

DESCRIPCIÓN Y RESUMEN DE LOS DATOS 143

Figura 10-1. Efecto del sesgo sobre la media, la mediana y la moda. (DeCenters for Disease Control and Prevention: Principles of Epidemiology,2.ª ed. Atlanta, U.S. Department of Health and Human Services, PublicHealth Service, Centers for Disease Control and Prevention, Epidemio-logy Program Office, Public Health Practice Program, 1992.)

Fre

cuencia

Variable x

A B C

Page 142: Epidemiología y bioestadística secretos   nordness1ed

28. ¿Cuáles son las

medidas de dis-

persión utiliza-

das habitual-

mente en

bioestadística?

Las medidas de dis-persión más habi-tuales son el recorri-do o amplitud, ladesviación estándary la varianza.

29. ¿Qué es el reco-

rrido de una dis-

tribución de fre-

cuencias?

El recorrido (R) es lamedida de la amplitud de la distribución total. Se obtiene simplemente calculando la diferenciaentre los valores mayor y menor. Por ejemplo, si el valor mayor en una distribución del cocien-te de inteligencia (IQ) es 160 y el menor es 80, por tanto, el recorrido, la diferencia entre losvalores máximo y mínimo, es R = 80. A tenor de estos dos valores solamente, el recorrido noda información sobre la distribución de los valores entre los dos valores extremos.

30. ¿De qué modo son de utilidad los cuantiles para describir las distribuciones

de frecuencias?

Los cuantiles dividen las distribuciones de frecuencias en subgrupos ordenados iguales, y danmás información sobre la distribución de los datos que el recorrido, que se basa solamente enlos valores extremos, el máximo y el mínimo.

El cuantil utilizado con mayor frecuencia es el cuartil, que divide los datos en cuatro gruposde tamaños idénticos. Los deciles dividen los datos en diez grupos iguales. Todos estamosacostumbrados al percentil, sistema utilizado con frecuencia para describir el rango en unaprueba estandarizada; por ejemplo, una puntuación en el percentil 95 indica un rendimientosuperior al 95% de todos los que tomaron parte en el examen.

31. ¿Cuál es el recorrido intercuartiles?

Tal como se acaba de explicar, los cuartiles dividen una distribución en cuartos. El recorridointercuartiles es la diferencia entre el primer y el tercer cuartil o, en otras palabras, es el recorri-do del 50% de los datos, los centrales. Por definición el 25% de los valores se halla por debajode los encontrados en el recorrido intercuartil, y 25% de los valores, por encima.

32. ¿Qué es la desviación estándar?

La desviación estándar es la medida de la dispersión de los datos alrededor de la media utiliza-da más ampliamente. Cuanto mayor sea la desviación estándar, más dispersos se hallan losdatos con respecto a la media.

33. ¿Cómo se calcula la desviación estándar de una muestra?

La fórmula de la desviación estándar es la que figura al pie, en la que SD = desviación estándar,• = suma de; x = puntuación individual; x (denominada «x-barra») = media de todas las puntua-ciones, y n = tamaño de la muestra (es decir, número de puntuaciones)

DESCRIPCIÓN Y RESUMEN DE LOS DATOS144

Figura 10-2. Áreas bajo la curva normal que quedan situadas entre lasdesviaciones estándares 1, 2 y 3 a cada lado de la media. (De Centers forDisease Control and Prevention: Principles of Epidemiology, 2.ª ed. Atlan-ta, U.S. Department of Health and Human Services, Public Health Service,Centers for Disease Control and Prevention, Epidemiology Program Office,Public Health Practice Program, 1992.)

Distribución simétrica Distribución sesgada

MediaMediana

Moda

ModaMediana

Media

Page 143: Epidemiología y bioestadística secretos   nordness1ed

• (x – x–)2SD =

n – 1

34. Ponga un ejemplo de un problema en el que se calcule la desviación estándar

de una muestra.

Considere las siguientes notas en una prueba de un curso en una facultad de Ciencias Físicasen la que siete estudiantes se hallaban presentes en el día de la prueba: 76, 80, 84, 85, 88, 90 y92. Un rápido vistazo a los datos nos da una idea de que la media se halla en la mitad de los 80.El cálculo de la media es de 85,0, que está muy de acuerdo con nuestro cálculo aproximado.Para calcular la desviación estándar, debemos restar la media de cada valor individual y elevaresta diferencia al cuadrado; a continuación, sumar todos los términos; esta suma se conocecomo suma total de los cuadrados (TSS):

TSS = • (X – media)2

XEn la que la media = •

n

(n = número total de sujetos en el experimento)

(76 – 85)2 + (80 – 85)2 + (84 – 85)2 + (85 – 85)2 + (88 – 85)2 + (90 – 85)2 + (92 – 85)2 = TSS = 190

Se divide ahora la TSS por n–1 (que es 6) para proporcionar un término conocido como varianza:

TSSVarianza = = 31,67

(n – 1)

La raíz cuadrada de este valor es igual a la desviación estándar, SD = 31,67 = 5,63.

35. ¿Qué es la varianza?

La varianza es la medida de la variación entre todos los sujetos en un experimento. Tal como seilustra en el cálculo de la desviación estándar en el problema anterior, la varianza es, sencilla-mente, el cuadrado de la desviación estándar. Al igual que la desviación estándar, la varianza esuna medida de la dispersión del conjunto de datos a partir del valor medio. La varianza es iguala la suma de las diferencias cuadráticas entre cada valor y la media, dividida por el número devalores en el conjunto de datos, menos uno:

TSSVarianza =

(n – 1)

Varianza = (SD)2

36. ¿De qué modo ayuda la desviación estándar a calcular los valores esperados

en una distribución normal?

La Figura 10-3 ilustra la distribución de frecuencias en una distribución normal en relación conla desviación estándar. Globalmente, el 68% aproximadamente de los valores quedan situadosentre dos desviaciones estándares con respecto a la media (es decir, una SD por encima y unaSD por debajo de la media). Más del 95% de los valores quedan situados entre dos desviacio-nes estándares en las dos direcciones a partir de la media, y aproximadamente el 99% de losvalores quedan comprendidos entre tres desviaciones estándares a partir de la media. Estosvalores sirven como estimaciones aproximadas útiles en el caso de que una distribución de fre-cuencias pueda considerarse razonablemente como una distribución normal.

DESCRIPCIÓN Y RESUMEN DE LOS DATOS 145

Page 144: Epidemiología y bioestadística secretos   nordness1ed

37. Describa el coeficiente de variación.

El coeficiente de variación es una medida de la variabilidad de los valores en una muestra, enrelación con el valor de la media. Matemáticamente, es simplemente el cociente entre la desvia-ción estándar y la media. Debe tenerse en cuenta que el coeficiente de variación es verdadera-mente significativo sólo en relación con los valores medidos en una escala de cocientes.

DESCRIPCIÓN Y RESUMEN DE LOS DATOS146

Figura 10-3. Tres curvas con sesgo diferente. (De Centers for DiseaseControl and Prevention: Principles of Epidemiology, 2.ª ed. Atlanta, U.S.Department of Health and Human Services, Public Health Service, Cen-ters for Disease Control and Prevention, Epidemiology Program Office,Public Health Practice Program, 1992.)

Media–18D–28D–38D +38D+28D+18D

68,3%de los datos

95,5%de los datos

99,7%de los datos

PUNTOS CLAVE: DISPERSIÓN

1.• El recorrido, la desviación estándar y la varianza son medidas de dispersión habituales.

2.• El recorrido es, sencillamente, la diferencia entre el valor mayor y el menor, lo que proporciona la amplitud de la distribución, pero nada más.

3.• La desviación estándar es la medida de dispersión utilizada con mayor frecuencia.

4.• En una distribución normal, el 68% de los valores se hallan situados entre una desviación estándarpor arriba y una desviación estándar por debajo del valor de la media.

5.• La varianza es, simplemente, la desviación estándar elevada al cuadrado.

38. Defina el error estándar de la media (SEM).

El error estándar de la media es, simplemente, una estimación de la exactitud de la media deuna muestra al describir la media de la población de la que se extrajo. Si se tomaran muchasmuestras de una población dada, se esperaría que las medias fuesen ligeramente diferentes,tanto entre sí como a partir de la población verdadera. El error estándar de la media es, simple-mente, una estimación de la desviación estándar de un grupo de medias muestrales alrededorde la media poblacional.

Page 145: Epidemiología y bioestadística secretos   nordness1ed

39. ¿Cómo se calcula el SEM?

El SEM se calcula, muy sencillamente, dividiendo la desviación estándar de una única muestrapor la raíz cuadrada del número de observaciones en dicha muestra.

SDSEM =

n

40. ¿Para qué se emplea el SEM?

El SEM se emplea para construir intervalos de confianza alrededor de la media de una muestra.Cuanto más pequeño sea el SEM, más confiados nos sentiremos en que la media de la muestrasea verdaderamente representativa de la media poblacional.

41. Defina un error de medida.

Un error de medida es la variación en la medida de observaciones que es atribuible al propioproceso de medida. La variación de medida es un término utilizado con frecuencia como sinó-nimo de error de medida.

42. Cite los dos tipos de error de medida que pueden cometerse.

El error de medida consta del error sistemático y del error por azar (error aleatorio).

43. ¿Cuál es el error de medida por azar o error aleatorio?

Los errores aleatorios aumentan la dispersión, y tienen una probabilidad igual de situarse acualquier lado del valor verdadero. Se considera que los errores aleatorios se producen porazar y no son predecibles. Todos los datos del muestreo se hallan sujetos a error por azar. Alaumentar el número de mediciones en una muestra, la discrepancia causada por el error alea-torio disminuye, y la suma de errores por azar tiende a cero.

44. ¿Qué es el error de medición sistemático?

El error de medición sistemático, también conocido como sesgo, está causado por un defectoconstante en algún aspecto del proceso de medición que da origen a que los valores se centrenalrededor de un valor que no es el valor verdadero. El aumento del número de observacionesno tiene efecto alguno sobre el error sistemático.

45. ¿Qué es la precisión?

La precisión es la ausencia de error aleatorio, lo que da origen a un estrecho agrupamiento enmediciones repetidas.

46. ¿Qué es la validez?

La validez es la ausencia de error sistemático (es decir, sesgo), lo que lleva a que los valoresmedidos se aproximen al valor verdadero.

47. ¿Qué es una tasa?

En términos estadísticos, una tasa es la medida de la frecuencia de un suceso durante un inter-valo de tiempo. En epidemiología, en demografía y en las estadísticas vitales, una tasa es una expresión de la frecuencia con la que se produce un suceso en una población definida, en un período de tiempo especificado. Las tasas son cocientes, y se calculan al dividirun numerador (p. ej., el número de muertes o de casos de una enfermedad de aparición recienteen un período dado) por un denominador (p. ej., la población promedio durante dicho período).

48. ¿Qué es una proporción?

Una proporción es un tipo de cociente en el que el numerador está incluido en el denominador,que representa la totalidad de la muestra. Por definición, una proporción tiene un valor com-

DESCRIPCIÓN Y RESUMEN DE LOS DATOS 147

Page 146: Epidemiología y bioestadística secretos   nordness1ed

prendido entre 0 y 1. Dado que el numerador y el denominador tienen la misma dimensión, unaproporción es una cantidad adimensional.

DESCRIPCIÓN Y RESUMEN DE LOS DATOS148

PUNTOS CLAVE: ERRORES

1.• Se emplea el error estándar de la media (SEM) para calcular la diferencia de la media de unamuestra con respecto a la media de la población madre.

2.• Los errores de medición se clasifican como errores por azar (aleatorios) o errores sistemáticos.

3.• Los errores aleatorios por azar crean dispersión.

4.• El efecto del error aleatorio disminuye a medida que aumenta el número de observaciones.

5.• El error sistemático se conoce también como sesgo.

6.• El error sistemático es un error de medición constante que centra las observaciones en un valordistinto al valor verdadero.

49. Ponga un ejemplo de proporción.

Veinte estudiantes se examinaron de bioestadística y 15 de ellos aprobaron. La proporción de losque suspendieron = 5 estudiantes que suspendieron del total de 20 estudiantes que tomaronparte en el examen = 5/20 = 0,25. Las proporciones se convierten con frecuencia en porcentajespor comodidad; se dirá que el 25% de los estudiantes que se examinaron fueron suspendidos.

PÁGINAS WEB

1.• http://www.zebu.uoregon.edu/1999/es202/I16.html

2.• http://www-phm.umds.ac.uk/teaching/ClinEpid/default.htm

3.• http://www.consort-statement.org

4.• http://www.psych.rice.edu/online_stat/glossary/skew.html

5.• http://www.davidmlane.com/hyperstat/A92403.html

6.• http://www.davidmlane.com/hyperstat/A11284.html

7.• http://www.cs.umd.edu/~mstark/exp101/expvars.html

8.• http://www.tufts.edu/~gdallal/LHSP.htm

BIBLIOGRAFÍA

1.• Bland JM, Altman DG: Statistics notes: Measurement error and correlation coefficients. BMJ 313:41–42, 1996.2.• Centers for Disease Control and Prevention: Principles of Epidemiology, 2nd ed. Atlanta, U.S. Department of

Health and Human Services, Public Health Service, Centers for Disease Control and Prevention, EpidemiologyProgram Office, Public Health Practice Program,1992.

3.• Devereaux PJ, Manns BJ, Ghali WA, et al: Physician interpretations and textbook definitions of blinding terminology in randomized controlled trials. JAMA 285:2000–2003, 2001.

4.• Jekel JF, Katz DL, Elmore JG: Epidemiology, Biostatistics, and Preventive Medicine, 2nd ed. Philadelphia, W.B.Saunders, 2001.

5.• Last JM (ed): A Dictionary of Epidemiology, 4th ed. Oxford, Oxford University Press, 2001.6.• Rothman KJ: Epidemiology: An Introduction. Oxford, Oxford University Press, 2002.

Page 147: Epidemiología y bioestadística secretos   nordness1ed

149

CA

PÍT

ULO

11DISTRIBUCIONES DE FRECUENCIAS

Y DE PROBABILIDADESRobert W. Perkins, MD, MPH

DISTRIBUCIONES DE FRECUENCIAS

1. ¿Qué es una distribución de frecuencias?

Una distribución de frecuencias ilustra con qué frecuencia aparecen las diferentes categoríasde datos dentro de una muestra de datos. Esta información se presenta en una variedad de for-matos diferentes, desde tablas simples a gráficos y diagramas tridimensionales. Los datostabulados son útiles cuando hay que mostrar una gran cantidad de variables. También son úti-les si se desea presentar un conjunto de datos que tienen una escala significativamente dife-rente. Por ejemplo, la frecuencia acumulativa en el eje de las x siempre aumenta desde cero al100%, con independencia de la frecuencia de categorías en el eje de las y. Tal variación puedehacer que una gráfica sea ilegible cuando estos datos se representan juntos. La presentaciónde los mismos datos en una tabla evita este problema de escala.

2. ¿Cuál es la diferencia entre datos discretos y datos continuos?

Los datos discretos tienen un conjunto circunscrito de posibles valores. Los datos continuosson abiertos, con un conjunto infinito de posibles valores. La presencia de una distancia entrelos valores que tenga sentido también es útil para separar los tipos de datos. Consideremos,por ejemplo, la diferencia entre letras y números. Hay una distancia con sentido entre 2 y 3, y esta distancia es la misma entre cualquier pareja de números adyacentes. Sin embargo, nohay una distancia cuantificable entre la K y la L. El concepto de «distancia» entre letras carecede sentido. Por las dos razones expuestas, los alfabetos son conjuntos de datos discretos, y los números lo son de datos continuos.

3. Describa los dos tipos de datos discretos y ponga ejemplos de ambos.

■ Los datos nominales constan de categorías con nombre, sin una relación definida concualquier otra categoría y sin orden inherente. Los nombres de los colores, por ejemplo,no definen de modo inherente la distancia o valor de un color a otro, y no definen ordenalguno entre ellos. El rojo no es mayor que el azul y ni está más alejado del azul que el púr-pura lo está del naranja. Los lectores con una mentalidad física pueden protestar de quelos colores sí tienen orden y una distancia con sentido, dada su posición relativa en elespectro de la luz visible. Sin embargo, ésta es la aplicación arbitraria de las etiquetas dis-cretas (es decir, los nombres de los colores) a una propiedad continua de la luz, la longitudde onda electromagnética.

■ Los datos ordinales constan de categorías con nombre que, aunque carecen de una distan-cia con significado entre ellas, tienen un orden establecido entre las mismas. Las calificacio-nes o grados por letras asignados en la escuela ilustran cómo los datos ordinales nos dicenqué categoría viene en primer lugar, pero no nos dicen nada sobre la distancia relativa entreellas. (Por ejemplo, los que obtienen una A son mejores que los D, pero la diferencia entreuna A y una B puede no ser la misma que entre una D y una F.)

Page 148: Epidemiología y bioestadística secretos   nordness1ed

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES150

4. Responda de nuevo a la pregunta 3, esta vez en relación con los datos continuos.■ Datos con intervalo. La temperatura en grados centígrados es un ejemplo de datos con

intervalo. Un grado de diferencia en la escala centígrada de temperaturas es un cambiocuantificable que se preserva en todos los posibles valores del recorrido de temperaturas.Por ejemplo, 5 ºC es la misma «distancia» con respecto a 4 ºC que la que hay entre 120 ºC y121 ºC. Sin embargo, 100 ºC no es «el doble de caliente» que 50 ºC en términos de energía.Ello se debe a que el punto cero en la temperatura centígrada se fija de modo arbitrario en elpunto de congelación del agua. Los datos con intervalo tienen una distancia entre unidadescon sentido, pero el cociente entre dos valores no es una cantidad con sentido.

■ Datos de cocientes. Los grados Kelvin son un ejemplo de datos de cocientes. Los gradosKelvin tienen orden, distancia con sentido y un cero con sentido: el cero absoluto, para serprecisos. Si convertimos la relación entre 100 ºC y 50 ºC a grados Kelvin, vemos que 373 K/323 K = 1,15. De modo que con respecto al cero absoluto, 100 ºC es sólo un 15%, aproxi-madamente, más caliente (o tiene sólo 15% más de energía) que 50 ºC. El cociente entremediciones en grados Kelvin es una cantidad con sentido que describe una relación másverdadera entre estados que los grados centígrados.Como se puede observar, precisar la diferencia exacta entre los datos de cocientes y los

intervalos no siempre es sencillo. Con frecuencia, muchos tipos de datos no son exactamenteni uno ni otro. Este aspecto no es generalmente tan crítico para el análisis como la distinciónentre «supercategorías» de datos discretos y continuos.

5. ¿De qué modo afectan los tipos de datos al modo en que se presentan las

distribuciones?

En relación con los datos discretos (es decir, datos nominales y ordinales), se representa cadacategoría o clase frente a la frecuencia con la que se observa dicha categoría en la muestra. Encuanto a los datos continuos (es decir, datos con intervalos y de cocientes), cada dato aisladoestá técnicamente dentro de su propia categoría. La representación gráfica de la frecuencia decada dato individual (en todos, menos en los conjuntos de datos muy pequeños) da lugar agráficas de agrupamiento que no transmiten información útil.

6. ¿De qué modo se pueden presentar más claramente los datos continuos?

En primer lugar, este tipo de datos debe agruparse en gamas y, a continuación, representarlasde acuerdo con la frecuencia con la que aparecen en la muestra los datos de cada gama. Véasela Figura 11-1 para un ejemplo de una distribución de datos continuos.

7. Describa tres aplicaciones habituales de las distribuciones de frecuencias.■ Las distribuciones de frecuencias se utilizan a menudo para presentar los resultados de los

datos analizados. Con un formato apropiado, transmiten gran cantidad de información enuna figura simple y compacta.

■ Son particularmente útiles en la fase inicial del análisis de los datos recogidos. La represen-tación gráfica de la distribución de los datos sin elaborar identifica, con frecuencia, los valo-res atípicos (es decir, anormalmente altos o bajos), los datos ausentes y los problemas conla colección de datos sesgados.

■ También es importante la distribución de frecuencias para la formulación de una estrategiade análisis estadístico, porque algunas pruebas estadísticas requieren que los datos esténnormalmente distribuidos.

8. Enumere tres valores utilizados habitualmente para caracterizar la tendencia

central de un conjunto de datos.■ Media: la suma de los valores de cada uno de los datos, dividido por el número de valores.■ Mediana: el valor central, una vez que se han ordenado los valores de mayor a menor.■ Moda: el valor que aparece con mayor frecuencia.

Page 149: Epidemiología y bioestadística secretos   nordness1ed

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES 151

9. ¿Cuál es el término que mejor describe la tendencia central de los datos de

intervalos y de cocientes?

El mejor descriptor de la tendencia central depende del tipo de datos de la distribución. La mediase utiliza muy habitualmente para describir la tendencia central de los datos en intervalos ydatos de cocientes. Este cálculo depende de la existencia de una distancia con significado entrelos valores y, por tanto, no puede ser utilizado en los datos ordinales y nominales. Los gradospor letras son un buen ejemplo. No se pueden tomar dos A, cuatro B, una C y una D, sumarlas, y dividir por ocho para obtener un grado promedio. Sin embargo, si se asigna a cada grado unvalor al intervalo o cociente (p. ej., sistemas de grados de cuatro puntos, en que A = 4, B = 3, etc.),es posible el cálculo de la media de grados.

Si esto le resulta equívoco, ¡felicitaciones! Está claro que ha estado prestando atención.Dado que empezó con datos discretos, hay un elemento de artificialidad introducido al conver-tir a una escala de graduación continua y a computar una media de ella. El cálculo de la mediasupone una distancia unitaria que tiene sentido, con la que nunca se debía empezar.

10. ¿Cómo se mide la tendencia central en relación con los datos ordinales

y nominales?

Los datos ordinales, aunque no tienen una distancia con sentido entre valores, siguen teniendoun orden con sentido. En consecuencia, la categoría con el valor central o mediana entre lascategorías ordenadas describe el valor central a cuyo alrededor se distribuyen los datos. Ladescripción de la tendencia central de los datos nominales se limita a la moda. Dado que nohay una distancia con sentido entre categorías, y no hay orden con el cual se pueda determinarel valor central, la categoría que se da con mayor frecuencia (es decir, la moda) es el único sis-tema para expresar la tendencia central. Desde luego, no hay nada «central» en absoluto enrelación con este número, porque las categorías de los datos nominales pueden ordenarse delmodo que uno desee.

11. ¿Qué son las medidas de dispersión, y cuál es la mejor medida para cada tipo

de dato?

Las medidas de dispersión indican, a partir de una tendencia central, lo próximos que se locali-zan el resto de los datos alrededor del valor central. En consecuencia, no hay una medida dedispersión para la moda cuando se utiliza para describir los datos nominales (de nuevo, no hay

Figura 11-1. Distribución de frecuencias.

Horas

Po

rcenta

je (%

)

50

40

30

20

10

0

0-10 11-20 21-30 31-40 > 40

Page 150: Epidemiología y bioestadística secretos   nordness1ed

nada «central» en cuanto a este valor). En relación con todos los tipos de datos restantes, elrecorrido intercuartil (es decir, el 50% central de los datos) es el que mejor describe la disper-sión alrededor de la moda. Cuando se utiliza la mediana para describir la tendencia central, ladispersión se caracteriza muy habitualmente por el recorrido. Se calcula éste restando el valormínimo del valor máximo, y se indica como un número único. Por ejemplo, dado el siguienteconjunto de datos (2, 3, 6, 9, 22, 23), el recorrido se indicaría como 21 (no como 23-2). Ladesviación estándar es la medida de dispersión utilizada con mayor frecuencia en relación conlos datos de intervalos y de cocientes.

12. ¿Cómo se calcula la desviación estándar?

Primero, se calcula la media de los datos. A continuación, para cada valor, se calcula la diferen-cia entre el valor y la media. Esto proporciona una columna de datos, unos positivos y otrosnegativos, que representan la distancia de cada valor con respecto a la media. Si se sumanestos datos con fin de calcular la «desviación promedio» se obtiene el valor cero, lo cual no dauna buena información sobre la distancia promedio de los datos con respecto a la media.

13. Por consiguiente, ¿de qué modo se puede preservar la información de cada

desviación con respecto a la media?

Se eleva cada resultado al cuadrado, antes de sumarlos, lo que elimina los números negativos.Al dividir la suma de estos valores por el número total de datos se obtiene la distancia prome-dio con respecto a la media, en unidades cuadráticas, lo cual se conoce como varianza. Dadoque las unidades cuadráticas no tienen mucho sentido, se calcula la raíz cuadrada de la varian-za para restablecer las unidades originales. Ésta es la desviación estándar, que se expresacomo:

• (x – x–)2 SD =

N

en la que x es el valor de cada dato, x– es la media, y N es el número de datos. La fórmula de lavarianza (s2) incluye todo lo que figura bajo el signo de la raíz cuadrada. Se emplea la fórmulaanterior para el cálculo de la desviación estándar de una población. Con mucha frecuencia, enbioestadística se analizan datos de una muestra poblacional, y en tal caso la fórmula correctade la desviación estándar de una muestra viene dada por

• (x – x–)2 SD =

n – 1

Se define la desviación estándar como la raíz cuadrada de la varianza; por consiguiente, varian-za = (desviación estándar)2.

14. Indique tres términos que se emplean para describir la forma de las

distribuciones de frecuencias.

Modalidad, sesgo y curtosis. La «modalidad», tal como se emplea aquí, es un término conven-cional más que una verdadera propiedad de una distribución. Tal como se ha descrito anterior-mante, la moda hace referencia a la categoría que aparece con mayor frecuencia. En una gráfi-ca, es la categoría máxima, y todas las demás figuran por debajo. Los conjuntos de datos conuna sola categoría «más frecuente» dan lugar a una distribución unimodal; es decir, categoríacon un solo máximo. Si los datos tienen dos o más categorías con frecuencias notablementemás elevadas, la distribución es bimodal, trimodal, etc. Con frecuencia, se utiliza esta termino-logía con datos de intervalos y de cocientes para describir distribuciones con múltiples máxi-mos, aunque rara vez se utiliza la moda para describir estos tipos de datos. La Figura 11-2muestra un ejemplo de una distribución bimodal.

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES152

Page 151: Epidemiología y bioestadística secretos   nordness1ed

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES 153

15. ¿Qué es un sesgo? ¿De qué modo afecta a la forma de la distribución?

El término sesgo hace referencia a la simetría de la distribución de los datos. Una distribución sinsesgo es simétrica con respecto al valor central, y tiene una distribución aproximadamente igualde valores decrecientes a cada lado. Se dice que la distribución está sesgada a la derecha cuandoel centro de los datos está desviado a la izquierda, dejando una cola en dirección al lado derechode unos valores de gran magnitud y de frecuencia comparativamente baja. Por convención, elsesgo hace referencia a la derecha o a la izquierda a tenor de la dirección de la cola (Fig. 11-3).

Figura 11-2. Distribución bimodal.

Figura 11-3. Ejemplo de una distribución sesgada a la derecha.

Tiempo

30

20

10

0

Po

rcenta

je (%

)

1-3

3-5

5-7

7-9

9-1

1

11-1

3

13-1

5

15-1

7

17-1

9

19-2

1

21-2

3

23-1

Moda Mediana Media

30

20

10

0

16. Responda a la misma pregunta anterior en relación con la curtosis.

El término curtosis hace referencia a la rapidez con la que cambian las frecuencias de las cate-gorías al alejarse del valor central. Si la frecuencia de cada categoría disminuye rápidamente amedida que nos alejamos, la distribución tiene un aspecto más alto, más estrecho y con unamenor distribución en las colas (es decir, la distribución es leptocúrtica). Si las frecuencias nodisminuyen rápidamente a medida que nos alejamos del valor central, la distribución es másaplanada, más ancha, y tiene más valores en las colas (es decir, la distribución es platicúrtica).

17. ¿De qué modo se relacionan las medidas de la tendencia central

y de dispersión con la curtosis?

La curtosis se relaciona también con la frecuencia (es decir, el eje de las y) del valor central. En consecuencia, los diversos grados de curtosis puede reflejar diferencias en la frecuencia del

Page 152: Epidemiología y bioestadística secretos   nordness1ed

valor central, pero no necesariamente cambian la magnitud (es decir, el eje de las x) del valorcentral. Dado que la curtosis describe la anchura de una distribución alrededor del valor cen-tral, se verá afectada por los diversos grados de dispersión.

18. ¿De qué modo afecta el sesgo a estas mismas medidas?

El sesgo es el resultado de categorías de baja frecuencia con unos valores anormalmente altoso bajos. Por definición, las categorías de baja frecuencia no deben cambiar la moda. De modosimilar, la mediana es relativamente resistente al cambio de unas pocas categorías de valoresextremos. Cambia más que la moda, porque el valor central se desvía algo cuando se añadennuevas categorías a los extremos de la distribución. El cálculo de la media pondera por iguallos valores atípicos y los datos centrales, de modo que puede cambiar significativamente alañadir incluso pocos valores extremos. La Figura 11-3 muestra un ejemplo de los cambios enla media, mediana y moda en una distribución sesgada.

19. ¿De qué modo los valores extremos afectan a la distribución alrededor de los

valores centrales?

Los valores extremos pueden influir también sobre las medidas de dispersión. El recorrido sedefine por los valores extremos, y puede verse cambiado significativamente con los datos ses-gados. La desviación estándar pondera por igual la desviación de cada categoría a partir de lamedia, de modo que las categorías de baja frecuencia en los extremos sí la afectan, pero no demodo excesivo. Dado que el recorrido intercuartil representa el 50% de los datos, los centralesresultan menos afectados por el sesgo.

20. ¿Qué es una distribución normal?

La distribución normal (es decir, gaussiana) es una forma definida matemáticamente, que essimétrica con respecto a una media de valor cero, tiene un sesgo y una curtosis cero, y unamediana y moda que son iguales a la media. Es una distribución teórica, de modo que los valo-res altos y bajos en las colas se aproximan al cero pero, nunca lo alcanzan.

21. ¿Para qué sirve?

Muchos procesos de interés para los investigadores se presentan con distribuciones aproxima-damente normales. Una distribución matemáticamente normal puede simplificar los cálculoscuando se utiliza para inferir propiedades estadísticas a partir de los datos reales casi normales.Las medias procedentes de muestreos repetidos de una población dada tienden a quedar distri-buidas normalmente (fenómeno descrito como teorema del límite central), y muchas pruebasestadísticas empleadas para analizar datos muestrales se basan en el supuesto de una distribu-ción aproximadamente normal.

22. La distribución normal puede utilizarse para inferir las propiedades de otras

dos grandes categorías de datos. ¿De cuáles?

Puede utilizarse la distribución normal para inferir propiedades de datos tanto muestrales comopoblacionales. Los datos muestrales hacen referencia a un subgrupo de datos recogidos a partirde una población dada. Sería la distribución de las respuestas que se obtendrían si se preguntaraa una muestra de 100 propietarios de motocicletas cuánto dinero se han gastado en las mismasese año. La distribución poblacional es el resultado de recoger los mismos datos a partir de cadauno de los propietarios de motocicletas durante el mismo período de tiempo.

23. ¿Por qué se utilizan datos muestrales en lugar de datos poblacionales?

Los datos de una muestra, por definición, son relativamente obtenibles. Los datos de unapoblación generalmente no lo son. Los datos poblacionales evolucionan con frecuencia y cam-

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES154

Page 153: Epidemiología y bioestadística secretos   nordness1ed

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES 155

bian antes de que se pueda recoger la totalidad del conjunto de datos. Se introduce con ello unerror si se registra el dato 100.000 en un estado diferente o en un momento en el tiempo dife-rente. Los datos muestrales se diseñan para que tengan un tamaño suficiente y proporcionenuna información significativa sobre la población de la que proceden y, sin embargo, sean reco-gidos antes de que se hayan producido muchos cambios. Por último, en relación con todas laspoblaciones, a excepción de las de pequeño tamaño, los costes para recoger datos poblaciona-les en el mundo real son, generalmente, prohibitivos.

24. Describa la relación entre el área bajo la curva de una distribución y el

porcentaje de datos en dicho recorrido.

En cualquier distribución, el área bajo la curva delimitada por dos límites es proporcional alporcentaje de los datos de la muestra situados entre dichos límites. Si se desea conocer quéproporción de la muestra está comprendida entre dos valores particulares, ésta es una propie-dad muy útil. La Figura 11-4 ilustra el área bajo la curva entre dos valores arbitrarios. Esta áreaes proporcional al porcentaje de todos los datos muestreados situados entre 12 y 16.

Figura 11-4. Área bajo la curva entre dos límites.

181614121086420

12 16

25. ¿Cómo se calcula la proporción exacta a partir de la distribución?

Lamentablemente, antes de que se dispusiera de los programas informáticos de los ordenado-res, el cálculo del área de cada posible combinación de los límites era complicado e impractica-ble, y se tenía que realizar el cálculo con cada nuevo conjunto de datos. Se procedió a calcularel área bajo la curva entre la media y varios valores cada vez más distantes a partir de la media,se compilaron los resultados en grandes tablas y así los usuarios podían extrapolar posterior-mente los valores de interés entre los valores tabulados.

26. ¿De qué modo ayuda la distribución normal a resolver este problema?

Los estadísticos se dieron cuenta de que si los datos de las muestras tenían una distribuciónaproximadamente normal se podía utilizar una tabla confeccionada para la distribución normaly calcular así el área bajo la curva de la distribución de la muestra. La Figura 11-5 muestra unadistribución de una muestra en la que la media es 10 y la desviación estándar de la muestra es 2. Para representar el área bajo la curva entre los valores 8 y 10 sólo se necesita encontrarqué valor de la distribución normal tiene la misma distancia relativa con respecto al cero, talcomo lo hace el valor de interés (es decir, 8) de la media en la distribución de nuestra muestraparticular (es decir, 10).

Porcentaje

Page 154: Epidemiología y bioestadística secretos   nordness1ed

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES156

27. ¿De qué modo se pueden comparar los valores de unos datos reales con una

distribución teórica sin «unidades»?

Calculando la distancia del valor de la muestra de interés con respecto a la media de la muestraen unidades de desviación estándar. Este cálculo, conocido como puntuación zeta (o índicezeta), viene dado por la fórmula:

X – x–z =

s

en la que X es el valor de un dato de la muestra, x es la media de la muestra, y s es la desvia-ción estándar de la muestra. En la Figura 11-5 la puntuación z es (8 – 10)/2, o –1. Si la muestratiene una distribución normal, el porcentaje de datos situados entre 8 y 10 en la muestra esproporcional al área bajo la curva entre 0 y –1 en una distribución normal (recuerde que la SDen una distribución normal es 1).

28. ¿De qué modo se utiliza la puntuación zeta para obtener información a partir

de la distribución normal?

Se introduce la puntuación z en una tabla de valores para la distribución normal, y nos indica elárea correspondiente bajo la curva delimitada por cero y la puntuación zeta. Esta área es idénti-ca (o casi idéntica) al área comprendida entre la media de la muestra y el valor de interés enuna distribución muestral, y es proporcional al porcentaje de la muestra que se halla compren-dida entre dichos valores. Se puede emplear pues un conjunto de tablas de la distribución nor-mal para cualquier muestra de datos.

29. ¿Qué otra información puede obtenerse con las puntuaciones zeta?

Se puede realizar el cálculo en sentido inverso. Por ejemplo, si se desea saber el recorrido aambos lados de la media que contiene el 95% de los datos, se realiza primero el cálculo parauna distribución normal utilizando unidades de desviación estándar. El resultado es que el 95%de los valores de una distribución normal están situados en un recorrido comprendido entre ±2 desviaciones estándares a partir de cero (aproximadamente, 47,5% por encima y 47,5% pordebajo). En consecuencia, el 95% de los datos de la muestra estará comprendido entre ±2 des-viaciones estándares a partir de la media de la muestra, con tal de que los datos de la muestra

Figura 11-5. Relación entre la distribución de una muestra y la distribu-ción normal.

Distribución de la muestra Media = 10, SD = 2

Distribución normal Media = 0, SD = 1

8 10

–1 SD 0

Page 155: Epidemiología y bioestadística secretos   nordness1ed

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES 157

se distribuyan normalmente. Este aspecto tendrá su importancia más adelante cuando se intro-duzcan las pruebas estadísticas.

30. ¿De qué modo la distribución normal puede relacionar entre sí las

distribuciones muestrales y las poblacionales?

La relación entre las distribuciones muestrales, distribuciones poblacionales y la distribuciónnormal constituye el teorema del límite central. Este teorema trata la cuestión de qué sucedecuando se extrae una muestra de datos a partir de una población, y hasta qué punto la muestrarefleja la distribución de los datos en toda la población (lo cual, generalmente, no se puedemedir y que, a su vez, es la razón por la que se toman muestras). También tiene en considera-ción qué sucede cuando se extraen múltiples muestras de la misma población, hasta qué puntodifieren entre sí y hasta qué punto difieren de la distribución de la población verdadera.

31. ¿Por qué es importante la diferencia entre muestras repetidas?

En el ejemplo de la motocicleta, una distribución muestral única puede ser similar a la distribu-ción de la población verdadera. Sin embargo, también existe la posibilidad de que, por azar, sehaya muestreado por casualidad una muestra de propietarios que han gastado más que la can-tidad promedio en dicho año. Para asegurarse, se decide repetir la muestra 19 veces más, paraalcanzar un total de 20 muestras. Ahora, no sólo diferirá cada una de las distribuciones entre síligeramente con respecto a la verdadera distribución poblacional sino que también diferiránentre sí en cierto grado.

32. Todo esto es muy interesante, pero aún no ha respondido a la pregunta.

Cierto, pero casi estamos en ello. Ahora se podría informar de la media y de la desviaciónestándar de dólares gastados en motocicletas dicho año por cada grupo. Tomemos las mediasde los 20 valores, los representamos como una distribución y calculamos el valor de la mediade estas medias. El valor con el que se agrupan estas medias debe ser muy próximo al verda-dero valor poblacional, especialmente a medida que aumenta el número de muestras. El teore-ma del límite central indica que la distribución de estas medias (es decir, la representación queacabamos de hacer) dado un número de muestras suficiente estará distribuida normalmente.De un modo menos intuitivo, indica que estas medias estarán distribuidas normalmente aúncuando la distribución poblacional verdadera no fuera normal.

33. Bonito truco, pero ¿qué se puede hacer?

Esta distribución normal de las medias muestrales se agrupa alrededor de la media de lasmedias, y tiene una desviación estándar de, aproximadamente, dicho valor. En este caso, sinembargo, el valor central a cuyo alrededor tienden a agruparse es la verdadera media poblacio-nal, propiedad muy útil si lo que sucede es que no se puede medir la población en su totalidad.Esta medida de dispersión de estas medias muestrales alrededor de la verdadera media de lapoblación (análogo a la desviación estándar alrededor de la media de la muestra) viene estima-da por el error estándar de la media, y viene dada por la fórmula

sSEM =

n

en la que s es la desviación estándar de la media de la muestra, y n el tamaño de la muestra.Dado que estas medias se hallan distribuidas normalmente, se pueden utilizar ahora las pun-tuaciones z y la tabla de la distribución normal para inferir propiedades de la distribución de lapoblación, del mismo modo que inferíamos las propiedades de la distribución de nuestramuestra.

Page 156: Epidemiología y bioestadística secretos   nordness1ed

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES158

34. ¿Qué sucede a la SEM a medida que aumenta n?

A medida que aumenta n y se aproxima al tamaño de la población en su totalidad, la SEM seaproxima a cero. Esto tiene sentido, porque cuanto más próximo se está de contar la totalidadde los sujetos u objetos de una muestra, menos error habrá en el cálculo.

35. ¿Cuál es la diferencia entre un parámetro poblacional y un estadístico

poblacional?

El parámetro poblacional es la característica poblacional verdadera (p. ej., media o SD) que seestá intentado calcular por medio del proceso descrito en la pregunta 33. El estadístico pobla-cional es el valor estimado que calculamos.

36. ¿Cómo se interpreta el estadístico inferencial?

El estadístico inferencial se comentará con mayor detalle en capítulos posteriores. Esencialmen-te, llega a preguntar cuál es la diferencia entre el estadístico poblacional y el parámetro poblacio-nal. Cuantifica también qué parte de la diferencia se debe al azar, qué parte puede atribuirse a unefecto de interés, y si «otra» variable no medida (pero influyente) afecta a los resultados.

37. ¿Puede utilizarse esta técnica con todos los tipos de datos?

Puede utilizarse, siempre que los datos estén distribuidos normalmente. Como se ha sugeridoanteriormente, el proceso de muestreo sólo tiende a proporcionar unas medias distribuidas nor-malmente, que pueden analizarse como se ha descrito. Las pruebas paramétricas hacen referen-cia a las pruebas inferenciales que se basan en los datos distribuidos normalmente. En capítulosposteriores se introducirán técnicas en las que los datos no normales pueden ser transformadosmatemáticamente de la forma que mejor se aproxime a una distribución normal y, de este modo,poder ser analizados con pruebas paramétricas. Sin embargo, hay tipos de datos que inherente-mente no son normales. Las variables dicotómicas tales como las catego rías de «vivo/muerto»dan lugar a una distribución de frecuencias de dos categorías que no es normal. Hay técnicas noparamétricas para analizar tales datos, que también se comentarán con detalle más adelante.

DISTRIBUCIONES DE PROBABILIDADES

38. ¿Qué es una distribución de probabilidades y en qué se diferencia de una

distribución de frecuencias?

Recuerde que, en relación con las distribuciones de frecuencias, las categorías del eje x puedendenominarse ocurrencias (en el caso de datos nominales y ordinales) o una gama de

PUNTOS CLAVE: DISTRIBUCIONES DE FRECUENCIAS

1.• Las distribuciones de frecuencias dividen los datos en categorías, y muestran la frecuencia con quese ha presentado cada una de ellas.

2.• Se caracterizan por medidas de tendencia central, dispersión, sesgo y curtosis.

3.• Pueden relacionarse con proporciones específicas de los datos de la muestra y con la distribuciónnormal, por el área bajo la curva que se define entre los valores límite.

4.• Tienden a estar normalmente distribuidas cuando se describen las medias de muestras repetidas,aun cuando la distribución normal no lo fuera (es decir, el teorema del límite central).

5.• Pueden relacionarse con propiedades de la distribución normal por medio del cálculo de las puntuaciones zeta, que se hallan en unidades de desviación estándar.

Page 157: Epidemiología y bioestadística secretos   nordness1ed

valores (en el caso de datos por intervalos y de cocientes). Dentro de cada categoría, el númeroreal de veces (es decir, la frecuencia) que apareció la categoría viene descrito en el eje de las y.En relación con cada una de estas categorías, la gama de valores posibles sobre la frecuenciaes ilimitado: puede ser cualquier valor entre el cero y el infinito. No obstante, en una distribu-ción de probabilidades, cada una de las categorías describe una condición específica que, obien se da o no se da. Son los denominados sucesos dicotómicos. Si se muestrea a 100 perso-nas, el rasgo de ser propietario de una motocicleta es una proposición del todo o nada. O bienson propietarios o no lo son. Por tanto, los valores en el eje de las y han de ser tratados demodo algo diferente.

39. ¿Cuáles son los ejes en una distribución de probabilidades?

En las distribuciones de probabilidades, el eje de las x lista una serie de sucesos de interés, y eleje de las y es la probabilidad de que el suceso dicotómico descrito ocurra realmente. Si 30 per-sonas de la muestra de 100 respondieron «sí» a la cuestión de si eran propietarios de una moto-cicleta, ello no significa que la verdadera población deba constar de un 30% de propietarios demotocicletas. La probabilidad de obtener esta respuesta específica depende de lo próxima queesté esta respuesta a la incidencia verdadera de poseer una motocicleta en la población. Si lapoblación tiene realmente una tasa de 30% de propietarios de motocicletas, la probabilidad deque 30 personas de 100 muestreadas sean propietarias de motocicletas es probable que sea rela-tivamente elevada. Debido al error de muestreo, son posibles otros resultados, pero no tan pro-bables. En una distribución de probabilidades, un desenlace en la categoría del eje de las x sería«exactamente 30/100 propietarios de motocicletas», y el valor en el eje de las y sería la probabili-dad de obtener este resultado exacto después de preguntar específicamente a 100 personas.

40. Esto sólo proporciona un caso. ¿De qué modo se puede realizar una

distribución a partir de él?

No se puede. Las distribuciones de probabilidades predicen el desenlace verosímil consideran-do múltiples muestras, más que sólo el caso más probable. Hay que considerar la posibilidadde que otra muestra tuviera un resultado diferente a 30%, dada una incidencia poblacional ver-dadera de 0,3. Hay que preguntarse si se esperaría que otras 100 personas estudiadas contes-taran sí a la cuestión de ser propietario exactamente 30 veces. La respuesta sería «probable-mente no, pero estaría muy próxima», y sería una respuesta correcta.

41. ¿De qué modo la diferencia con respecto al valor poblacional verdadero afecta

a la probabilidad de que se produzca el suceso?

No es sorprendente que cuanto más alejada se halla una muestra del valor poblacional verdade-ro, menos probable es que se obtenga la respuesta (es decir, 34 de 100 en el siguiente intentono nos sorprendería, pero sí lo haría 80 de 100). El punto clave es que no es imposible encon-trar, por azar, 80 propietarios de motocicletas entre 100 personas muestreadas aleatoriamenteen una población en la que la probabilidad básica es de 0,3. Sin embargo, es improbable. Lacuestión se convierte en si se puede predecir la improbabilidad de sucesos que cada vez se ale-jan más de la incidencia base.

42. ¿De qué modo se puede calcular la probabilidad de uno de estos casos

improbables?

Depende del tipo de datos que se emplee. La distribución binomial es una fórmula matemáticaque nos permite calcular las probabilidades de sucesos discretos, mutuamente excluyentes ydicotómicos, como es el caso de los propietarios de motocicletas arriba descrito. Si el desenla-ce de interés es raro, se puede utilizar la distribución de Poisson (también un cálculo matemá-tico). Es una buena aproximación de la distribución binomial y su cálculo es más sencillo. Si se

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES 159

Page 158: Epidemiología y bioestadística secretos   nordness1ed

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES160

tiene interés en determinar la probabilidad de desenlaces continuos, se puede utilizar la distri-bución normal.

43. Ponga un ejemplo de distribución de probabilidades continuas.

La presión sanguínea es una variable continua que, en teoría, puede adoptar cualquier valordesde cero al infinito. Dado que forma parte de un sistema biológico que se halla dinámica-mente regulado, son improbables los valores extremadamente altos y bajos, y existen interva-los normales dentro de los cuales la presión sanguínea tiene mayor probabilidad de encontrar-se. También se determina en una escala continua con infinitas divisiones entre los númerosenteros, de modo que la probabilidad de un valor exacto en la presión sanguínea es cero. Ladistribución de probabilidades en cuanto a los intervalos de la presión sanguínea (y en relacióncon otros muchos parámetros biológicos) puede aproximarse por la distribución gaussiana. La media de la presión sanguínea se encontrará en el centro de la distribución, y la probabili-dad de que se encuentren presiones entre dos valores cualesquiera será proporcional al áreabajo la curva limitada por dichos valores.

44. ¿Qué variables se necesitan para calcular una distribución binomial?

La distribución binomial permite calcular las probabilidades descritas en la pregunta 41 utili-zando las siguientes variables relevantes: 1) número (n) de intentos (es decir, el número deveces que se analiza la presencia o ausencia de un suceso dicotómico; 2) el número de dichosintentos (r) que dan lugar al desenlace cuya probabilidad deseamos computar, y 3) la probabili-dad base (p) del suceso de interés. En nuestro ejemplo, queremos «intentar» con 100 perso-nas, y estamos interesados en el caso en que 80 de los intentos den lugar a un «sí» en la res-puesta, en relación con la pregunta de si son propietarios de motocicletas.

45. ¿De dónde procede la probabilidad base?

Representar con cifras la probabilidad base es un poco más difícil. Si el suceso fuese lanzaruna moneda al aire y el suceso de interés fuera «cara», la probabilidad base sería de 0,5, sinimportar qué sucede cuando se lanza la moneda al aire. En nuestro ejemplo, la probabilidadbase es el verdadero porcentaje de propietarios de motocicletas en la totalidad de la población;para mantenernos en nuestro ejemplo previo, diremos que el 0,3 de la población, y supondre-mos que se hallan distribuidos de modo aleatorio entre los que no tienen motocicleta.

PUNTOS CLAVE: DISTRIBUCIONES DE PROBABILIDADES

1.• Las distribuciones de probabilidades describen la verosimilitud de sucesos o rasgos dicotómicos.

2.• Demuestran cómo la ocurrencia de un fenómeno dicotómico se hace más improbable (perono imposible) cada vez que se aleja de la verdadera incidencia de dicho fenómeno o rasgo en la población.

3.• Tienen una probabilidad media de ocurrencia y una desviación estándar alrededor de dicha media.

4.• Son diferentes para cada combinación de tamaño de muestra y de incidencia poblacional.

46. ¿Cómo se realiza el cálculo de la distribución binomial?

En una muestra aleatoria de 100 personas, existe la posibilidad de que, por puro azar, llegáse-mos a incluir a 80 propietarios de motocicletas. Esta probabilidad se da por la distribuciónbinomial, y se calcula como

Page 159: Epidemiología y bioestadística secretos   nordness1ed

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES 161

n! prqn – r

r!(n – r)!

En nuestro ejemplo actual, n sería 100, r sería 80, y p es 0,3 (q es, precisamente, 1 – p). (Obsérveseque n! se lee como «factorial de n» y es el producto de todos los números enteros desde 1 hasta n.Por ejemplo, 4! se calcula como 1 � 2 � 3 � 4 = 24. Podríamos repetir este cálculo varias vecespara otros valores de r, y representar dichos casos en el eje de las x, con sus correspondientesprobabilidades en el eje de las y. Esto nos daría una distribución binomial de n = 100 y p = 0,3.

La Figura 11-6 muestra parte de estos resultados en relación con esta distribución. La pro-babilidad global de cualquier resultado exacto es baja. Sin embargo, obsérvese que el caso deque 30/100 personas sean propietarios de motocicletas sigue siendo aún la mayor probabili-dad relativa. Dominan las respuestas próximas a 30, y la probabilidad rápidamente cae hastacasi cero a medida que nos vamos separando de 30.

Figura 11-6. Distribución bimodal en relación con la cuestión de ser propietario de una motoci-cleta (n = 100, p = 0,3).

Proporción de los propietarios estipulados

0,100

0,090

0,080

0,070

0,060

0,050

0,040

0,030

0,020

0,010

0,000

p

40/1

00

39/1

00

38/1

00

37/1

00

36/1

00

35/1

00

34/1

00

33/1

00

32/1

00

31/1

00

30/1

00

29/1

00

28/1

00

27/1

00

26/1

00

25/1

00

24/1

00

23/1

00

22/1

00

21/1

00

47. ¿Qué información puede obtenerse a partir de la distribución de probabilidades

así creada?

La distribución binomial muestra lo improbable que es un fenómeno dicotómico a medida quedifiere del desenlace más probable. El propio desenlace más probable es análogo a la media deuna distribución de frecuencias. La dispersión de probabilidades alrededor de esta media essimilarmente análoga a la desviación estándar, y puede calcularse de modo parecido. La fór-mula para la media en una distribución de probabilidades es np, y la desviación estándar es

npq. Calculada la desviación estándar, puede inferirse información a partir de distribucionesbinomiales empleando la distribución normal calculando las puntuaciones zeta, del mismomodo que se hizo con las distribuciones de frecuencias.

Page 160: Epidemiología y bioestadística secretos   nordness1ed

BIBLIOGRAFÍA

1.• Daly LE, Bourke GJ: Interpretation and Uses of Medical Statistics, 5th ed. Oxford, Blackwell Science Ltd., 2000.2.• Kirkwood BR: Essentials of Medical Statistics. Oxford, Blackwell Science Ltd., 1988.3.• Norman GR, Streiner DL: Biostatistics: The Bare Essentials. Toronto, B.C. Decker, 2000.

DISTRIBUCIONES DE FRECUENCIAS Y DE PROBABILIDADES162

PÁGINAS WEB

1.• http://www.sjsu.edu/faculty/gerstman/StatPrimer

2.• http://www.mste.uiuc.edu/hill/dstat.html

3.• http://www.davidmlane.com/hyperstat/index.html

4.• http://www.emedicine.com/emerg/topic758.htm

Page 161: Epidemiología y bioestadística secretos   nordness1ed

163

CA

PÍT

ULO

12

PRESENTACIÓN DE LOS DATOSMark Nordness, MD

1. ¿Cuál es la primera etapa en la presentación de la información?

Primero hay que organizar la información para obtener una comprensión de los tipos y gamas

de datos o resultados que se desea presentar. Clásicamente, se construye una distribución

de frecuencias para ayudar a determinar el mejor modo de presentar la información de

interés. La Tabla 12-1 representa una distribución de frecuencias de las causas de muerte

según los diferentes grupos etarios en Estados Unidos en 1989. Obsérvese que, aunque se

presenta una cantidad de información significativa, con frecuencia es difícil visualizar la forma

de las distribuciones a partir de un marco de referencia particular. Sin embargo, hay modos

de presentar la información a partir de tablas, de modo que el lector pueda apreciar fácilmente

la distribución.

De Centers for Disease Control and Prevention: Principles of Epidemiology, 2.a ed. Atlanta, U.S. Department of Healthand Human Services, Centers for Disease Control and Prevention, Epidemiology Program Office, Public Health Practi-ce Program Office, 1992.

TA B L A 1 2 - 1 . • M U E RT E S P O R E DA D Y C A U S A S S E L E C C I O N A DA S D E M U E RT E .

E S TA D O S U N I D O S . 1 9 8 9

Grupo de edad

(años)

< 1

1-4

5-14

15-24

25-34

35-44

45-54

55-64

65-74

75-84

• 85

No especificado

Todas las edades

Total

39.655

7.292

8.914

36.488

60.524

80.919

118.266

260.058

481.224

599.206

457.358

562

2.150.466

Todas las

demás

37.901

5.651

6.135

21.589

37.466

51.425

75.689

163.333

288.059

323.727

212.181

403

1.223.559

Cardio-

patía

776

281

295

938

3.462

11.782

30.922

81.351

165.787

234.318

203.863

92

733.867

P&I

636

228

122

271

881

1.415

1.707

3.880

10.418

24.022

32.955

15

76.550

MVI

216

1.005

2.266

12.941

10.269

6.302

3.879

3.408

3.465

2.909

877

38

47.575

Diabetes

6

15

32

136

687

1.432

2.784

6.942

13.168

14.160

7.470

1

46.833

VIH

120

112

64

613

7.759

8.563

3.285

1.144

327

70

12

13

22.082

Page 162: Epidemiología y bioestadística secretos   nordness1ed

PRESENTACIÓN DE LOS DATOS164

2. ¿Qué es un histograma?

Un histograma es una representación gráfica de una distribución de frecuencias dada. En un his-

tograma se trazan rectángulos, sus bases representan un intervalo dado y el área del rectángulo

es proporcional al número de valores de frecuencia dentro del intervalo considerado. En un his-

tograma verdadero no hay espacios entre los intervalos dados. No obstante, puede haber espa-

cios entre las barras en el histograma si no hay valores correspondientes a dichos intervalos. En

la práctica, los investigadores suelen presentar histogramas con pequeños espacios entre las

barras para hacer una presentación más clara y placentera al ojo del lector, como se observa en

la Figura 12-1. Nótese que en la Figura 12-1 las barras del histograma pueden indicar diferentes

categorías dentro del intervalo de interés –en este caso, la categoría de exposición en relación

con el número total de casos de infección por el virus de la inmunodeficiencia humana (VIH).

Figura 12-1. Casos de VIH-1 por categoría de exposición en el Reino Unido. (De PHLS Communicable Disease Surveillance Centre, 1994.)

3. ¿Qué anchura debe tener el intervalo en un histograma?

No hay un estándar fijo. El tamaño depende en gran medida del tipo y distribución de los datos. Sin

embargo, los intervalos de clase deben ser de igual valor. Los intervalos de clase en cualquier

extremo del eje x son, con frecuencia, abiertos o con mayor amplitud de intervalo total. En la Figu-

ra 12-1, se observa que la primera barra representa el número de casos de VIH de tipo 1 hasta 1985.

4. ¿Cómo se pueden manejar los datos en los extremos cuando se construye un

histograma?

Como se ha mencionado previamente, la Figura 12-1 ilustra un modo apropiado para manejar

unos pocos valores en los extremos de una distribución. También es aceptable utilizar «menor

que» o «mayor que» para un valor específico en los extremos cuando hay unos pocos valores

en estos intervalos.

5. ¿Cuál es una debilidad de los histogramas?

En los histogramas con frecuencia se pierde la información sobre los extremos de las distribu-

ciones debido al empleo de intervalos abiertos «menor que» o «mayor que» en los extremos.

Núm

ero

de

caso

s

Otros

Madre a hijo

Terapéutico

de

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

3.000

2.500

2.000

1.500

1.000

500

0

Transmisión parenteral (inyección)

Heterosexual

Homosexual

Page 163: Epidemiología y bioestadística secretos   nordness1ed

PRESENTACIÓN DE LOS DATOS 165

6. ¿Qué es un polígono de frecuencias?

Un polígono de frecuencias es un gráfico formado al juntar con líneas rectas los puntos medios

de las partes superiores de las columnas del histograma. Un polígono de frecuencias alisa los

cambios bruscos que pueden producirse en los histogramas, y ayuda a demostrar la continui-

dad de la variable que se está analizando. La Figura 12-2 muestra el método correcto para crear

un polígono de frecuencias.

Figura 12-2. Número de casos notificados de enfermedad seudogripal por semana decomienzo. (De Centers for Disease Control and Prevention. Principles of Epidemiology,2.ª ed. Atlanta, U.S. Department of Health and Human Services, Centers for Disease Controland Prevention, Epidemiology Program Office, Public Health Practice Program Office, 1992.)

Cas

os

15

10

5

0

Primer dato conectadoal punto medio

del intervalo previo en el eje de las x

Último dato conectadoal punto medio

del siguiente intervaloen el eje de las x

Semana de comienzo de la enfermedad

1 2 3 4 5 6 7 8 9

Histograma

Polígonode frecuencias

Se conectan lospuntos medios delos intervalos paraformar un polígono

de frecuencias

7. Indique un uso particularmente bueno de los polígonos de frecuencias.

Los polígonos de frecuencias son particularmente útiles para representar dos o más distribu-

ciones de frecuencias de modo simultáneo. La Figura 12-3 ilustra tres polígonos de frecuencias

que comparan la distribución de los casos de rabia.

8. ¿Qué es un diagrama de barras?

Un diagrama de barras (es decir, un gráfico de barras) es una representación gráfica de datos

discretos. En un eje se representan las diferentes categorías o clasificaciones, y el recuento de

frecuencias se representa en el otro eje. Dado que las categorías son discretas y mutuamente

excluyentes, siempre se debe representar el gráfico de barras con un espacio entre las barras.

Al igual que en el histograma, el área de la barra es proporcional al recuento. La Figura 12-4

presenta un ejemplo de un gráfico de barras.

Page 164: Epidemiología y bioestadística secretos   nordness1ed

PRESENTACIÓN DE LOS DATOS166

9. ¿Qué es un mapa de distribución geográfica?

También conocido como mapa epidemiológico o mapa de casos, este tipo de presentación

muestra información cuantitativa en áreas geográficas definidas. Las áreas pueden estar repre-

sentadas de modo cómodo y significativo; con frecuencia se emplean condados, estados o paí-

ses (Fig. 12-5).

Figura 12-3. Tendencias seculares de la rabia en animales salvajes y domésticos en EstadosUnidos y Puerto Rico, 1955-1993. (De Centers for Disease Control and Prevention: Summaryof notifiable diseases – United States, 1993. MMWR 42[53]:46, 1994.)

TotalDomésticosSalvajes

10.000

9.000

8.000

7.000

6.000

5.000

4.000

3.000

2.000

1.000

0

Cas

os

notif

icad

os

Año1995 1995 1995 1995 1995 1995 1995 1995 1995

Figura 12-4. Sistema de clasificación. (De Gordis L: Epidemiology, 3.ª ed. Philadelphia, Elsevier-Saun-ders, 2004.)

me

ro

DSM-III DSM-IV CIE-10 CLIN CONSDSM-IIIR CIE-9 CAMDEX

546

257

58

393

326

94 92

29,1%

13,7%

3,1%

20,9%

17,3%

5,0% 4,9%

600

500

400

300

200

100

0

Page 165: Epidemiología y bioestadística secretos   nordness1ed

PRESENTACIÓN DE LOS DATOS 167

10. ¿Qué es un diagrama de tallo y hojas?

El diagrama de tallo y hojas, ideado por John Tukey, es un método singular de resumir datos

sin perder los datos individuales. Los tallos en estos diagramas son los dígitos de la izquierda

de los datos numéricos y las hojas son el último dígito a la derecha del tallo. La frecuencia de

cada valor del tallo (que es el número de hojas) se indica en una columna aparte. La tabla 12-2

muestra un ejemplo de diagrama de tallo y hojas en el cuadrante superior izquierdo. Aquí, los

dígitos del tallo representan decenas; así, 3 es igual a 30, 4 es igual a 40, y así sucesivamente.

Las hojas son las unidades de los dígitos de la columna. Por consiguiente, mirando al 7 de la

columna de tallos, las hojas 0 y 7 representan los valores 70 y 77, respectivamente.

11. ¿Por qué un diagrama de tallo y hojas es parecido a un histograma?

Un diagrama de tallo y hojas es esencialmente un histograma, en el que los valores del tallo

representan los intervalos y las hojas representan el recuento de frecuencias en el intervalo.

Obsérvese que es importante representar valores repetidos cada vez que aparecen en la distri-

bución de frecuencias. Por ejemplo, en la tabla 12-2, los dos ceros en el tallo 6 representan un

valor de 60 que se produce dos veces.

12. ¿Qué es un diagrama de cajas y bigotes?

Un diagrama de cajas y bigotes es una representación visual de los datos con una caja hecha al

valor de la mediana, representada por una línea central, con dos divisiones. La altura vertical de

Figura 12-5. Distribución geográfica de los casos de la enfermedad de Lyme en Estados Unidos, 1994. (De Centers for Disease Control and Prevention: Lyme disease – United States, 1994. MMWR 44[24]:459-461, 1995.)

Hawaii 0• 100

10-99

0-9

Conn. 2.030Del. 106D.C. 9Md. 398

Mass. 247N.H. 30N.J. 1.533R.I. 471Vt. 16

Page 166: Epidemiología y bioestadística secretos   nordness1ed

PRESENTACIÓN DE LOS DATOS168

la división inferior representa el primer cuartil (es decir, el percentil 25) y la división superior

representa el tercer cuartil (es decir, el percentil 75). La amplitud de la caja es arbitraria. Se tra-

zan líneas verticales a partir de un valor mínimo hasta la caja inferior y a partir del valor máxi-

mo hasta la caja superior. A la derecha del diagrama de tallo y hojas de la Tabla 12-2 se repre-

senta un diagrama de cajas y bigotes.

13. ¿Qué es un valor externo en el diagrama de cajas y bigotes?

Se define un valor externo ya sea como un valor que es menor que el cuartil inferior menos

1,5 veces el recorrido intercuartil, o un valor mayor que el cuartil superior más 1,5 veces el

recorrido intercuartil.

14. ¿Qué es un valor remoto en un diagrama de cajas y bigotes?

Se define un valor remoto como un valor que es más pequeño que el cuartil inferior menos 3 veces

el recorrido intercuartil o mayor que el cuartil superior más 3 veces el recorrido intercuartil.

15. ¿Cuál es la ventaja del diagrama de cajas y bigotes?

Una gráfica de cajas y bigotes ofrece la posibilidad de mostrar todos los datos como un resu-

men estadístico.

De Jekel JF, Katz DL. Elmore JG: Epidemiology, Biostatistics, and Preventive Medicine, 2.ª ed. Philadelphia, W.B.Saunders, 2001.

TA B L A 1 2 - 2 . D I A G R A M A D E TA L L O Y H O J A S Y G R Á F I C O D E C A J A S

Tallo y hojas

9 0

8 1

7 07

6 0023479

5 234788

4 14677889

3 1

---- � ---- � ---- � ---- �

Multiplicar tallo.hoja por 10** �1

Cuantiles (Percentiles)

100% Max

75% Q3

50% Med

25% Q1

0% Min

Recorrido

Q3-Q1

Modo

Caja gráfica

0

|

|

+-----+

*--+--*

+-----+

|

||

#

1

1

2

7

6

8

1

90

64

57,5

48

31

59

16

47

90

81

77

44

41

31

99%

95%

90%

10%

5%

1%

Page 167: Epidemiología y bioestadística secretos   nordness1ed

PRESENTACIÓN DE LOS DATOS 169

16. ¿Qué es un diagrama en forma de tarta?

Un diagrama en tarta (Fig. 12-6) (también denominado de «quesitos» o gráfico de sectores) es

un método visualmente eficaz y simple de representación de datos. Es un diagrama circular

dividido en sectores, cada uno de los cuales representa la frecuencia de una categoría. El total

de porciones de la tarta debe sumar el 100%. Con frecuencia, los sectores se ordenan por

tamaño, del mayor al menor, en el sentido de las agujas del reloj. Una regla general es no

incluir más de cinco o seis porciones en una gráfica para evitar que se vuelva muy confusa.

También pueden extraerse las porciones pequeñas y representarlas en una subtarta para mos-

trar un mayor detalle, como se muestra en la Figura 12-6.

Figura 12-6. Fuentes de radiación ionizante en el Reino Unido. (De VetterN, Matthews I: Epidemiology and Public Health Medicine. Philadelphia,Churchill Livingstone, 1999.)

Lluvia radiactiva28,6%

Radón49,9% Otros

0,7%Profesional

42,9%Productos

14,3%

Descargas14,3%

Médica14,0%

Gamma14,0%

Interna11,5%

Cosmica10,0%

17. ¿Cuál es la desventaja de los diagramas en tarta?

Puede resultar muy difícil ver la diferencia en los tamaños de las porciones cuando los valores

de los datos son muy similares. Para facilitar en la interpretación, las porciones de las tartas

deben etiquetarse con los valores reales.

PUNTOS CLAVE: PRESENTACIÓN DE LOS DATOS

1.• Los histogramas constituyen un modo eficaz de ilustrar los recuentos de frecuencias de los datoscontinuos divididos en intervalos.

2.• Con frecuencia, en los histogramas se pierde la información en relación con los valores extremos.

3.• Los polígonos de frecuencias se construyen uniendo con una línea conectando los puntos centralesde las barras individuales del histograma.

4.• Los gráficos de barras son útiles para presentar recuentos de datos discretos.

5.• Los gráficos de tallos y hojas resumen los datos sin pérdida de los valores individuales.

6.• Los gráficos de tarta son útiles para mostrar las distribuciones relativas que, en conjunto,representan el 100% del desenlace de interés.

18. ¿Qué es un gráfico de líneas?

Un gráfico de líneas es un método útil para mostrar datos durante un período de tiempo. Con

frecuencia, se representa la tasa de ocurrencia de algún tipo en el eje de las y durante cierto pe -

ríodo de tiempo en el eje de las x. Un aspecto importante en el empleo de un gráfico de líneas

es mostrar un intervalo lo suficientemente ancho en el eje de las x para prevenir una conclusión

incorrecta al ser trazado con respecto a las tendencias en el tiempo. Las Figuras 12-7 y 12-8

Page 168: Epidemiología y bioestadística secretos   nordness1ed

PRESENTACIÓN DE LOS DATOS170

Figura 12-7. Tasas de mortalidad anuales (por 100.000 habitantes) en relación con las principales causas demuerte en varones de edades comprendidas entre 25 y 44 años. (De Gordis L: Epidemiology, 3.ª ed. Philadelphia, Elsevier-Saunders, 2004. Realizada a partir de los datos preparados por Richard M. Selik,MD, Division of HIV/AIDS Prevention, Centers for Disease Control and Prevention, 2003.)

Tasa

de

mo

rtal

idad

po

r 10

0.00

0 ha

bita

ntes

Año1982

70

60

50

40

30

20

10

01983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

Lesión no intencionadaInfección por el VIH

Cardiopatía

Homicidio

HepatopatíaAccidentevascular-cerebral

Diabetes

Cáncer

Suicidio

Figura 12-8. Tasas de mortalidad anuales (por 100.000 habitantes) en relación con las principales cau-sas de muerte en mujeres de edades comprendidas entre 25 y 44 años. (De Gordis L: Epidemiology, 3.a

ed. Philadelphia, Elsevier-Saunders, 2004. Dibujada a partir de los datos preparados por Richard M.Selik, MD, Division of HIV/AIDS Prevention, Centers for Disease Control and Prevention, 2003.)

Tasa

de

mo

rtal

idad

po

r 10

0.00

0 ha

bita

ntes

30

25

20

15

10

5

0

Lesión no intencionada

Cáncer

Cardiopatía

Suicidio

Homicidio

Diabetes

Accidentevascular-cerebralHepatopatía

Año1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

Infección por el VIH

Page 169: Epidemiología y bioestadística secretos   nordness1ed

PRESENTACIÓN DE LOS DATOS 171

muestran un gráfico de líneas que representan las tasas de mortalidad entre hombres y mujeres

con edades comprendidas entre 25 y 44 años en Estados Unidos desde 1982 a 2000.

19. ¿Se pueden utilizar dibujos de caricaturas e imágenes para representar

diferencias en los datos?

Los profesionales de ventas emplean esta técnica con mayor frecuencia que los científicos.

Sin embargo, la posibilidad de interpretación errónea es elevada. Como ejemplo sencillo, exa-

minemos los dos cubos de la Figura 12-9. La longitud de un lado del cubo mayor es, aproxima-

damente, el doble que la longitud del cubo menor. ¿Sería una representación honrada la semi-

lla de un tomate que proporciona un producto dos veces superior al de su competidor? Desde

luego que no; sabemos que, en efecto, el área de un lado del cubo mayor es cuatro veces la del

cubo menor y que el volumen es ocho veces mayor. Siempre hay que sospechar de los datos o

reclamos representados de modo gráfico.

Figura 12-9. Cubos utilizados para representar la producción de semillas de tomate.

PÁGINAS WEB

1.• http://www.acepidemiology.org

2.• http://www.apha.org/public_health/epidemiology.htm

BIBLIOGRAFÍA

1.• Centers for Disease Control: Principles of Epidemiology, 2nd ed. Atlanta, U.S. Department of Health andHuman Services, Centers for Disease Control and Prevention, Epidemiology Program Office, Public HealthPractice Program Office,1992.

2.• Daly LE, Bourke GJ: Interpretation and Uses of Medical Statistics, 5th ed. Oxford, Blackwell Science Ltd.,2000.

3.• Gordis L: Epidemiology, 3rd ed. Philadelphia, W.B. Saunders, 2004.4.• Jekel JF, Katz DL, Elmore JG: Epidemiology, Biostatistics, and Preventive Medicine. Philadelphia, W.B.

Saunders, 2001, pp 20–39.5.• Kirkwood BR: Essentials of Medical Statistics. Oxford, Blackwell Science Ltd., 1988.6.• Last JM (ed): A Dictionary of Epidemiology, 4th ed. Oxford, Oxford University Press, 2001.7.• Rothman KJ, Greenland S (eds): Modern Epidemiology. Philadelphia, Lippincott Williams & Wilkins, 1998,

pp 435–447.8.• Torrence ME: Understanding Epidemiology. St Louis, Mosby, 1997.9.• Vetter N, Matthews I: Epidemiology and Public Health Medicine. Philadelphia, Churchill Livingstone, 1999.

Page 170: Epidemiología y bioestadística secretos   nordness1ed

173

CONTRASTE DE HIPÓTESISNeal Andrew Naito, MD, MPH

1. ¿Qué es someter una hipótesis a prueba?

Someter una hipótesis a prueba (contraste de hipótesis) es un método estadístico que suele

emplearse para establecer una comparación, como entre dos fármacos o entre dos procedi-

mientos. Es un proceso por el cual se determina la importancia estadística del hallazgo de una

investigación al calcular el valor estadístico elegido, que se obtiene a partir de una muestra

poblacional, con el fin de determinar si el valor es igual o mayor al nivel de significación prefija-

do. En caso afirmativo, se dice que el resultado es estadísticamente significativo.

2. ¿De qué modo utilizan los investigadores y los clínicos los resultados de las

pruebas de contraste de hipótesis?

Con el actual interés en la medicina basada en pruebas científicas, es importante que los clíni-

cos comprendan las pruebas de contraste de hipótesis, porque es el punto de partida para

determinar si los resultados de una investigación son potencialmente aplicables desde el

punto de vista clínico. Si se logra una significación estadística, se puede considerar la deci-

sión de si un hallazgo es clínicamente significativo. Un inconveniente de los estudios de

investigación clínicos es que, con frecuencia, las conclusiones no consideran la verdadera

significación clínica y, en cambio, conceden una gran importancia a los hallazgos estadísticos,

principalmente.

3. ¿Cuándo se dice que un resultado es «estadísticamente significativo»?

Como se ha mencionado previamente, un resultado es estadísticamente significativo cuando el

estadístico de prueba (p. ej., t, z o χ2) es mayor o igual que el nivel de significación. Se elige

el estadístico de prueba atendiendo al tipo de datos que se están evaluando. En cambio, el nivel

de significación lo determina previamente el investigador, y no depende de los datos. Por con-

vención, el nivel de significación se denomina α, y suele fijarse en 0,05, aunque en ocasiones

también se utilizan 0,1 y 0,01. Al nivel 0,05, hay 1 probabilidad entre 20 de que se pueda recha-

zar la hipótesis nula, cuando, realmente, es verdadera (es decir, cometo un error de tipo I).

Aunque similar a α, el valor de p difiere sutilmente al representar la probabilidad de que el

estadístico de prueba sea igual o más extremo al realmente calculado, si la hipótesis nula es

cierta. El valor de p difiere de una muestra a la siguiente.

4. ¿Qué es la hipótesis nula?

La hipótesis nula (Ho) representa la hipótesis real sometida a prueba. Es un marco algo artifi-

cial por el que se intenta definir de modo apropiado la pregunta de investigación, con el fin de

utilizar el análisis estadístico apropiado. La premisa básica de la hipótesis nula es que el resul-

tado del estudio no mostrará cambio o diferencia alguna. En investigación clínica, una hipóte-

sis nula típica afirma que no hay diferencia en los resultados del tratamiento entre un fármaco

nuevo y un placebo. Con frecuencia se interpreta erróneamente la hipótesis nula, ya que emitir

una hipótesis que dice que no hay diferencia o cambio va en contra de la intuición del objetivo

real de la investigación.

CA

PÍT

ULO

13

Page 171: Epidemiología y bioestadística secretos   nordness1ed

5. Defina la hipótesis alternativa.

La hipótesis alternativa (HA) es la suposición opuesta a la hipótesis nula. Es la cuestión de

interés real de la investigación, afirmada en una forma particular que puede ser probada de

modo indirecto. En el ejemplo anterior, la hipótesis alternativa afirmaría que hay diferencia en

los desenlaces de tratamiento entre un fármaco nuevo y un placebo.

6. ¿Qué significa el rechazo o la aceptación de la hipótesis nula?

El objetivo de la mayoría de las investigaciones es rechazar la hipótesis nula, de modo que

pueda aceptarse la hipótesis alternativa. La aceptación de la hipótesis nula, por definición, lleva

al rechazo de la hipótesis alternativa. En términos más básicos, si se rechaza la hipótesis nula

es que se observó una diferencia estadísticamente significativa en el estudio.

La aceptación o el rechazo se basan en si el estadístico de prueba es igual o mayor que el

nivel de significación, que se eligió antes de que comenzase el estudio y, por convención, suele

ser 0,05. El nivel de significación es la probabilidad de rechazar una hipótesis nula verdadera o,

en lenguaje directo, encontrar una diferencia estadística donde realmente no existe.

7. ¿En qué difiere la prueba de una cola con respecto a la prueba de dos colas?

Estos términos hacen referencia a si el efecto que se está estudiando puede producirse sólo

en una dirección (p. ej., un aumento, una disminución, una mejoría, un daño) o en cualquier

dirección. Un ejemplo de la prueba de dos colas es la investigación de un nuevo fármaco, que

puede ser de utilidad o perjudicial. En comparación, estudiar los efectos del fumar sobre la

longevidad sería una prueba de una sola cola, ya que no hay datos de que el fumar mejore la

salud a largo plazo.

8. ¿Cuáles son las ventajas y las desventajas de utilizar la prueba de una cola?

La principal ventaja de la prueba de una cola es que, por lo general, se requiere un menor

número de individuos en el estudio para alcanzar cierta potencia, en comparación con la prue-

ba de dos colas. Igualmente, la diferencia observada entre un valor basal y uno hipotético, para

lograr el nivel de significación necesario, es más pequeño con la prueba de una cola que con la

prueba de dos colas.

Una desventaja de la prueba de una cola es la pérdida de la capacidad de probar resultados

no previstos.

9. ¿De qué modo decide un

investigador entre una

prueba de una cola y otra

de dos colas?

La decisión de una estrategia de

la prueba de una cola (Fig. 13-1)

o de dos colas (Fig. 13-2) debe

tomarse al comienzo del desa-

rrollo del diseño de un estudio,

y no se debe cambiar la deci-

sión una vez está en marcha el

proceso de recogida de datos.

Se emplea con mayor frecuen-

cia la prueba de dos colas por-

que los investigadores suelen

necesitar cierta flexibilidad para probar efectos no previstos en la dirección opuesta de lo que

se esperaba.

CONTRASTE DE HIPÓTESIS174

α 0

Figura 13-1. Representación gráfica de una prueba con unacola.

Page 172: Epidemiología y bioestadística secretos   nordness1ed

10. ¿Cuáles son los pasos en

las pruebas de hipótesis?

1.• Desarrollar la hipótesis nula

y la hipótesis alternativa a

partir de la cuestión de

investigación en estudio.

2.• Determinar el estadístico

apropiado (p. ej., t, z, F o χ2)

que se utilizará, a tenor de

los grupos de muestra en

investigación seleccionados.

3.• Seleccionar un nivel de signi-

ficación apropiado (es decir,

α = 0,05) para llevar a cabo

la prueba estadística y determinar el valor del estadístico de la prueba para conseguirlo.

4.• Efectuar el cálculo para determinar el valor del estadístico.

5.• Extraer y afirmar la conclusión: aceptar o rechazar la hipótesis nula.

11. Defina el error de tipo I y α.

Se comete un error de tipo I al no aceptar la hipótesis nula cuando en realidad ésta es verdade-

ra. La probabilidad (p) de cometer un error de tipo I se designa con el símbolo α. El nivel de

significación es el valor en que se fija α en una prueba de hipótesis (por lo general, 0,05). Es un

valor arbitrario elegido como punto límite en el que se considera que el valor de p es significati-

vo o no significativo.

α = p (error de tipo I)

Otro modo de describir el error de tipo I es que el hallazgo se debe al azar.

12. Ponga un ejemplo de un error de tipo I.

Un investigador clínico llega a la conclusión de que una medicación disminuye la presión san-

guínea más que el placebo en un valor que resulta estadísticamente significativo cuando, en

realidad, la medicación no es más efectiva que el placebo.

13. ¿Qué es un error de tipo II y β?

Un error de tipo II es aceptar la hipótesis nula cuando en realidad ésta es falsa. El símbolo β

denota la probabilidad de cometer un error de tipo II

β = p (error de tipo II)

14. ¿Cuál es el término empleado para designar la expresión 1 – β?

Potencia es el término que se aplica a la probabilidad de no aceptar una hipótesis nula falsa,

que es igual a 1 – β.

15. Ponga un ejemplo de error de tipo II.

Un investigador en cardiología lleva a cabo un experimento con animales para determinar si el

músculo cardíaco resulta afectado por un nuevo fármaco, y observa que el efecto no difiere

con respecto al logrado con el placebo. Sin embargo, después de llevar a cabo un estudio pos-

terior con más animales, el investigador observa que el fármaco sí difiere con respecto al pla-

cebo en su efecto sobre el músculo cardíaco.

CONTRASTE DE HIPÓTESIS 175

α/2 α/20

Figura 13-2. Representación gráfica de una prueba con doscolas.

Page 173: Epidemiología y bioestadística secretos   nordness1ed

16. ¿Cuál es la relación entre α y β?

Con el fin de hacer que α y β sean lo más pequeñas posibles, suele fijarse primero α.

Dado que β se relaciona con α de modo inverso, β tiende a tener un valor mayor si se hace α

más pequeña con un tamaño de muestra fijado. En consecuencia, para cualquier valor fijado

de α, unos tamaños de muestra mayores conducen a pruebas estadísticas con mayor potencia

y menores valores de β. (Véase la Tabla 13-1.)

CONTRASTE DE HIPÓTESIS176

PUNTOS CLAVE: DEFINICIONES BÁSICAS

1.• Hipótesis nula: la premisa de que el resultado del estudio no mostrará cambios o diferencias.

2.• Hipótesis alternativa: la suposición opuesta a la hipótesis nula (es decir, el resultado del estudiomostrará cambios o diferencias).

3.• Prueba de una cola: el efecto del estudio puede producirse sólo en una dirección (p. ej., aumento,disminución, mejora, daño).

4.• Prueba de dos colas: el efecto del estudio puede producirse en cualquier dirección (p. ej., el efectopuede ser de utilidad o perjudicial).

5.• Alfa (α): probabilidad de cometer un error de tipo I (es decir, rechazar la hipótesis nula cuando en realidad ésta es verdadera).

6.• Beta (β): probabilidad de cometer un error de tipo II (es decir, aceptar la hipótesis nula cuando en realidad ésta es falsa).

TA B L A 1 3 - 1 . R E L A C I Ó N E N T R E α Y β.

Pruebas de significación Realidad poblacional

Aceptar la HO

No aceptar la HO

HO no es verdadera (HA verdadera)

Decisión incorrecta, error de tipo II

(probabilidad = β)

Decisión correcta (probabilidad =

1 – β = potencia)

HO cierta

Decisión correcta

Decisión incorrecta, error de

tipo I (probabilidad = α)

17. ¿Qué es el valor p?

El valor p es la probabilidad de obtener un resultado igual o más extremo de lo que realmente

se observó, suponiendo la hipótesis nula. Mide la fuerza de los datos sugestivos frente a la

hipótesis nula. Cuanto menor sea el valor de p, más potentes son los datos sugestivos en con-

tra de H0, lo que significa que no es probable rechazar H0 debido al azar solo si el valor de p es

inferior o igual a α. (Véase la Figura 13-3.)

18. Describa algunos de los problemas asociados con el empleo del valor p.

Una de las críticas realizadas al valor p es que éste no transmite información en relación con

el tamaño del efecto observado. Un pequeño efecto en un estudio con un gran tamaño de

muestra puede tener el mismo valor de p que un gran efecto en un estudio con pequeño

tamaño de muestra. Otro problema es que cuantas más variables o criterios de valoración

Page 174: Epidemiología y bioestadística secretos   nordness1ed

existan en un estudio, más pro-

bable es que uno de ellos llegue

a tener significación estadística

sólo por azar, lo que hace que

haya que mostrarse cauto en

relación con la significación clí-

nica de la prueba (recuerde que

un valor de p significa que, por

azar solo, 1 de cada 20 veces se

producirá un suceso o hallaz-

go). De modo similar, es proba-

ble que el análisis repetido por

subgrupos, así como el análisis

repetido de datos durante el

reclutamiento con el cese subsi-

guiente del experimento o estu-

dio cuando se logra la significa-

ción estadística lleve a

conclusiones incorrectas.

19. ¿Qué es la minería de datos (data mining)?

El término minería de datos hace referencia al empleo potencialmente inapropiado de análisis

por subgrupos repetidos en un conjunto de datos hasta que se observa una relación que sea

estadísticamente significativa. Recuerde que, por convención, hay una probabilidad entre 20 de

que un hallazgo sea estadísticamente significativo cuando, en realidad, no lo es (es decir, error

de tipo I). En consecuencia, si se hacen análisis repetidos por subgrupos de un conjunto de

datos, se debe confirmar cualquier hallazgo de significación estadística, si es posible, por un

estudio de investigación propio.

20. ¿Cómo se deben presentar los valores de p?

Otro aspecto importante del valor de p es el modo de presentarlo en los estudios clínicos. Cada

vez es más habitual informar del valor real de p, porque proporciona al revisor del estudio una

mayor sensación del grado de significación estadística. Por ejemplo, si se encuentra un valor

de p de 0,06, es más informativo que presente este resultado en lugar de decir simplemente

que «no se alcanzó la significación estadística».

Si la hipótesis del estudio era biológicamente verosímil, se podría desear investigar aún con

mayor profundidad la hipótesis, antes de decidir que es verdadera. A la inversa, hay que ser

muy cuidadoso al subrayar la importancia de un hallazgo diciendo que el resultado «se aproxi-

ma a la significación estadística» con el mismo p = 0,06.

21. Explique qué es el poder o potencia.

El poder es la probabilidad de no aceptar la hipótesis nula cuando ésta es falsa y la hipótesis

alternativa es verdadera; es decir, encontrar una diferencia significativa cuando realmente exis-

te. Es el complemento de β, y es igual a 1 – β. Difiere de α y β en que no considera la probabili-

dad de cometer un error específico, sino la probabilidad de alcanzar una conclusión correcta

mediante el empleo de una prueba estadística.

22. ¿Por qué es importante el poder o potencia?

Su importancia se relaciona con la estimación, lo más exacta posible, del tamaño de la muestra

necesario para que un estudio alcance una significación estadística. La potencia ayuda a evitar el

CONTRASTE DE HIPÓTESIS 177

α

0

P

Región crítica

Figura 13-3. Representación gráfica de la relación entre αy el valor de p. El área bajo la curva en forma de campanarepresenta la probabilidad de todos los desenlaces que seoriginan a partir de la hipótesis nula. La región crítica es elárea de la cola que abarca los valores del estadístico deprueba (p. ej., z, t, χ2, etc.) que equivale a un valor de p ≤ α.

Page 175: Epidemiología y bioestadística secretos   nordness1ed

problema de unos resultados no concluyentes o negativos cuando, en realidad, se encontraría

una significación estadística si fuese mayor el tamaño de la muestra. Además, es importante

una estimación exacta del número necesario de sujetos en el estudio para efectuar una investi-

gación para calcular un presupuesto económico apropiado para completar la investigación.

23. ¿Cuál es el valor estándar en relación con el poder?

Por convención se fija habitualmente el poder en 0,80 para los análisis de los tamaños mues-

trales. Son deseables valores de potencia más altos cuando financiera y logísticamente sea fac-

tible. Como se ha mencionado previamente, otros factores que se deben considerar para fijar el

tamaño de la muestra incluyen el valor de α (generalmente en 0,05), las direcciones potencia-

les de los efectos de la prueba (es decir, una cola o dos colas), y la magnitud de las tasas de

respuestas que se han de detectar.

Poder = P (no aceptar HO | HO falsa) = P (encontrar la HA verdadera | HA verdadera)

= P (no aceptar HO | HA verdadera)

24. ¿Qué variables afectan al poder?

El poder está afectado por las mismas propiedades que afectan al cálculo de aceptar o rechazar

la HO y la HA (es decir, el cálculo del estadístico de prueba elegido); las variables afectadas

dependen del tipo de datos que se están comparando. La fórmula general para calcular un

estadístico de prueba es la siguiente:

estimación de la muestra – valor de hipótesisestadístico de prueba =

error estándar de la estimación de la muestra

Con el empleo del estadístico z, la fórmula general sería como sigue:

x – μz =

σ/ n

donde x = estimación de la muestra, μ = valor hipotético, y σ/ n = error estándar de x. A partir

de estas fórmulas, es fácil ver que el poder está afectado por el tamaño del efecto analizado

(x – μ), el tamaño de la muestra (n), y la variabilidad (desviación estándar) entre las muestras (σ).

CONTRASTE DE HIPÓTESIS178

PUNTOS CLAVE: VALOR DE p

1.• Definido como la probabilidad de obtener un resultado igual o más extremo del que realmente se observó, suponiendo la hipótesis nula.

2.• El valor de α es fijo, mientras que el valor de p se calcula, y es variable.

3.• Mide la fuerza de los datos sugestivos en contra de la hipótesis nula.

4.• Cuanto menor sea el valor de p, más potencia tienen los datos sugestivos en contra de la hipótesisnula (p. ej., un valor de p de 0,05 significa que 1 de cada 20 veces un suceso o hallazgo se producirá sólo por azar).

5.• Principal desventaja: el valor de p no transmite información sobre el tamaño del efecto observado(es decir, un pequeño efecto en una gran muestra puede tener el mismo valor de p que un granefecto en una pequeña muestra).

6.• Otra desventaja: cuantas más variables o criterios de valoración se prueban en un estudio, mayorprobabilidad hay de que uno de ellos sea estadísticamente significativo sólo por azar.

Page 176: Epidemiología y bioestadística secretos   nordness1ed

25. Ponga un ejemplo de cálculo del poder.

Se encuentra investigando los efectos de una medicación para aumentar las concentraciones

de colesterol de alta densidad (HDL) en mujeres. Le gustaría realizar un cálculo del poder de su

estudio propuesto. Su presupuesto le permite reclutar a 100 participantes para el estudio.

Formula la hipótesis de que los hombres que toman medicación tendrán un HDL superior en

10 puntos a los que no la toman. Los resultados de una investigación previa muestran que los

hombres de su población en estudio tienen, en general, un HDL de 36. Para los fines de este

ejemplo, ha determinado una σ = 30. Decide que un α de 0,05 es aceptable, lo que correspon-

de a un valor z de 1,65.

x – 361,65 = x = 40,95

30/ 100

40,95 – 46z = = –1,653

30/ 100

β = 0,0465

poder = 1 – β = 1 – 0,047 = 0,953

Por tanto, hay una probabilidad del 95% de que una diferencia de 10 puntos en HDL entre las

mujeres que toman la medicación sea detectada por la prueba estadística.

26. ¿Cuál es la diferencia entre «estadísticamente significativo» y «clínicamente

significativo»? ¿Por qué es importante?

Un buen estudio de investigación clínica debe dejar bien clara la relación secuencial, pero

separada, entre la significación estadística y la significación clínica. Un hallazgo de signifi -

cación estadística no debe conducir de modo automático a una conclusión de importancia

clínica. La prueba de hipótesis sólo valora de modo indirecto la verdad basal de un hallazgo

al limitar el número de veces que se alcanza una conclusión errónea. La verosimilitud bioló -

gica, el tamaño del efecto, la aplicabilidad a la población de pacientes y el coste son algunos

de los factores que hay que considerar al determinar si un hallazgo estadísticamente signifi -

cativo (es decir, resultado positivo) es también relevante desde un punto de vista clínico.

Por ejemplo, en los estudios sobre fármacos relacionados con los tratamientos frente al

cáncer, con frecuencia se detecta una diferencia estadísticamente significativa en la super -

vivencia durante varios meses con la medicación del experimento en comparación con el pla-

cebo. Sin embargo, es preciso tener en consideración los factores mencionados previamente

antes de concluir que el beneficio con el empleo del nuevo medicamento sea clínicamente

significativo.

27. ¿Cuáles son las implicaciones de los hallazgos del estudio que «no son

estadísticamente significativos»? ¿Significa que los resultados negativos

«tampoco son clínicamente significativos»?

Lo opuesto es también cierto cuando se observa que la diferencia entre dos poblaciones en

estudio no es estadísticamente significativa, aunque sea biológicamente verosímil. En este

caso, al igual que en otros muchos estudios descritos en la literatura médica, el estudio tuvo

probablemente un poder insuficiente, como consecuencia de un pequeño tamaño muestral.

Algunos consideran que no llegar a realizar un análisis del poder adecuado carece de ética, ya

que los sujetos de la investigación quedan expuestos innecesariamente a intervenciones. Si la

hipótesis del estudio es biológicamente verosímil, se podría desear investigar la hipótesis con

mayor detalle antes de decidir si ésta es cierta. A la inversa, hay que tener cuidado al subrayar

CONTRASTE DE HIPÓTESIS 179

Page 177: Epidemiología y bioestadística secretos   nordness1ed

la importancia de un hallazgo diciendo que el resultado se «aproxima a la significación estadís-

tica» con el mismo p = 0,06.

28. ¿Qué es un metaanálisis? ¿De qué modo es útil?

Un metaanálisis es una técnica de investigación por la que se puede realizar un cribado de dife-

rentes estudios, más pequeños, en busca de su compatibilidad, y luego combinarlos emplean-

do criterios estandarizados para crear así un mayor tamaño de muestra, lo que se traduce en

una mayor potencia. Este mayor poder permite realizar una estimación más exacta de la signifi-

cación estadística del efecto de la intervención. No obstante, un metaanálisis no es un sustituto

de estudios clínicos grandes, aleatorios y controlados. Existen numerosos ejemplos en la lite-

ratura médica en los que los hallazgos difirieron entre dos tipos de estudio que investigaban un

mismo problema.

29. ¿Cuándo están justificados los estudios con poder bajo?

Los estudios con poder bajo pueden estar probablemente justificados en dos marcos: 1) en la

investigación de una enfermedad rara, y 2) en la realización de estudios piloto sobre nuevos

fármacos o tratamientos. Por su propia naturaleza, las poblaciones de pacientes con enferme-

dades raras son pequeñas, y puede no ser posible conseguir suficientes sujetos para llevar a

cabo un estudio clínico y lograr una significación clínica a tenor de los cálculos preliminares

sobre el poder. En consecuencia, al llevar a cabo un estudio así, la descripción se convierte en

importante. Es preferible el empleo de intervalos de confianza al empleo de los valores de p,porque permiten la interpretación de un posible tamaño del efecto aun cuando no se logre la

significación estadística (posteriormente se explicará este aspecto con mayor detalle en este

mismo capítulo). En cuanto a los estudios piloto, los aspectos básicos son el coste y la seguri-

dad, en los que el número de sujetos sometidos a investigación es intencionadamente más

pequeño que en un estudio clínico habitual. Este planteamiento limita el coste del estudio, si se

demuestra que un nuevo fármaco o tratamiento es ineficaz, y también minimiza el daño, en tér-

minos del número de participantes en el estudio expuestos, si existe un efecto secundario.

30. ¿Qué es el error estándar (SE)?

Una medida de la dispersión de las medias de los datos de la muestra. Se calcula como la des-

viación estándar (SD) de una población de medias de muestras, dividida por la raíz cuadrada

del tamaño de la muestra (N).

SDSE =

N

En contraste, la SD es una medida de la dispersión de los datos atendiendo a observaciones

individuales. La importancia de la SE radica en su empleo al calcular los intervalos de confianza.

31. ¿Qué medida de variación estadística suele ser la mejor para informar datos:

la desviación estándar o el error estándar?

Al presentar los datos, con frecuencia se emplean la media y la desviación estándar o la media

y el error estándar. Sin embargo, se recomienda el empleo de la desviación estándar en lugar

del error estándar. El empleo del error estándar puede ser desventajoso porque se basa en el

tamaño de la muestra y puede ser variado sencillamente manipulando N, y también porque se

basa en medias y no en observaciones individuales. Este último problema se observa mejor en

los artículos de revistas, en los que el empleo de la media del intervalo ± 2 SE para presentar

los resultados se interpreta con frecuencia de modo erróneo como comprendiendo el 95% de

todos los resultados de los datos individuales implicados en un estudio.

CONTRASTE DE HIPÓTESIS180

Page 178: Epidemiología y bioestadística secretos   nordness1ed

32. ¿Qué es un intervalo de confianza?

Un intervalo de confianza es un recorrido de valores probables definidos por unos límites supe-

rior e inferior (es decir, límites de confianza) en cuyo interior se encuentra probablemente el

valor verdadero de un parámetro poblacional desconocido, a tenor del intervalo de confianza

prefijado. La expresión general del intervalo de confianza es:

Intervalo de confianza = estimación puntual ± (multiplicador de confianza � SE)

En relación con los intervalos de confianza del 90, 95 y 99%, el multiplicador es 1,645, 1,96 y

2,576, respectivamente. Se emplea el término confianza en lugar de probabilidad porque el ver-

dadero valor del parámetro poblacional o bien cae dentro del intervalo o no se elimina. Así, en

términos prácticos, un intervalo de confianza del 95% para un parámetro dado (por ejemplo, la

media poblacional, μ) implica que el 95% de los intervalos construidos de modo similar con-

tendrán la μ.

33. ¿Cuáles son las ventajas del empleo de los intervalos de confianza frente a los

valores de p?

Muchas revistas médicas requieren en la actualidad el empleo de intervalos de confianza, por-

que proporcionan más información que el valor de p para determinar los resultados positivos y

negativos. Por ejemplo, en lugar de indicar que la diferencia en el control de la presión sanguí-

nea por el fármaco A frente al fármaco B es estadísticamente significativa, es más útil informar

los intervalos de confianza de cada fármaco, de modo que se pueda observar el tamaño del

efecto (es decir, la cantidad en que pueden diferir entre sí los fármacos). A la inversa, si los

hallazgos no son estadísticamente significativos, los intervalos de confianza pueden proporcio-

nar una indicación sobre si hay potencial de significación clínica en caso de proseguir con

estudios posteriores, lo que generalmente sucede cuando se requiere un mayor tamaño mues-

tral. Cuando se emplea la misma población para análisis, las inferencias extraídas a partir de

los intervalos de confianza y de las pruebas de hipótesis son compatibles.

34. ¿De qué modo puede afectarse la amplitud (es decir, precisión) de un intervalo

de confianza?

■ Elegir un intervalo de confianza menor.■ Reducir la desviación estándar con el empleo de una técnica de muestreo diferente, como el

muestreo estratificado.■ Obtener muestras de mayor tamaño para aumentar n.

El ajuste de cualquiera de estos factores, ya sea uno solo o juntos, puede disminuir la ampli-

tud del intervalo de confianza.

CONTRASTE DE HIPÓTESIS 181

PÁGINAS WEB

1.• http://www.apha.org/public_health/epidemiology.htm

2.• http://www.amstat.org/sections/epi/SIE_Home.htm

BIBLIOGRAFÍA

1.• Browner WS, Newman TB, Cummings SR, et al: Getting ready to estimate sample size: Hypothesis andunderlying principles. In Hulley SB, Cummings SR (eds): Designing Clinical Research: An EpidemiologicApproach. Baltimore, Williams & Wilkins, 1988, pp 128–150, 232–236.

Page 179: Epidemiología y bioestadística secretos   nordness1ed

2.• Colton T: Statistics in Medicine. Boston, Little, Brown & Company, 1974, pp 99–150.3.• Daly LE: Confidence limits made easy: Interval estimation using a substitution method. Am J Epidemiol

147(8):783–790, 1998.4.• Dawson B, Trapp RG: Basic and Clinical Biostatistics, 3rd ed. New York, Lange, 2001, pp 63–135.5.• Goodman SN: Toward evidence-based medical statistics. 1: The P-value fallacy. Ann Intern Med

130:995–1004, 1999.6.• Guyatt G, Jaeschke R, Heddle N, et al: Basic statistics for clinicians: 2. Interpreting study results: Confidence

intervals. Can Med Assoc J 152(2):169–173, 1995.7.• Halpern SD, Karlawish JH, Berlin JA: The continuing unethical conduct of underpowered clinical trials. JAMA

288(3):358–36, 2002.8.• Knapp RG, Miller MC: Clinical Epidemiology and Biostatistics. Baltimore, Williams & Wilkins, 1992,

pp 167–208.

CONTRASTE DE HIPÓTESIS182

Page 180: Epidemiología y bioestadística secretos   nordness1ed

183

PROBABILIDAD Y MUESTREOJonathan M. Lieske, MD, MPH

PROBABILIDAD

1. ¿Qué es la probabilidad?

La probabilidad es la cuantificación de la verosimilitud, o frecuencia relativa, de que se pro-

duzca un suceso dado o un conjunto de sucesos, durante una secuencia de intentos aleato-

rios ilimitados realizados en condiciones similares. La probabilidad compara el número de

sucesos deseables (A) con el número total de intentos durante los que se puede producir el

suceso (N).

2. ¿Cómo se calcula la probabilidad?

La ecuación estándar para el cálculo de la probabilidad es P(suceso) = A/N, en la que P(suce-

so) es la probabilidad de que se produzca el suceso estudiado, A es el número de veces que se

produce realmente el suceso deseado, y N es el número total de intentos en que puede produ-

cirse A. La probabilidad de que se produzca A se expresa como porcentaje, que nunca es supe-

rior a 1 (100%) ni inferior a 0 (0%).

3. Un médico de familia ha seguido durante 20 años a 1.000 pacientes

diagnosticados de la enfermedad Y. Atendiendo a esta muestra (Tabla 14-1),

¿cuál es la probabilidad de que un paciente seleccionado aleatoriamente con

la enfermedad Y sea un varón de cualquier edad? ¿Un paciente de edad

avanzada de cualquier sexo? ¿Un varón de edad avanzada?

Mediante la Tabla 14-1 puede determinarse fácilmente la probabilidad de elegir aleatoriamente

a un paciente con cualquiera de las características seleccionadas simplemente identificando la

entrada correcta en la hoja de cálculo y dividiendo por el denominador apropiado. A partir de la

tabla se observa:■ P (varones) = 350/1.000 = 0,35.■ P (de edad avanzada) = 600/1.000 = 0,6.■ P (varón, de edad avanzada) = 200/1.000 = 0,2.

CAPÍ

TULO

14

TA B L A 1 4 - 1 . D I S T R I B U C I Ó N D E M O G R Á F I C A D E L O S PA C I E N T E S C O N L A E N F E R M E DA D Y

Edad

Jóvenes

Edad avanzada

Total

Total

400

600

1.000

Mujeres

250

400

650

Hombres

150

200

350

Page 181: Epidemiología y bioestadística secretos   nordness1ed

4. Describa la diferencia entre probabilidad y posibilidad.

La posibilidad (oportunidad o ventaja) también es una medida de la verosimilitud de que se

produzca un suceso; sin embargo, la posibilidad es un cociente entre la probabilidad de que

se produzca un suceso y la probabilidad de que no se produzca dicho suceso:

Posibilidad = (probabilidad de que se dé un suceso/probabilidad de que no se dé dicho suceso)

5. Cuando se tira un dado sin irregularidades, ¿cuál es la probabilidad de sacar

un 1?

Dado que hay seis lados en el dado y sólo uno de ellos tiene el número 1, hay seis posibles

desenlaces (1, 2, 3, 4, 5 y 6), uno de los cuales (1) es el suceso deseado. Los otros cinco desen-

laces potenciales (2, 3, 4, 5 y 6) se consideran sucesos indeseables. La probabilidad de sacar un

1 = número de sucesos deseables dividido por el número de sucesos posibles = 1/6 = 16,67%.

6. ¿Cuál es la posibilidad de obtener un 1?

La posibilidad de obtener un 1 es la probabilidad del suceso deseable (es decir, un 1) dividido

por la probabilidad del suceso no deseables (es decir, cualquiera de las otras caras del dado).

En este caso,

Posibilidad = (probabilidad de obtener un 1)/(probabilidad de no obtener un 1)

= (1/6)/(5/6) = 1/5 = 0,2 (20%)

7. Si se conoce la probabilidad de que se produzca un suceso dado, ¿cómo se

calcula la posibilidad?

La probabilidad puede convertirse fácilmente en posibilidad por medio de la siguiente ecuación:

Posibilidad = probabilidad/(1 – probabilidad).

Considere el ejemplo de lanzar una moneda al aire y de sacar «cara». Suponiendo que lanza

una moneda sin irregularidades, la probabilidad de que el resultado sea cara = probabilidad de

caras = – = 0,5. Al calcular la posibilidad de obtener una cara, la ecuación da:

Posibilidad = 0,5/(1 – 0,5) = 0,5/0,5 = 1

La ecuación tiene un sentido intuitivo porque la probabilidad de obtener cara (ocurrencia) es

igual a la probabilidad de no obtener cara, o sea, cruz (no ocurrencia), lo que hace que el

cociente sea 1. Por consiguiente, cuando la posibilidad es 1, hay una igual oportunidad de ocu-

rrencia que de no ocurrencia.

8. A la inversa, si se conoce la posibilidad de que se produzca un suceso, ¿cómo

se puede calcular la probabilidad?

La posibilidad se puede convertir fácilmente en probabilidad utilizando la siguiente ecuación:

Probabilidad = posibilidad/(1 + posibilidad)

Si utilizamos números a partir del ejemplo previo de sacar un 1 en el lanzamiento de un dado:

Probabilidad = 0,2/(1 + 0,2) = 0,1667

9. Defina la probabilidad conjunta.

La probabilidad conjunta es la probabilidad de que dos sucesos se den simultáneamente. La

probabilidad conjunta de que los sucesos A y B se den simultáneamene se anota como P(A, B).

Esta anotación se empleó en la pregunta 3 cuando se consideraba la probabilidad de que una

PROBABILIDAD Y MUESTREO184

Page 182: Epidemiología y bioestadística secretos   nordness1ed

persona diagnosticada de la enfermedad Y sea varón y tenga una edad avanzada: P(varón, edad

avanzada).

10. ¿Qué es la probabilidad marginal?

La probabilidad marginal es la probabilidad de que ocurra un suceso único, sin consideración

de cualquier otro suceso.

11. En lo que hace referencia a la probabilidad, ¿qué significan sucesos

independientes?

Al considerar la probabilidad de que se produzcan múltiples sucesos, la probabilidad de ocu-

rrencia de un suceso no se ve influida por el desenlace de un suceso anterior si los dos suce-

sos son independientes. Dos sucesos A y B son, por tanto, independientes si la ocurrencia de A

no tiene efecto sobre la ocurrencia del otro suceso, B.

12. Ponga un ejemplo del concepto de sucesos independientes.

Lanzar una moneda al aire es un buen ejemplo para explicar el concepto. De nuevo, si supone-

mos que tenemos una moneda sin irregularidades, los resultados de todos los lanzamientos

previos no significan nada para determinar la probabilidad de obtener «cara», que es 0,5 o

50%. Si se hubieran obtenido consecutivamente 5 caras (o 500) antes del lanzamiento de

interés, la probabilidad de obtener cara en el próximo lanzamiento quedaría inalterada.

13. ¿Qué es una probabilidad condicionada?

Una probabilidad condicionada es la probabilidad de que se produzca un suceso (A), dado que

se ha producido un segundo suceso (B). La probabilidad condicionada de que ocurra A, dado

B, se escribe P(A B) y se lee como «probabilidad de A dado B». La ecuación para determinar

la probabilidad condicionada es la siguiente:

P(A B) = (número de veces que A y B se dan conjuntamente)/

(número de veces que se produce B)

14. Si los sucesos A y B son independientes, ¿de qué modo se ve afectada

la probabilidad condicionada?

Si los sucesos A y B son independientes, la ecuación de la pregunta 13 se reduce a P(A B) =

P(A). De nuevo tiene un sentido intuitivo, porque el hecho de que B haya ocurrido no guarda

relación con la ocurrencia de A al considerar dos sucesos independientes.

15. Utilizando la hoja de cálculo de la Tabla 14-1, ¿cuál es la probabilidad de que

un paciente diagnosticado de enfermedad Y sea mujer, dado que la paciente

es de edad avanzada [P(mujer edad avanzada)]?

Es este un ejemplo de probabilidad condicionada. Utilizando la Tabla 14-1, se puede apreciar

fácilmente que nos interesa realmente la subpoblación de pacientes de edad avanzada porque

la probabilidad de que sea mujer se basa en que la paciente tenga una edad avanzada.

Hay un total de 400 mujeres de edad avanzada de un total de 600 pacientes de edad avanza-

da. Aquí, P(mujer edad avanzada) = (número de veces en que ser mujer y tener una edad

avanzada se dan conjuntamente)/(número de veces que se da tener una edad avanzada):

P(mujer edad avanzada) = 400/600 = 0,67

16. Un jugador necesita sacar dos cartas del mismo palo con el fin de ganar un

juego de cartas. Dado que la primera carta que saca es una espada y no se

PROBABILIDAD Y MUESTREO 185

Page 183: Epidemiología y bioestadística secretos   nordness1ed

reemplaza en la baraja después de haber sido extraída, ¿cuál es la

probabilidad de que el jugador saque una segunda espada?

Es este, de nuevo, un ejemplo de probabilidad condicionada. Dado que la baraja consta de

52 cartas con 13 cartas de cada palo, si el jugador saca primero una espada, hay ahora sólo

12 espadas restantes en la baraja. Por consiguiente, la probabilidad condicionada de sacar una

segunda espada, dada su primera extracción, puede anotarse del siguiente modo:

P(sacar una segunda espada espada inicial) = 12/51 = 0,235

17. ¿Cuál es la probabilidad de sacar una espada de una baraja de cartas después

de haber sacado una espada de la baraja y haber restituido la carta?

Estos dos sucesos son independientes, y la extracción de la primera espada no tiene efecto

sobre la segunda extracción. Por consiguiente, la probabilidad en cuestión es la misma que la

de, simplemente, sacar una espada de una baraja de cartas = 13/52 = 0,25.

18. Describa la relación entre probabilidad condicionada y riesgo relativo.

Consideremos que B es el desenlace de interés, y A un factor de riesgo potencial para el desen-

lace B.

El riesgo relativo de B dado A se define por la siguiente ecuación:

Riesgo relativo = [P(B A]/[P(B A–]

donde P(B A) es la probabilidad del suceso B, dado que el suceso A ocurre, y P(B A–) es la

probabilidad del suceso B, dado que A no ocurre. Si los dos sucesos son independientes, el

riesgo relativo es 1, que indica que A no es realmente un factor de riesgo de B. Sin embargo,

cuanto mayor sea el efecto de A sobre B, más distante se encontrará el riesgo relativo de 1.

19. Considere un ejemplo clínico utilizando datos ficticios de una muestra de

pacientes que han tenido una prueba positiva de sangre oculta en heces

(Hemoccult).

Cuando se llevan a cabo unas pruebas seriadas Hemoccult para efectuar un cribado de cáncer

de colon, la probabilidad de cáncer (suceso B) si una nueva prueba Hemoccult es positiva

(suceso A) es 0,143. De modo alternativo, la probabilidad de cáncer en un paciente con una

nueva prueba Hemoccult negativa (no sucede el suceso A) es 0,01. Por consiguiente, el riesgo

relativo de cáncer en los pacientes que tienen una segunda prueba Hemoccult positiva en com-

paración con los que tienen una segunda prueba Hemoccult negativa puede calcularse del

siguiente modo:

Riesgo relativo = [P(B A]/[P(B A–] = 0,143/0,01 = 14,3

Este resultado es significativamente mayor que 1, lo que demuestra que existe dependencia

entre los sucesos A y B, y apoya el empleo de la prueba Hemoccult seriada para el cribado del

cáncer de colon.

20. ¿Qué es una exclusividad mutua?

El concepto de exclusividad mutua afirma que dos sucesos (A y B) son mutuamente excluyen-

tes si no pueden producirse simultáneamente. La probabilidad de que dos sucesos mutuamen-

te excluyentes (A y B) se produzcan al mismo tiempo es 0. Por ejemplo, lanzar una moneda al

aire y obtener tanto «cara» como «cruz» al mismo tiempo es imposible. Por ello, la probabili-

dad de que se produzca este fenómeno es 0. Por consiguiente, la «cara» y la «cruz»

simultáneamente son sucesos mutuamente excluyentes.

PROBABILIDAD Y MUESTREO186

Page 184: Epidemiología y bioestadística secretos   nordness1ed

21. ¿Qué es un diagrama de Venn?

¿De qué modo se pueden ilustrar

en el formato de Venn dos sucesos

mutuamente excluyentes (A y B)?

En el diagrama de Venn, los sucesos se

representan como figuras geométricas

simples, con áreas superpuestas de los

sucesos representados por intersecciones

y uniones de las figuras. Dos sucesos

mutuamente excluyentes (A y B) se representan en el diagrama de Venn por dos áreas sin

intersección. Como puede verse en la Figura 14-1, los sucesos A y B son mutuamente exclu-

yentes porque no hay superposición. La probabilidad de que se produzcan simultáneamente

es, por consiguiente, igual a cero.

22. ¿Cómo se representa la intersección de dos sucesos mutuamente

excluyentes en anotación matemática?

P(A y B) o P(A ∩ B) = 0

P(A ∩ B) es el suceso de que tanto A como B se den simultáneamente, y se lee como la «inter-

sección de los sucesos A y B».

23. ¿Qué aspecto tiene el diagrama de Venn

si los sucesos no son mutuamente exclu-

yentes?

Si los dos sucesos A y B no son mutuamente exclu-

yentes, los círculos del diagrama de Venn presentan

intersección en algún punto (véase la Figura 14-2).

El área de intersección se representa por la ecuación

P(A y B) = P(A y B simultáneamente) o P(A ∩ B) > 0.

24. ¿Cuál es la regla multiplicativa (es decir,

de producto)?

Se aplica la regla multiplicativa cuando se calcula la probabilidad de que, por lo menos, se den

simultáneamente dos sucesos independientes. La regla multiplicativa afirma lo siguiente:

P(A y B) = P(A) � P(B)

donde P(A y B) representa la probabilidad de que tanto A como B se den simultáneamente, y

P(A) y P(B) representan las probabilidades independientes de A y B, respectivamente.

Si A y B son sucesos independientes, se aplica entonces la siguiente ecuación:

P(A y B) o P(A � B) = P(A) � P(B)

25. ¿Cuál es la probabilidad de sacar dos cincos sucesivos en una tirada con un

único dado sin irregularidades?

Aquí hay la oportunidad de utilizar la regla del producto. Se ha establecido que dos tiradas

sucesivas de un dado son sucesos independientes, y se sabe que podemos esperar un 5 de

cada seis veces, de promedio. Dado que A (la primera tirada) y B (la segunda tirada) son suce-

sos independientes, P(A y B) o P(A ∩ B) = P(A) � P(B).

P(tirada de dos cincos) = P (tirada de 5) � (tirada de 5)

= 1/6 � 1/6

PROBABILIDAD Y MUESTREO 187

Figura 14-1. Diagrama de Venn representativo de dos sucesos mutuamente excluyentes (A y B).

Figura 14-2. Diagrama de Venn dedos sucesos (A y B) no mutuamenteexcluyentes.

Page 185: Epidemiología y bioestadística secretos   nordness1ed

= 1/36

= 0,028

26. ¿Puede utilizarse la regla multiplicativa para determinar la probabilidad de que

se produzcan más de dos sucesos?

Sí. Con tal de que los sucesos sean verdaderamente independientes, no hay límite en el núme-

ro de sucesos que pueden considerarse.

27. De acuerdo con un estudio nacional, el 63% de los estadounidenses que votan

prefieren al candidato A. Si se eligen al azar a tres votantes en Estados

Unidos, ¿cuál es la probabilidad de que los tres prefieran al candidato A?

En relación con sucesos múltiples (A1, A2, A3, ...Ax), si A1, A2, A3, ...Ax son mutuamente inde-

pendientes, entonces (PA1 y A2 y A3 y, ...Ax) = P(A1) � P(A2) � P(A3) ... � P(Ax). Por tanto, la

probabilidad de que los tres prefieran al candidato A es:

= P(A) � P(A) � P(A)

= 0,63 � 0,63 � 0,63

= 0,25

28. Suponga que le dan sólo las probabilidades de ser varón (0,35) y tener una

edad avanzada (0,60) a partir de los resultados de la pregunta 3. Utilizando

estas cifras, ¿cuál es la probabilidad de que el paciente diagnosticado de

enfermedad Y sea varón y tenga una edad avanzada [P (varón, edad avanza-

da)], suponiendo que ser varón y tener una edad avanzada sean mutuamente

independientes?

P(varón y edad avanzada) = P(varón) � P(edad avanzada)

= 350/1.000 � 600/1.000

= 0,21

29. En la pregunta anterior, ¿es correcto suponer que ser varón y tener una edad

avanzada son sucesos independientes?

Probablemente no, pero si le dan sólo las probabilidades marginales de cada uno de los dos

sucesos, no hay modo de estar seguros. Atención: algunos falsos reclamos estadísticos tratan

con frecuencia los sucesos de modo independiente cuando, en realidad, no lo son.

30. ¿De qué modo, pues, se calcula la probabilidad de que ambos sucesos se den

simultáneamente cuando los dos sucesos no son independientes?

Cuando los sucesos no son independientes, se puede utilizar una forma especial de regla mul-

tiplicativa que toma en consideración la ausencia de independencia:

P(A y B) = P(A B)P(B)

La probabilidad condicionada de A dada B se multiplica por la probabilidad marginal de B. Es

importante y útil saber que esta regla se escribe también así:

P(A y B) = P(B A)P(A)

31. Ahora, suponiendo que ser varón y tener una edad avanzada no son sucesos

independientes y que disponemos de los datos, ¿cómo podemos calcular la

PROBABILIDAD Y MUESTREO188

Page 186: Epidemiología y bioestadística secretos   nordness1ed

probabilidad de que un paciente diagnosticado de la enfermedad Y sea varón

y tenga una edad avanzada [P(varón, edad avanzada)]?

Primero, hay que consultar la Tabla 14-1 en busca de los datos apropiados relacionados con

los pacientes de edad avanzada y varones, y poner las cifras apropiadas:

P(A y B) = P(A B)P(B)

P(varón, edad avanzada) = P(varón edad avanzada)P(edad avanzada)

= (200/600) � (0,6)

= 0,33 � 0,6

= 0,20

32. Demuestre que P(A y B) = P(A B)P(B) = P(B A)P(A)

Utilizando los mismos datos, observamos que

P(varón, edad avanzada) = P(edad avanzada varón)P(varón)

= (200/350) � (350/100)

= 0,571 � 0,35

= 0,20

33. Atendiendo al ejemplo anterior, ¿son independientes los sucesos de ser varón

y tener una edad avanzada?

No. Cuando se hizo la suposición de independencia, la probabilidad de ser varón y tener una

edad avanzada era 0,21, pero al emplear los datos reales, la probabilidad fue realmente 0,20.

Aunque desiguales, estos resultados muestran que la suposición de independencia era realmen-

te razonable para un cálculo aproximado en relación con este conjunto de datos particular.

La probabilidad condicionada de tener una edad avanzada dado el hecho de ser varón era 0,57,

no muy lejos de la probabilidad marginal de tener una edad avanzada en la población como tota-

lidad (0,6). Sin embargo, no se debe extrapolar este ejemplo como generalidad. Con frecuencia,

realizar de modo incorrecto la suposición de independencia da resultados en extremo erróneos.

34. ¿Qué es la regla aditiva?

La regla aditiva se emplea para calcular la probabili-

dad de que suceda por lo menos uno de dos suce-

sos. La regla aditiva afirma que P(A o B) = P(A) +

P(B) – P(A y B). Se ilustra esta regla en el diagrama

de Venn de la Figura 14-3. En relación con sucesos

mutuamente excluyentes (véase la Figura 14-1), esta

ecuación se reduce a P(A o B) = P(A) + P(B), por-

que, por definición, P(A y B) = 0 para que se produz-

ca la exclusividad mutua.

PROBABILIDAD Y MUESTREO 189

PUNTOS CLAVE: PROBABILIDAD

1.• La probabilidad cuantifica la verosimilitud de que se produzca el suceso A en tentativas ilimitadas.

2.• La ecuación estándar para la probabilidad es P(suceso) = A/N.

3.• La regla aditiva afirma que P(A o B) = P(A) � P(B) – P(A y B).

4.• La regla multiplicativa para sucesos independientes afirma que P(A y B) = P(A) � P(B).

5.• Si dos sucesos no son independientes, puede emplearse una forma especial de regla multiplicativa,

como sigue: P(A y B) = P(A B)P(B) = P(B A)P(A).

Figura 14-3. Diagrama de Venn de laregla aditiva de dos sucesos (A y B)no mutuamente excluyentes.

Page 187: Epidemiología y bioestadística secretos   nordness1ed

35. Utilizando la hoja de cálculo de la Tabla 14-1, ¿cuál es la probabilidad de que

un paciente diagnosticado de enfermedad Y sea mujer o tenga una

edad avanzada?

Agrupar el sexo y la edad avanzada no son mutuamente excluyentes; por consiguiente, emplean-

do la regla aditiva, la ecuación P(A o B) = P(A) + P(B) – P(A y B) se aplica como sigue:

P(mujer o edad avanzada) = P(mujer) + P(edad avanzada) – P(mujer y edad avanzada)

= 650/1.000 + 600/1.000 – 400/1.000

= 0,85

36. Todo esto es muy confuso. ¿Hay algún método algorítmico para plantearse la

probabilidad de más de un suceso?

Véase la Figura 14-4.

PROBABILIDAD Y MUESTREO190

Figura 14-4. Método algorítmico sobre la probabilidad de más de un suceso.

¿Son mutuamente excluyentes A y B?

¿Son independientes A y B?

Afirmativo

P(A y B) = 0

P(A o B) = P(A) + P(B)

Negativo

P(A y B) > 0

P(A o B) = P(A) + P(B) – P(A y B)

Afirmativo

P(A B) = P(A)

P(A y B) = P(A) P(B)

Negativo

P(A B) = P(A y B)/P(B)

P(A y B) = P(A B) P(B)

MUESTREO

37. ¿Qué es un muestreo?

El muestreo es la técnica utilizada por los investigadores para recoger determinaciones a partir

de una población de muestra, con el objetivo de establecer inferencias sobre la población diana

global.

38. ¿Por qué se lleva a cabo un muestreo?

Debido a las limitaciones económicas y logísticas, con frecuencia es difícil e incluso destructi-

vo (dependiendo del tipo de cuestión en investigación) recoger determinaciones de una pobla-

ción diana entera, lo que fuerza a los investigadores a recoger datos de un pequeño segmento

de una población para extrapolarlos a la población diana. Sin embargo, cuando efectuamos

Page 188: Epidemiología y bioestadística secretos   nordness1ed

generalizaciones a la población diana a tenor de los resultados de una muestra, debemos com-

prender las limitaciones inherentes del muestreo.

39. ¿Cuál es la población diana?

La población diana es el grupo de sujetos, objetos, determinaciones o sucesos que queremos

ver representados en la muestra.

40. ¿Cuál es la característica más importante de una buena muestra?

La muestra debe representar a la población de la que se extrae para poder hacer generalizacio-

nes sobre la población diana a partir del análisis de los datos de la muestra.

41. Explique qué es el error de muestreo.

El muestreo lleva de modo inherente un error de muestreo verosímil (es decir, la diferencia

entre una característica medida en la muestra y en la población diana). En realidad, rara vez

puede determinarse este error porque, por lo general, no se conoce la medida verdadera en la

población diana.

42. ¿Cuáles son las causas principales del error de muestreo?

Se sabe que en el error de muestreo hay dos causas principales: el sesgo de selección y la

variación por azar. El error por sesgo de muestreo está causado por utilizar una población

muestral con características de medida que no son representativas de la población diana.

El error por variación por azar es un error de medida atribuible, simplemente, al azar.

43. ¿Qué tipo de error puede reducirse al mínimo por un diseño de estudio

apropiado y una técnica de muestreo apropiada?

Puede reducirse al mínimo el error de muestreo utilizando un proceso de selección aleatorio. El

error por variación por azar es «aleatorio», atribuido al azar y, por tanto, no es controlable.

44. ¿Cómo se efectúa el muestreo?

Se dispone de numerosos mecanismos para realizar el muestreo, entre ellos:■ Muestreo aleatorio simple.■ Muestreo aleatorio estratificado (es decir, muestreo aleatorio de cada grupo después de su

división en grupos heterogéneos).■ Muestreo aleatorio agrupado (es decir, muestreo aleatorio de grupos después de su división

en grupos homogéneos).■ Muestreo aleatorio sistemático (p. ej., muestreo cada 10, cada 20, etc.).

45. ¿Por qué se desea el proceso de asignación aleatoria en la selección de la

muestra?

La aleatorización ayuda a asegurar que la muestra sea representativa de la población diana glo-

bal. El investigador debe tener presente que el proceso de muestreo (no la propia muestra)

determina la aleatorización. Idealmente, el muestreo aleatorio elimina el sesgo, dejando la

variación por azar como única fuente de error y con la magnitud de dicho error determinado

por el tamaño de la muestra y la heterogeneidad de la población.

46. ¿Por qué es importante la determinación de un tamaño de la muestra

adecuado en la planificación del estudio?

La determinación del tamaño de la muestra es una etapa crítica en la planificación de la investiga-

ción, porque con frecuencia el tamaño de la muestra es un factor clave para determinar el tiempo

PROBABILIDAD Y MUESTREO 191

Page 189: Epidemiología y bioestadística secretos   nordness1ed

y los fondos financieros necesarios para completar un estudio. Además, un tamaño de la muestra

inadecuado puede llevar a la ausencia de significación estadística en los datos resultantes.

47. ¿Qué factores afectan al tamaño de la muestra?

Consideremos la fórmula posible más simple para la determinación del tamaño de la muestra,

la prueba de la t pareada:

N = zα2

� (s)2/(d)2

donde d representa la diferencia media observada, (s)2 representa la varianza de la diferencia

media, y zα representa el nivel de significación requerido. Rosner describe cuatro factores

importantes que afectan al tamaño de la muestra cuando se utiliza esta fórmula:■ El tamaño de la muestra aumenta cuando la varianza aumenta.■ El tamaño de la muestra aumenta cuando el nivel de significación se hace menor (es decir,

α disminuye).■ El tamaño de la muestra aumenta a medida que aumenta la potencia requerida (es decir,

cuando 1 – β aumenta).■ El tamaño de la muestra disminuye a medida que aumenta el valor absoluto de la distancia

entre las medias nula y alternativa.

PROBABILIDAD Y MUESTREO192

PUNTOS CLAVE: MUESTREO

1.• El muestreo permite al investigador realizar inferencias sobre la población diana utilizando sólo una

porción de la población, conocida como muestra.

2.• Una buena muestra debe ser representativa de las características de la población diana.

3.• El error de muestreo está causado por el sesgo de selección y por la variación por azar.

4.• La aleatorización es una herramienta para reducir al mínimo el sesgo de selección.

5.• Se efectúa la estimación del tamaño de la muestra antes de llevar a cabo el estudio para valorar

la factibilidad y las limitaciones de realizar el estudio.

BIBLIOGRAFÍA

1.• Morton RF, Hebel JR, McCarter RJ: A Study Guide to Epidemiology and Biostatistics, 5th ed. Gaithersburg,MD, Aspen Publications, 2001, pp 51–69.

2.• Rosner B: Fundamentals of Biostatistics, 5th ed. Pacific Grove, Duxbury, 2000, pp 45–77.3.• Schwartz BS, Mitchell CS, Weaver VM: Occupational Medicine Board Review Course Notes, ACOEM

1:210–214, 2000.

PÁGINA WEB

http://www.amstat.org/sections/epi/SIE_Home.htm

Page 190: Epidemiología y bioestadística secretos   nordness1ed

193

CARACTERÍSTICAS DE LAS PRUEBASDIAGNÓSTICASWard L. Reed, MD, MPH

1. ¿Qué es una prueba?

Puede parecer una pregunta básica y algo ridícula, pero es preciso tener la mente abierta sobre

lo que es una prueba. Muchos lectores tienen una idea fija de lo que es una «prueba». Conside-

ran que una prueba es algo que se solicita en una hoja de papel o en la pantalla del ordenador.

A continuación, se extrae sangre o se lleva a cabo un procedimiento radiológico y, en algún

momento en el futuro, nos devuelven los resultados de la prueba, ya sea por ordenador o en

otra hoja de papel.

Aunque gran parte de la información de este capítulo se aplica directamente a este modelo,

es preciso ampliar la opinión que se tiene de lo que es una «prueba». Una prueba es cualquier

procedimiento que determina un estado o una cantidad en un sujeto.

2. Cite algunos ejemplos de pruebas que, clásicamente, no consideramos

«pruebas».

El acto de entrevistar a un nuevo paciente es una prueba. Determinar los signos vitales es una

serie de pruebas. La exploración física también es una serie de pruebas. Mirar un semáforo

para ver qué color tiene en ese momento puede considerarse como una prueba. Puede anali-

zarse el rendimiento de todas estas pruebas. Por ejemplo, podemos sentirnos cómodos

comentando la sensibilidad de una prueba sanguínea en relación con cierta enfermedad, pero

son también tan importantes la sensibilidad y especificidad de la presencia de estertores en la

neumonía.

3. ¿Cómo se clasifican los diferentes tipos de pruebas?

Por lo general, se describen las pruebas de acuerdo con los resultados informados. Se consi-

dera que los resultados son cuantitativos, semicuantitativos o cualitativos.

4. Describa las pruebas cuantitativas.

Las pruebas cuantitativas proporcionan resultados numéricos. Por lo general, los resultados

de las pruebas cuantitativas se consideran variables continuas para las consideraciones

estadísticas. En los ejemplos arriba expresados, la presión sanguínea, la temperatura y el

colesterol sérico son ejemplos de pruebas cuantitativas. Los resultados de una prueba cuanti-

tativa han de ser expresados siempre en unidades específicas y no meramente como un

número o resultado.

5. Describa las pruebas cualitativas.

Las pruebas cualitativas proporcionan resultados binarios (es decir, dicotómicos). Se conside-

ran las pruebas cualitativas como variables categóricas para las consideraciones estadísticas.

Los datos categóricos son características con valores o tipos discretos. Entre los ejemplos clá-

sicos de resultados cualitativos figura el estado de vivo o muerto, ser hombre o mujer, la pre-

sencia o ausencia de una erupción, y similares.

CA

PÍT

ULO

15

Page 191: Epidemiología y bioestadística secretos   nordness1ed

6. Describa qué son las pruebas semicuantitativas.

Las pruebas semicuantitativas pueden ser vistas como pruebas cualitativas de múltiples nive-

les. Se las considera casi siempre como variables categóricas en las consideraciones estadísti-

cas. Entre los resultados semicualitativos figuran las categorías de los huracanes (1-5), la gra-

duación de los reflejos (0-4+), y la evaluación clínica de la fuerza (0-5). Aunque estos

resultados están ordenados por valores, hay que tener cuidado de no suponer que las diferen-

cias son lineales. Por ejemplo, la velocidad del viento en un huracán de nivel 5 no es cinco

veces superior a la velocidad del viento en un huracán de nivel 1.

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS194

PUNTOS CLAVE: TIPOS DE PRUEBAS

1.• Prueba cuantitativa: da un resultado que es un número, tratado como una variable continua.

2.• Prueba cualitativa: da un resultado sí o no, tratado como una variable categórica.

3.• Prueba semicualitativa: da resultados (generalmente) en forma de números, pero es una

clasificación que no puede considerarse lineal. Aunque parecen como variables continuas,

no pueden ser tratadas como tales en la bioestadística.

7. ¿Pueden convertirse los resultados de una prueba cuantitativa en desenlaces

categóricos?

Pueden y, con frecuencia, lo son. Aunque los resultados de las pruebas cuantitativas se expre-

san como respuestas numéricas (p. ej., colesterol LDL de 145 ± 8 mg/dl), suelen presentarse

como resultado cualitativo (p.ej., normal o anormal; o positivo o negativo). El rendimiento de

una prueba cuantitativa, cuando se convierte en desenlaces categóricos, depende del rendi-

miento inherente de la prueba (determinado por su desviación estándar, que, a su vez, está

determinada por factores técnicos de la prueba) y en qué punto se considera que la prueba es

«anormal» o «positiva». La misma prueba tendrá un rendimiento diferente según dónde se

coloque la línea de separación entre lo normal y lo anormal. Con frecuencia se da un recorrido

«indeterminado» para un desenlace, indicando con ello que no puede tomarse una decisión clí-

nica atendiendo sólo al resultado de la prueba.

8. ¿Cuál es la diferencia entre exactitud y precisión?

Exactitud y precisión son términos que suelen aplicarse a las pruebas cuantitativas. Los dos

términos se utilizan con frecuencia de modo intercambiable por el público, pero tienen signifi-

cados específicos en el campo de la estadística. Exactitud es la capacidad para producir un

resultado muy próximo al estándar aceptado. Este resultado puede ser una media de resulta-

dos ampliamente dispares. El término precisión hace referencia a la capacidad para reproducir

el mismo resultado de modo constante (Fig. 15-1). Este resultado puede no ser tan próximo a

la respuesta aceptada, pero los resultados son reproducibles.

9. Ponga ejemplos de exactitud y precisión.

Imagine dos balanzas en las que se va a pesar. Como científico conoce el modo de realizar múl-

tiples intentos de una determinación y luego promediar los resultados. Los resultados son:■ Balanza 1: 68 kg, 70 kg, 75 kg, 72 kg, 65 kg■ Balanza 2: 73,5 kg, 73 kg, 72,5 kg, 73 kg, 73 kg.

Posteriormente, determina, con el empleo del patrón de referencia, que su peso correcto es

de 70 kg. La balanza 1 es exacta (la media es 70 kg), pero la balanza 2 es precisa (la media es

73 kg; desviación estándar [SD]= 0,35). Este ejemplo ilustra también que una prueba dada

Page 192: Epidemiología y bioestadística secretos   nordness1ed

puede ser de utilidad, aún cuando sea inexacta. Si comienza un programa de ejercicios físicos

para adelgazar, probablemente escogería la balanza 2; aunque su respuesta difiere en 3 kg con

respecto al estándar aceptado, le proporciona unos resultados más constantes, lo que facili-

taría la apreciación de los cambios de intervalo. Puede utilizar la Figura 15-2 para ilustrar cuali-

tativamente la distribución de muchos intentos utilizando las dos balanzas.

10. ¿Qué es lo que determina que una prueba «positiva» sea «positiva»?

Hay dos modos de determinar el recorrido normal de una prueba; el enfoque poblacional y el

enfoque de la afección o enfermedad.

11. Explique qué es el enfoque poblacional para determinar el recorrido normal.

Un enfoque poblacional suele suponer que cualquier persona con un valor superior a 2 SD con

respecto a la media, suponiendo una distribución normal, es anormal. Se recoge una gran canti-

dad de datos de personas normales (es decir, las que aparentemente no tienen enfermedades), y

se determina el recorrido o intervalo normal a partir de dichos datos. Obsérvese que, por su pro-

pia naturaleza, este método da lugar a una prueba «anormal» en el 5% de la población normal.

12. ¿Cuándo puede utilizarse el enfoque poblacional?

Este método sólo funciona cuando la característica en la población se halla distribuida normal-

mente. Con frecuencia la característica no se halla distribuida normalmente. En este caso, debe

utilizarse una tabla de distribución de frecuencias para determinar dónde se hallan

el 2,5% superior y el 2,5% inferior.

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS 195

Figura 15-1. Posibles combinaciones de exactitud y precisión en la descripción deuna variable continua, utilizando una diana y los agujeros de las balas para demos-trar los conceptos. (De Jekel JF, Katz DL; Elmore JG: Epidemiology, Biostatistics,and Preventive Medicine, 2.ª ed. Philadelphia, W.B. Saunders, 2001.)

Exactitud y precisión Exactitud solamente

Precisión solamente Ni exactitud ni precisión

Page 193: Epidemiología y bioestadística secretos   nordness1ed

13. Los resultados anormales de una prueba ¿son siempre indicativos de

enfermedad?

Una prueba anormal no necesariamente significa enfermedad. Muchas pruebas de un panel de

cribado estándar tienen recorridos normales, determinados con el empleo del enfoque pobla-

cional. Como resultado, muchas veces «anormal» no significa «enfermo»; puede significar

sencillamente «diferente». En efecto, si se supone que estas pruebas son independientes, una

batería de 20 pruebas tiene una mayor probabilidad de que uno de los resultados sea anormal

que no que todas las pruebas sean normales. La probabilidad de una prueba anormal es del

5% (0,05); así, la probabilidad de una prueba normal es de 0,95. La probabilidad de 20 pruebas

normales en una fila es 0,9520 o 0,36. Así, la probabilidad de que un individuo completamente

normal (no enfermo) tenga una prueba anormal en un panel de 20 es 0,64, es decir, más pro-

bable que la probabilidad de no tener ninguna anormal.

14. ¿De qué modo se determina lo «anormal» utilizando el método del enfoque por

afecciones?

El método basado en afecciones o enfermedades intenta determinar (generalmente, por medio

de grandes estudios epidemiológicos) qué valor se asocia con una afección dada. Por ejemplo,

de acuerdo con el documento más reciente de la Joint Nation Commission on Heart Disease

(JNC 7), el recorrido normal de la presión sanguínea sistólica (definido como ausencia de exce-

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS196

Figura 15-2. Posibles combinaciones de exactitud y precisión en la descripción deuna variable continua. El eje de las x es una gama de valores, y la flecha indica elvalor verdadero. Las curvas son las distribuciones de probabilidades de los valoresobservados. (De Jekel JF, Katz DL, Elmore JG: Epidemiology, Biostatistics, and Pre-ventive Medicine, 2.ª ed. Philadelphia, W.B. Saunders, 2001.)

Exactitud y precisión Exactitud sólamente

Precisión solamente Ni exactitud ni precisión

Valor verdadero Valor verdadero

Valor verdadero Valor verdadero

Page 194: Epidemiología y bioestadística secretos   nordness1ed

so de riesgo de enfermedad cardiovascular) es de 115 mmHg o menos. A este nivel, un por-

centaje significativamente mayor del 5% de la población tiene un valor anormal, lo que apunta

a que lo «normal» con frecuencia cambia. Hace 30 años, los médicos aceptaban unas presio-

nes sanguíneas elevadas en las personas de edad avanzada como «envejecimiento normal»,

aunque en la actualidad son tratados de modo rutinario los mismos pacientes.

Chobanian AV, Bakris GL, Black HR, et al: Seventh Report of the Joint National Committee on Prevention,

Detection, Evaluation, and Treatment of High Blood Pressure. Hypertension 42(6):1206–1252, 2004.

15. ¿Qué significado tiene el término «patrón oro» o patrón de referencia?

¿Qué implicaciones tiene?

El rendimiento de todas las pruebas debe tener una referencia con la que comparar los resulta-

dos de una nueva prueba. Se suele hacer referencia a la marca como el patrón de referencia.

El patrón de referencia suele ser la prueba definitiva en relación con cualquier enfermedad o

afección. Por ejemplo, aunque hay muchos tipos de pruebas rápidas para detectar la faringitis

estreptocócica, el patrón de referencia sigue siendo la identificación del estreptococo beta

hemolítico en el cultivo faríngeo. Con frecuencia, no se emplea de modo rutinario la prueba de

referencia porque puede ser cara (p. ej., la exploración con resonancia magnética [RM]), inva-

siva (p. ej., una biopsia), peligrosa o, en ocasiones, todas las anteriores (p. ej., cateterización

cardíaca).

16. ¿Hasta qué punto son dorados los patrones oro?

La mayoría de los patrones oro son aleaciones, y se ha demostrado que algunos de ellos son

pirita de hierro (o cobre). Debido a las dificultades para confirmar fácilmente diagnósticos

negativos en algunos casos, unos grupos de control inapropiados o inadecuados (afecciones

consideradas como indicativas de enfermedad que, con posterioridad, se demuestra que son

variantes normales) y la ausencia de estándares clínicos establecidos en relación con una

enfermedad contribuyen a unos patrones de referencia inexactos. Como resultado, no parecerá

que una nueva prueba rinda más que el patrón de referencia, aunque, en realidad, pueda ser

superior.

17. ¿Por qué son importantes las tablas de contingencia de dos por dos (2 � 2)?

¿Qué hay en ellas?

Las tablas de dos por dos son, en algunos aspectos, la propia esencia de la epidemiología y de

la bioestadística, así como de otras disciplinas (se ha dicho que «no es usted nadie en psico-

logía a menos que tenga su nombre en una tabla de 2 � 2»). En la Tabla 15-1 se muestra la

construcción clásica de una tabla de 2 � 2 . El estado de enfermedad se introduce en un eje,

y el estado analizado se introduce en el otro. Los valores fuera de una casilla se denominan

marginales. (Véase m1-m4 en la Tabla.) Es importante considerar que no hay un modo están-

dar para construir una tabla de 2 � 2. La información de la Tabla 15-1 podría igualmente

haberse presentado del modo en que está en la Tabla 15-2.

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS 197

TA B L A 1 5 - 1 . C O N S T R U C C I Ó N D E U N A TA B L A D E D O S P O R D O S

Prueba positiva

Prueba negativa

m3

m4

Enfermedad positiva

a

c

m1

Enfermedad negativa

b

d

m2

Page 195: Epidemiología y bioestadística secretos   nordness1ed

18. Defina qué es un resultado verdadero positivo y un resultado verdadero

negativo.

Un resultado verdadero positivo es el ejemplo en el que una prueba diagnóstica determina de

modo correcto un estado positivo del individuo sometido a la prueba diagnóstica. Un resultado

verdadero negativo es el ejemplo en el que una prueba identifica de modo correcto como nega-

tivo a un individuo no enfermo (o negativo). En la Tabla 15-3 se indican las casillas verdaderas.

19. Defina un resultado falso negativo y un resultado falso positivo.

Los falsos negativos son los casos en los que una prueba clasifica de modo incorrecto a un

individuo positivo como negativo. Los falsos positivos se producen cuando un individuo es

identificado de modo incorrecto como positivo. Las casillas falsas se indican también en la

Tabla 15-3.

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS198

TA B L A 1 5 - 2 . C O N S T R U C C I Ó N A LT E R N AT I VA D E U N A TA B L A D E D O S P O R D O S

Enfermedad positiva

Enfermedad negativa

Prueba negativa

c

d

Prueba positiva

a

b

TA B L A 1 5 - 3 . B L O Q U E S V E R DA D E R O S Y FA L S O S E N U N A TA B L A D E D O S P O R D O S

Prueba positiva

Prueba negativa

Enfermedad negativa

Falso positivo

Verdadero negativo

Enfermedad positiva

Verdadero positivo

Falso negativo

20. ¿Cómo se define la sensibilidad?

La sensibilidad se define como la fracción de personas con la enfermedad o afección que son

identificadas de modo correcto como positivas. Observando de nuevo la tabla clásica de 2 � 2,

se calcula la sensibilidad como:

N.º con la afección y resultado positivo en la prueba

Número total de personas con la afección

El cálculo real de la Tabla 15-4 sería a/(a+c) o a/m1. Animamos a los lectores a que aprendan la

ecuación general, no la versión abreviada a/(a+c). Como se ha indicado previamente, y dado

que puede cambiar la presentación de los datos, la fórmula simplificada no siempre funciona.

21. Ponga un ejemplo de cálculo de la sensibilidad.

Se analiza un conjunto de criterios diagnósticos frente a la práctica clínica aceptada, y se

muestran los resultados en la Tabla 15-5. La sensibilidad en este caso sería 29/(29 + 26) = 0,527

o 52,7%. Se considera que este resultado es definitivamente insuficiente.

22. ¿Cómo se define la especificidad?

Así como la sensibilidad trata sobre los casos que dan resultado positivo en la prueba, la especi-

ficidad trata de los casos que dan resultado negativo en la prueba. Se define la especificidad

como la fracción de las personas analizadas identificadas como negativas. La fórmula general es:

Page 196: Epidemiología y bioestadística secretos   nordness1ed

N.º sin la afección con resultado negativo en la prueba

Número total de personas sin la afección

El cálculo general a partir de la Tabla 15-4 sería d/(b+d), o d/m2.

23. Ponga un ejemplo de cálculo de la especificidad.

Utilizando los datos a partir de los criterios diagnósticos de la prueba de la Tabla 15-5, la sensi-

bilidad calculada sería 28/(28+3) = 0,903 o 90,3%.

24. ¿Cuál es la relación entre la especificidad y la tasa de falsos positivos?

Dado que la especificidad indica lo bien que una prueba diagnóstica identifica los verdaderos

negativos, intuitivamente se espera que haya una relación entre los identificados correctamente

como negativos y los verdaderamente negativos que son identificados falsamente como positi-

vos. En realidad, puede calcularse la tasa de falsos positivos directamente a partir de la especi-

ficidad dada. Generalmente, los verdaderos positivos (TP) + los falsos positivos (FP) = todas

las pruebas positivas. Puede calcularse también la tasa de falsos positivos (FPR) a partir de la

especificidad, ya que los verdaderos negativos (TN) + los falsos positivos (FP) = todos los que

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS 199

TA B L A 1 5 - 4 . • TA B L A D E D O S P O R D O S PA R A E L C Á L C U L O D E L A S E N S I B I L I DA D

Y D E L A E S P E C I F I C I DA D

Prueba positiva

Prueba negativa

m3

m4

Enfermedad positiva

a

c

m1

Enfermedad negativa

b

d

m2

TA B L A 1 5 - 5 . C R I T E R I O S D E L A P R U E BA F R E N T E A L A P R Á C T I C A C L Í N I C A

Prueba positiva

Prueba negativa

Clínicamente negativa

3

28

Clínicamente positiva

29

26

PUNTOS CLAVE: TABLAS DE 2 � 2

1.• Las tablas de 2 � 2 son el modo estándar de presentar los datos sobre el rendimiento

de una prueba.

2.• Los verdaderos positivos son las personas con la afección que dan resultado positivo en la prueba.

3.• Los verdaderos negativos son las personas sin la afección que dan resultado negativo en la prueba.

4.• Los falsos positivos son las personas sin la afección que dan resultado positivo en la prueba.

5.• Los falsos negativos son las personas con la afección que dan resultado negativo en la prueba.

Page 197: Epidemiología y bioestadística secretos   nordness1ed

no tienen enfermedad (enfermedad negativos = DN). Dividiendo por DN y disponiendo de

nuevo los datos, se obtiene: 1 – TN/DN = FP/DN. Esta ecuación se simplifica en:

1 – especificidad = FPR

25. ¿Cómo se relaciona la sensibilidad con la tasa de falsos negativos?

En la medida en que la sensibilidad y la tasa de falsos positivos se hallan relacionados, también

lo están la especificidad y los falsos negativos. La fórmula general de la tasa de falsos negati-

vos (FNR) es:

N.º con la afección con resultado negativoFNR =

Número total con la afección

De la tabla general de 2 � 2, el cálculo sería b/(b + d). De modo similar a la especificidad y a

tasa de falsos positivos, la tasa de falsos negativos se calcula más fácilmente como:

1 – sensibilidad = FNR

26. ¿Qué es el valor predictivo positivo?

El valor predictivo positivo (PPV) es la proporción de una población analizada con una prueba

positiva que, realmente, tenía la enfermedad o afección en cuestión. El denominador incluye los

verdaderos positivos y los falsos positivos. El PPV depende del rendimiento de la prueba en la

población analizada y de la prevalencia de la afección en la población analizada.

27. ¿Cuál es la fórmula para el valor predictivo positivo?

La ecuación general para el PPV es:

Verdaderos positivos

Todos los positivos

o

Verdaderos positivos

Verdaderos positivos + falsos positivos

28. ¿Cuál es el PPV en el caso de los datos presentados en la Tabla 15-5?

PPV = 29/(29 + 3) = 90,1%

29. ¿Qué es el valor predictivo negativo?

El valor predictivo negativo (NPV) es la proporción de la población analizada que realmente no

tenía la enfermedad o afección en cuestión. El denominador incluye los verdaderos negativos

y los falsos negativos. El NPV también depende del rendimiento de la prueba y de la prevalen-

cia de la afección de interés.

30. ¿Cuál es la ecuación general para el valor predictivo negativo?

La ecuación general para el NPV es:

Verdaderos negativos

Todos los negativos

o

Verdaderos negativos

Verdaderos negativos + falsos negativos

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS200

Page 198: Epidemiología y bioestadística secretos   nordness1ed

31. ¿Cuál es el valor predictivo negativo en el caso de los datos presentados en la

Tabla 15-5?

Tal como se ha mencionado, el PPV es 29/(29+3) o 90,1%; aparentemente, un resultado útil.

El NPV es 28/(28+26) o 51,8%, que es sólo ligeramente mejor que lanzar una moneda al aire.

Recuerde que los valores predictivos de una prueba dada están en función del rendimiento

de la prueba, así como de la prevalencia de la afección estudiada en la población que se está

estudiando.

32. ¿Puede cambiar el valor predictivo de una prueba si el rendimiento de la

prueba no lo hace?

Sí. Los términos «PPV» y «NPV» suelen hacer referencia a los datos tomados del rendimiento

de la prueba. El rendimiento de la prueba y el valor predictivo de la prueba varían con la preva-

lencia de la enfermedad en la población sometida a estudio.

33. Ponga un ejemplo de prevalencia cambiante de la enfermedad.

Una investigadora ha descubierto un marcador en la sangre que, según cree, será de utilidad

para hacer un cribado en busca de la enfermedad inflamatoria intestinal (IBD). Se realizan las

pruebas iniciales en pacientes consecutivos en la sala de espera de una clínica de gastroentero-

logía (GI) en un gran centro de cuidados terciarios. Los resultados hipotéticos se muestran en

la Tabla 15-6. Estos datos proporcionan una sensibilidad del 95%, una especificidad del 98%,

un PPV del 92% y un NPV del 98%.

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS 201

PUNTOS CLAVE: SENSIBILIDAD, ESPECIFICIDAD Y VALORPREDICTIVO

1.• Sensibilidad = TP/(TP�FN)

2.• Especificidad = TN/(TN�FP)

3.• Valor predictivo positivo = TP/(TP�FP)

4.• Valor predictivo negativo = TN/(TN�FN)

5.• El valor predictivo depende del rendimiento de la prueba, combinado con la prevalencia

de la afección en la población analizada.

TA B L A 1 5 - 6 . R E S U LTA D O S D E U N A P R U E BA D E C R I BA D O D E I B D E N U N A C L Í N I C A G I

Prueba positiva

Prueba negativa

Clínicamente negativa

5

135

Clínicamente positiva

57

3

Imagínese ahora que se repite el experimento, a excepción de que la población del estudio

se toma de una sala de espera de un centro de donantes de sangre. Los resultados pueden

tener el aspecto de la Tabla 15-7. Estos datos proporcionan una sensibilidad del 100%, una

especificidad del 96%, un PPV del 33% y un NPV del 100%. Obsérvese que el cambio en la

población analizada altera completamente la utilidad de la prueba. Al alterar la prevalencia de la

Page 199: Epidemiología y bioestadística secretos   nordness1ed

enfermedad en la población analizada desde el 30% en la GI al 2% en la población general, se

introduce una gran diferencia en los valores predictivos de las pruebas. La diferencia en la sen-

sibilidad y especificidad se debe a errores de redondeo; en estos ejemplos no es posible tener

una fracción de una persona. Sin embargo, sí es posible observar diferencias en el rendimiento

de la prueba en poblaciones diferentes. Diferencias en los estadios de la enfermedad y carac-

terísticas de la población pueden cambiar (y con frecuencia lo hacen) el rendimiento de la pro-

pia prueba. Esto muestra la influencia de la prevalencia sobre el valor predictivo. También

subraya la importancia de conocer la procedencia de los datos en el rendimiento de una prue-

ba.

34. ¿Qué es la probabilidad preprueba?

La probabilidad preprueba es la verosimilitud de partida de que exista una afección dada en la

población en cuestión. Con mucha frecuencia es la prevalencia de una afección en la población

estudiada, aunque puede ser alterada, dados otros factores.

35. ¿Por qué es importante la probabilidad preprueba en la evaluación de las

pruebas diagnósticas?

La sensibilidad y la especificidad son factores importantes para evaluar el rendimiento de las

pruebas diagnósticas, pero no son los únicos factores. Tan importante, y en ocasiones más, es

la frecuencia de la afección en la población analizada. Se determina la probabilidad preprueba

de varios modos. Lo más fácil es considerar la frecuencia de la afección en la población gene-

ral, es decir, la incidencia o prevalencia de la afección. Lo ideal sería conocer la prevalencia en

la población específica (p. ej., la prevalencia de arteriopatía coronaria en fontaneros zurdos,

diabéticos, de 55 años de edad que experimentasen accesos de dolor costal atípico), pero con

frecuencia no se dispone de un nivel ideal. En tales casos, se sustituye con frecuencia por la

percepción clínica preprueba.

36. ¿Qué dice el teorema de Bayes?

El teorema de Bayes recibe su nombre en honor de Thomas Bayes (1702-1761), un clérigo

inconformista y aficionado a las matemáticas que vivió en Inglaterra. Elegido Fellow de la Royal

Society en 1742 (principalmente, por una defensa del cálculo de Newton), su contribución más

importante fue su teoría de la probabilidad publicada (en 1764) después de su muerte.

El teorema de Bayes predice la probabilidad de un suceso A dado un suceso B. La forma

general del teorema de Bayes es:

P(B A)P(A)P(A B) =

P(B A)P(A) + P(B ~A)P(~A)

La notación P(A) se lee como «probabilidad de A». La notación P(A B) se lee como «pro-

babilidad de A dado B». La notación P(B ~A) se lee como «probabilidad de B dado ‘no A’».

Con el fin de averiguar la probabilidad de A dado B, necesitamos conocer la probabilidad de B

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS202

TA B L A 1 5 - 7 . • R E S U LTA D O S D E U N A P R U E BA D E C R I BA D O D E I B D E N U N C E N T R O

D E D O N A N T E S D E S A N G R E

Prueba positiva

Prueba negativa

Clínicamente negativa

20

470

Clínicamente positiva

10

0

Page 200: Epidemiología y bioestadística secretos   nordness1ed

dado A, la probabilidad de A, la probabilidad de B dado «no A», y la probabilidad de «no A».

Puede utilizarse el teorema de Bayes para aplicaciones tan diversas como determinar la proba-

bilidad de pasar por el tercer semáforo en verde después de haber pasado por los dos primeros

en verde o para determinar qué número de spams (correo electrónico no solicitado) hay en

nuestro buzón de entrada.

37. ¿Qué tiene que ver el teorema de Bayes con las pruebas diagnósticas?

Con frecuencia se utiliza el teorema de Bayes como la base para determinar el PPV y el NPV.

Puede calcularse el valor predictivo positivo y el valor predictivo negativo cuando se presentan

los datos sin elaborar a partir de un estudio de prueba, pero, por lo general, dichos datos no

suelen presentarse. Utilizando el teorema de Bayes, el PPV es:

P(prueba+ enfermedad)P(enfermedad)P(enfermedad prueba+) =

P(prueba+ enfermedad)P(enfermedad)

+ P(prueba+ ~enfermedad)P(~enfermedad)

38. Todo esto es bastante complicado. ¿Hay una forma más sencilla del teorema

de Bayes?

La ecuación se simplifica si consideramos que la mayoría de los términos pueden obtenerse

fácilmente. La definición de sensibilidad es P(prueba+ enfermedad). La P(enfermedad) es la

prevalencia de la afección o la probabilidad clínica preprueba. La P(prueba+ ~ enfermedad) es

igual a 1 – especificidad. La probabilidad de ausencia de enfermedad es 1 – prevalencia

o 1 – probabilidad preprueba. Simplificando la ecuación, tenemos:

Sensibilidad � prevalenciaP(enfermedad prueba+) =

Sensibilidad � prevalencia + (1 – especificidad)(1 – prevalencia)

Con mucha frecuencia se cita esta ecuación como el cálculo del valor predictivo de una

prueba positiva.

39. ¿Hay también una ecuación simplificada para el valor predictivo negativo?

Igualmente, el valor predictivo de una prueba negativa puede simplificarse a:

Especificidad � (1 – prevalencia)P(enfermedad prueba–) =

Especificidad � (1 – prevalencia) + (1 – sensibilidad)(prevalencia)

40. Muestre cómo puede utilizarse el teorema de Bayes en un contexto clínico.

Un estudiante de medicina de segundo curso lee un artículo sobre la tripanosomiasis africana.

Se da cuenta de que con frecuencia él está somnoliento, tiene cefaleas y tiene dolor en algunas

articulaciones. Piensa, además, que tiene algunas adenopatías. Llega a la conclusión de que, de

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS 203

PUNTOS CLAVE: TEOREMA DE BAYES

1.• El teorema de Bayes calcula las probabilidades de los sucesos después de un suceso observado.

2.• La forma más útil del teorema de Bayes en las pruebas diagnósticas es en relación con el valor

predictivo positivo, como sigue:

Sensibilidad � prevalenciaP(enfermedad prueba�) =

Sensibilidad x prevalencia � (1 – especificidad)(1 – prevalencia)

Page 201: Epidemiología y bioestadística secretos   nordness1ed

algún modo, ha contraído la tripanosomiasis africana. Comenta con un técnico de laboratorio

una prueba de ELISA en sangre para la tripanosomiasis que se ha realizado y cuyo resultado es

elevado. ¿Debería llamar a continuación a los Centers for Disease Control and Prevention

(CDC) para recibir tratamiento?

Supongamos que tanto la sensibilidad como la especificidad de la prueba son del 90% y que

la prevalencia entre los estudiantes de medicina de segundo curso en Estados Unidos es de

1 por 5.000.000.

Probabilidad posprueba = (0,90)(2 � 10–7)/[(0,90)(2 � 107) + (0,10)(1 – 2 � 10–7)] = 1,8 � 10-6

41. ¿Qué es un cociente de verosimilitudes?

Un cociente de verosimilitudes (likelihood ratio) es una herramienta clínica utilizada para com-

binar la sensibilidad y la especificidad de modo más fácil que empleando el teorema de Bayes.

Es una medida de la posibilidad de resultados en un grupo con y sin la enfermedad. Multipli-

cando la posibilidad preprueba por el cociente de verosimilitudes puede obtenerse la posibili-

dad posprueba (es decir, posterior). Obsérvese que el cociente de verosimilitudes utiliza posi-

bilidades en vez de probabilidades, como hace el teorema de Bayes. Los cocientes de

verosimilitudes son una expresión del grado en que una prueba positiva o negativa influye

sobre la posibilidad de la enfermedad después de la prueba. Cuanto más próximo esté a 1 el

cociente de verosimilitudes, menos útil es la prueba.

42. ¿Cómo se calcula el cociente de verosimilitudes?

Hay fórmulas para el cálculo del cociente de verosimilitudes (LR) en relación con una prueba

positiva y con una prueba negativa, como sigue:

SensibilidadLR(positiva) =

1 – especificidad

1 – sensibilidadLR(negativa) =

Especificidad

43. Un nuevo tipo de exploración con RM en relación con los desgarros del

músculo del hombro muestra una sensibilidad de 0,85 y una especificidad de 0,90.

¿Cuáles son las LR (positiva) y LR (negativa)?

■ LR+ = 0,85/1 – 0,90) = 8,5.■ LR– = (1 – 0,85)/0,90 = 0,167.

Se considera que cuanto más alejado de 1 esté el cociente de verosimilitudes, más útil es la

prueba.

44. ¿Cómo se utiliza el cociente de verosimilitudes?

Se convierte la probabilidad previa (es decir, prevalencia o probabilidad preprueba a priori) a

posibilidad, según sea necesario. Se multiplica la posibilidad previa por la forma apropiada del

cociente de verosimilitudes y, a continuación, se hace el camino inverso a probabilidad. Uno de

los aspectos útiles del cociente de verosimilitudes es que pueden evaluarse múltiples pruebas

con un conjunto de cálculos al coordinar los cocientes de verosimilitudes.

45. El médico de un equipo menor de la liga de béisbol está evaluando a un lanza-

dor por dolor en el hombro. A tenor de la historia del lanzador y de la explora-

ción física, el médico cree que el jugador tiene un desgarro del músculo del

hombro que requiere corrección quirúrgica. Remite al paciente a una explora-

ción rápida con RM referenciada en la pregunta 43. ¿Cuál es la probabilidad de

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS204

Page 202: Epidemiología y bioestadística secretos   nordness1ed

que el lanzador tenga una lesión de hombro operable después de una prueba

positiva?

■ Primera medida. Convertir en posibilidad: posibilidad = probabilidad/(1 – probabilidad) =

0,60/(1 – 0,60) = 1,5.■ Segunda medida. Multiplicar por el LR+: posibilidad posterior = LR � posibilidad previa =

8,5 � 1,5 = 12,75.■ Tercera medida. Hacer el camino inverso a probabilidad: probabilidad = posibilidad/(1 + po -

sibilidad) = 12,75/13,75 = 0,92.

46. Después de saber los resultados de las pruebas, el lanzador (que se muestra

remiso a la cirugía) quiere más pruebas. Reacio, el médico dispone otro estu-

dio que tiene una sensibilidad de 0,8 y una especificidad de 0,95 y proporciona

un resultado negativo. ¿Cuál es la probabilidad posprueba después de la

segunda prueba? Suponga que las pruebas son independientes.

Podemos comenzar con la posibilidad posterior del problema previo, 12,75.■ Primera medida. Se calcula LR– como sigue: LR– = (1 – sensibilidad)/especificidad =

(1 – 0,8)/0,95 = 0,21■ Segunda medida. Se multiplica la posibilidad por LR–: 12,75 � 0,21 = 2,68■ Tercera medida: Se convierte en probabilidad: probabilidad = posibilidad/(1 + posibilidad) =

2,68/3,68 = 0,72

Obsérvese que la segunda prueba confirmatoria realizada para descartar un diagnóstico sólo

disminuyó la probabilidad de dicho diagnóstico de 0,92 a 0,72. El diagnóstico de desgarro

sigue siendo aún más probable que la ausencia de dicho diagnóstico.

47. ¿Qué es una curva ROC?

La curva ROC (receiver operator characteristic) significa curva de eficacia diagnóstica. Se

emplea para representar gráficamente la respuesta de una prueba a la variación del nivel de

positividad. Cuando se informa una prueba con un resultado cuantitativo, se puede variar el

valor que determina un resultado positivo. Casi siempre hay cierto equilibrio entre la sensibili-

dad y la especificidad. Puede elegirse un nivel que dé lugar a la identificación de casi todos los

individuos con la enfermedad, pero por lo general este nivel dará lugar a una gran proporción

de falsos positivos y, por tanto, a una baja especificidad. Un nivel en el que casi todos los indi-

viduos sin la enfermedad sean identificados correctamente dará lugar a una sensibilidad muy

baja (es decir tasa de verdaderos positivos). La curva ROC muestra gráficamente de qué modo

los cambios en los niveles cambian la sensibilidad y la especificidad.

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS 205

PUNTOS CLAVE: COCIENTES DE VEROSIMILITUDES (LR)

1.• Los cocientes de verosimilitudes (LR) calculan datos similares utilizando oportunidades relativas,

y pueden utilizarse de modo seriado.

2.• LR(positivo) = sensibilidad/1 – especificidad

3.• Posibilidad posterior = posibilidad inicial � LR1 � LR2 ... LRx

4.• LR(negativo) = 1 – sensibilidad/especificidad

5.• El cálculo del LR supone que las pruebas son independientes (es decir, que los resultados de una

prueba no tienen efecto sobre los resultados de las otras).

Page 203: Epidemiología y bioestadística secretos   nordness1ed

48. ¿Cómo se traza una curva ROC?

La curva ROC es una representación gráfica de la tasa de falsos positivos (es decir, 1 – especifici-

dad) frente a la sensibilidad. Se determinan los datos a partir de los diferentes niveles, y luego se

traza la curva. En la Tabla 15-8 se muestran los datos de un estudio de la concentración plasmáti-

ca de glucosa en ayunas para el diagnóstico de la diabetes mellitus gestacional. Siempre hay dos

puntos fijos en una curva ROC: 0,0 y 1,1. Estos puntos representan los extremos en los que son

identificados todos los casos sin enfermedad (100% de especificidad y 0% de sensibilidad) o

todos los casos con enfermedad (0% de sensibilidad y 100% de especificidad). En la Figura 15-3

se observa la representación gráfica. Es una curva ROC típica. Cuanto más se acerque la curva a

la parte superior izquierda del trazado, mejor es el rendimiento de la prueba diagnóstica.

Perucchi D, Fischer U, Spinas G, et al: Using fasting plasma glucose concentrations to screen for gestation-

al diabetes mellitus: Prospective population-based study. BMJ 319:812–815, 1999.

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS206

TA B L A 1 5 - 8 . G L U C O S A E N P L A S M A PA R A E L D I A G N Ó S T I C O D E L A D I A B E T E S G E S TA C I O N A L

Concentración de glucosa (mmol/l)

Sensibilidad

Especificidad

4,4

1,0

0,39

5,0

0,62

0,88

4,8

0,81

0,76

5,2

0,55

0,96

4,6

0,92

0,60

49. ¿Qué es una «buena» curva ROC?

Las curvas ROC son evaluadas por el área bajo la curva. Una curva ROC «perfecta» tendría un

área de 1. Una prueba totalmente inútil daría una línea recta con una pendiente de 1 y, por

tanto, un área de 0,5. En las curvas simples con pocos datos, las áreas se calculan por un

método geométrico. En las curvas más complejas con muchos datos se emplea un método

estadístico, no paramétrico, bastante complejo. Un método práctico para evaluar las curvas

ROC es como sigue:■ 0,90-1,00 = excelente.■ 0,80-090 = buena.■ 0,70-0,80 = aceptable.■ 0,60-0,70 = mala.■ < 0,60 = sin utilidad.

Las curvas ROC también pueden utilizarse para elegir el punto en el que se considera que una

prueba es positiva. La Figura 15-4 ilustra gráficamente la utilidad de varias curvas ROC. Los puntos

en la parte superior izquierda de la curva tienen el mejor equilibrio entre sensibilidad y especificidad.

50. ¿Cuál es la diferencia entre pruebas en serie y en paralelo?

En medicina clínica hay dos estrategias para las pruebas múltiples. En las pruebas seriadas, se

consideran los resultados de la prueba 1 antes que los resultados de la prueba 2, los resulta-

dos de la prueba 2 antes que los resultados de la prueba 3, y así sucesivamente. Para que una

prueba sea considerada positiva, todas las pruebas de la serie han de ser positivas. En las

pruebas en paralelo, todas las pruebas son consideradas de modo independiente, y cualquier

resultado positivo es considerado positivo.

51. ¿Cómo se decide qué estrategia es la apropiada?

Las pruebas seriadas son útiles cuando son indeseables los falsos positivos, como en el caso

de un tratamiento muy invasivo o muy tóxico. Las pruebas en paralelo son útiles cuando es

necesario un diagnóstico rápido y es indeseable un diagnóstico pasado por alto.

Page 204: Epidemiología y bioestadística secretos   nordness1ed

52. ¿Cuándo se utilizan las estrategias en serie o en paralelo?

Las pruebas seriadas producen una estrategia global muy específica pero poco sensible, mien-

tras que las pruebas en paralelo producen una estrategia sensible pero poco específica. Por

ejemplo, en la sala de urgencias se solicitan múltiples pruebas de modo paralelo cuando acude

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS 207

Figura 15-3. Curva de eficacia diagnóstica (ROC) en relación con la concentración de glucosa enayunas como prueba para el diagnóstico de la diabetes mellitus gestacional. (De Perruchini D, Fis-cher U, Spinas GA, et al: Using fasting plasma glucose concentration to screen for gestational diabe-tes mellitus: Prospective population-based study. BMJ 319[7213]:812-815, 1999, con permiso.)

Concentración de glucosaen plasma en ayunas

Prueba de estimulación con 50 gde glucosa

1 – especificidad

Sensib

ilid

ad

7,8 mmol/l

0,2 0,4 0,6 0,8 10

7,0 mmol/l

1

0,8

0,6

0,4

0,2

0

4,8 mmol/l4,4 mmol/l

PUNTOS CLAVE: CURVAS DE EFICACIA DIAGNÓSTICA (ROC)

1.• El rendimiento de una prueba cambia según el lugar en que se sitúe el nivel de positividad.

2.• Se traza la curva ROC representando la tasa de falsos positivos (es decir, 1 – especificidad) en el eje

de las x y la sensibilidad en el eje de las y.

3.• Una curva ROC inútil es una línea recta con una pendiente 1. Cuanto más se combe la curva hacia

la parte superior izquierda del trazado, mejor rendimiento tiene la prueba.

4.• El rendimiento de una prueba se determina por el área bajo la curva: 1 es perfecta y 0,5 es inútil.

Page 205: Epidemiología y bioestadística secretos   nordness1ed

un paciente cuyo síntoma principal es dolor costal. Si una de las pruebas muestra un resultado

positivo, como una elevación del segmento ST en un electrocardiograma (ECG), una concentra-

ción sérica elevada de troponina o signos de insuficiencia cardíaca izquierda en la radiografía de

tórax, se considera que el paciente tiene un infarto de miocardio y es tratado en consecuencia.

A la inversa, un cirujano oncológico no extirpará el colon atendiendo a una prueba positiva de

sangre en heces (una prueba de cribado habitual para el cáncer de colon con fácil administración

y un bajo coste); la cirugía requiere pruebas de confirmación, que se realizan de modo seriado.

53. ¿Por qué es importante la independencia en las pruebas?

La independencia en las pruebas afecta al modo de interpretarlas. Al considerar múltiples prue-

bas seriadas, suele suponerse que los desenlaces de cada prueba no dependen de las otras

pruebas. Así, la posibilidad final de enfermedad en una serie de pruebas será

Posibilidad (final) = posibilidad inicial � LR1 � LR2 � LR3... LRx

En la realidad, sin embargo, con frecuencia las pruebas no son independientes; un resultado

falso positivo en una prueba puede predisponer a un resultado falso positivo (o falso negativo)

en otra. Muchas pruebas pueden, en función, dirigirse a lo mismo o pueden ser realizadas del

mismo modo. Así, la debilidad de una, bien puede ser la debilidad de otra. Idealmente, quere-

mos datos del rendimiento de una prueba relacionada con las series de pruebas. Lamentable-

mente, no se suele disponer de tales datos.

54. ¿Cómo se mide el acuerdo entre diferentes clasificadores?

Las determinaciones de datos categóricos, como la interpretación de estudios radiológicos,

dependen del juicio del clasificador (p. ej., juzgando la presencia de infartos en la RM o la pre-

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS208

Figura 15-4. Ejemplos de curvas de eficacia diagnóstica (ROC) en relacióncon cuatro pruebas. La curva superior es la mejor de las cuatro. (De JekelJF, Katz DL, Elmore JG: Epidemiology, Biostatistics, and Preventive Medici-ne, 2.ª ed. Philadelphia, W.B. Saunders, 2001.)

Curva excelente

Curva buena

Curva regular

Línea sin beneficio

Sensib

ilid

ad

Tasa de error de falsos positivos

100

80

60

40

20

0

100806040200

Page 206: Epidemiología y bioestadística secretos   nordness1ed

sencia de células malignas en una biopsia). Para la validez de los resultados, el mismo estudio

suele ser examinado por múltiples evaluadores. Se emplea la kappa de Cohen (es decir, la

prueba de la kappa) para cuantificar el grado de acuerdo entre los distintos clasificadores,

teniendo en consideración el acuerdo causado por el azar. Se informa la prueba en una escala

de –1 a +1.

55. ¿Qué es una buena puntuación kappa?

Una kappa inferior a 0,6 suele considerarse inaceptable, mientras que una kappa mayor de

0,80 es excelente. Puede utilizarse una kappa ponderada cuando se considere que algunos

desacuerdos son peores que otros (p. ej., biopsia normal o con una elevada malignidad).

56. ¿Cómo se calcula el estadístico kappa?

Se calcula la versión más común del estadístico kappa (la kappa de Cohen), comparando el

acuerdo esperado con el acuerdo observado. Utilizando un formato de 2 � 2 en la Tabla 15-9,

los cálculos son como sigue:■ P(acuerdo observado) = (a + d)/N■ P(esperado) = [(f1 � g1) + (f2 � g2)]/N2

■ Kappa = [P(observado) – P(esperado)]/[1 – P(esperado)]

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS 209

PUNTOS CLAVE: PRUEBAS EN PARALELO Y EN SERIE

1.• Las pruebas en paralelo implican una serie de pruebas realizadas simultáneamente. Con una prueba

positiva, se considera positiva la serie en su totalidad.

2.• Las pruebas en serie implican una serie de pruebas realizadas secuencialmente. Todas ellas han

de ser positivas para que sean consideradas positivas.

3.• Las pruebas en paralelo dan lugar a una estrategia sensible, pero inespecífica. Las pruebas en serie

son específicas, pero no sensibles.

TA B L A 1 5 - 9 . DATO S N E C E S A R I O S PA R A E L C Á L C U L O D E L A K A P PA

Observador 1

Observador 2 g1

g2

N

a

c

f1

No

No

b

d

f2

57. Ponga un ejemplo de cálculo de la kappa.

Se pregunta en un parque a dos niños de 6 años de edad que decidan qué animales son ardi-

llas. En la Tabla 15-10 se muestra la tabulación de sus resultados. ■ P(observada) = (31 + 41)/84 = 0,77.■ P(esperada) = (43 � 38 + 41 � 46)/(84)2 = 0,50.■ Kappa = (0,77 – 0,50)/(1 – 0,5) = 0,54.

En este caso, la kappa es 0,54; el acuerdo entre los dos niños de 6 años no es muy bueno.

Posiblemente, puede haber un error en la percepción (es decir, uno de los niños necesita gafas)

Page 207: Epidemiología y bioestadística secretos   nordness1ed

o en su formación (es decir, identificación errónea de gatos, ratones de campo y otros

pequeños mamíferos), pero en cualquier caso, las conclusiones basadas en los datos de estos

observadores serían muy sospechosas.

58. ¿Puede calcularse la kappa en el caso de más de dos observadores?

El cálculo arriba indicado de la kappa de Cohen es el más simple posible, con dos observado-

res y dos desenlaces. Cuando sean posibles múltiples observadores y múltiples desenlaces, el

cálculo se hace mucho más complejo y casi siempre se realiza con ordenador.

Merece la pena observar que el estadístico kappa no es reconocido universalmente como la

evaluación patrón de referencia. La interpretación exacta del estadístico está sujeta a desacuer-

do, y los valores de ponderación (cuando se utilizan) son arbitrarios y, por ende, están sujetos

a sesgo.

CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS210

TA B L A 1 5 - 1 0 . E J E M P L O S D E DATO S PA R A E L C Á L C U L O D E L A K A P PA

Observador 1

Observador 2 38

46

84

Ardilla

31

12

43

Ardilla

No ardilla

No ardilla

7

34

41

PÁGINA WEB

http://www.apha.org/public_health/epidemiology.htm

BIBLIOGRAFÍA

1.• Chobanian AV, Bakris GL, Black HR, et al: Seventh Report of the Joint National Committee on Prevention,Detection, Evaluation, and Treatment of High Blood Pressure. Hypertension 42(6):1206–1252, 2004.

2.• Jekel JF, Katz DL, Elmoe JG: Epidemiology, Biostatistics, and Preventive Medicine, 2nd ed. Philadelphia, W.B.Saunders, 2001.

3.• Perucchi D, Fischer U, Spinas G, et al: Using fasting plasma glucose concentrations to screen for gestationaldiabetes mellitus: Prospective population-based study. BMJ 319:812–815, 1999.

Page 208: Epidemiología y bioestadística secretos   nordness1ed

211

LA DISTRIBUCIÓN DE LA t DE STUDENTY LA PRUEBA DE LA t DE STUDENTPhilip D. Parks, MD, MPH

1. ¿Cómo se utilizan la distribución de la t y la prueba de la t? ¿Qué tipos de

datos pueden ser interpretados?

La distribución de la t de Student y la prueba de la t de Student se emplean para realizar infe-

rencias sobre la media poblacional utilizando muestras de pequeño tamaño (< 30) cuando los

datos proceden de una muestra aleatoria simple. En los ejemplos de este capítulo se supone

que cuando se utilizan la distribución de la t de Student y la prueba de la t de Student, se toma

la muestra aleatoria simple de una población aproximadamente normal y se desconoce la des-

viación estándar (σ) de la población.

2. ¿A qué estudiante hace honor la prueba nombrada como la t de Student?

Las leyes sobre la propiedad intelectual establecidas por su patrón (Guinness Brewery) (Fábri-

ca de Cervezas Guinness) impidieron que William Gossett (1876-1937) diera su verdadero

nombre a una de las pruebas más utilizadas en estadística. En lugar de nombrar esta herra-

mienta útil como prueba de Gossett, utilizó el seudónimo de «Student» cuando escribió su

descripción en 1908 de la distribución de la t, y que él denominó prueba de la t de Student.

Como ingeniero de control de calidad de la Guinnes Brewery, Gossett utilizó sus nuevos proce-

dimientos de la t para comparar lotes de cerveza de malta, y afianzó su puesto de trabajo ayu-

dando a la fábrica a que produjera la cerveza más barata y mejor posible.

3. ¿Por qué no utilizar la distribución de la z (es decir, la distribución normal)?

Los procedimientos inferenciales para las medias asociadas con la curva normal (proce -

dimientos z) son apropiados sólo cuando se conoce la desviación estándar (σ) de la pobla-

ción. Clásicamente, esperaríamos que σ fuese desconocida; por ello, en la investigación

médica se utilizan generalmente los procedimientos de la t. Sin embargo, en relación con

tamaños muestrales mayores de 30, la distribución de la z y la distribución de la t son casi

idénticas.

4. ¿En qué otros diseños de muestreo son apropiados los procedimientos de la t?

Se utilizan también los procedimientos de la t para comparar las respuestas a dos tratamientos

en dos grupos independientes o en un grupo de sujetos en dos momentos diferentes. Se

efectúa la comparación aplicando los procedimientos de la t a las diferencias observadas. Si se

quieren comparar las respuestas a dos tratamientos o comparar las medias de dos poblacio-

nes, se necesitan muestras aleatorias simples independientes de (idealmente) poblaciones

aproximadamente normales en las que las medias y las desviaciones estándares son descono-

cidas. Estos procedimientos son robustos siempre que las distribuciones poblacionales tengan

formas similares y en los datos no figuren valores muy atípicos.

5. ¿Cómo se lleva a cabo una prueba de la t sobre la µ?

En este capítulo se tratan diversas variaciones de la prueba de la t, pero el planteamiento gene-

ral es el siguiente:

CA

PÍT

ULO

16

Page 209: Epidemiología y bioestadística secretos   nordness1ed

1.• Se establece el estado por defecto para μ dando el valor hipotético (en H0) y lo que se pre-

tende afirmar sobre la μ para la que estamos acumulando datos (Ha).

2. a)• Se determina el cociente crítico (la diferencia entre la media de la muestra y la media

poblacional hipotética dividida por el error estándar [SE] de la media de la muestra).

b)• Se compara el cociente crítico con el valor de la t apropiado en la tabla.

3.• Se rechaza o no se rechaza la hipótesis nula (H0).

4.• Se escribe la conclusión.

6. ¿Qué es la prueba de la t pareada?

En la literatura médica, los estudios comparan con frecuencia los efectos de medicaciones en

pacientes. Por ejemplo, si se quiere investigar el efecto de las medicaciones hipocolesterole-

miantes, se pueden comparar los datos de un paciente sometido a medicación con los datos

del mismo paciente cuando no recibe medicación. Utilizando este par emparejado (también

conocido como método del antes y del después), un paciente hace las veces de su propio con-

trol. La prueba de la t considera la variación a partir de un solo grupo muestral, mientras que

en la prueba de la t de dos muestras considera la variación a partir de dos grupos independien-

tes. Por consiguiente, utilizar la prueba de la t pareada es un buen modo de centrarnos en la

variación que está determinada por el efecto de la intervención o cambios en el tiempo en el

mismo sujeto.

7. ¿Qué nueva variable se utiliza en la prueba de la t pareada?

Para llevar a cabo la prueba de la t pareada, se emplea una nueva variable (d). Esta variable

representa la diferencia entre los datos antes y después de haber introducido la intervención en

los sujetos estudiados. Se lleva a cabo esta prueba de la t en los datos de las diferencias. La

variable –d representa la diferencia media observada entre los valores iniciales (es decir, basales

o de partida) y los finales (después de aplicar la intervención) o, generalmente, para datos

pareados, la media de los datos de las diferencias.

8. ¿Qué indican los resultados de las pruebas de la t?

Se emplea el modelo de Gossett, la distribución de la t de Student, para la inferencia (prueba de

hipótesis y cálculo de intervalos de confianza) sobre medias poblacionales; en otras palabras,

para determinar (en el caso de una muestra) si la diferencia entre la media muestral y la media

poblacional supera la diferencia que podría esperarse por el azar solo, a partir de un muestreo

aleatorio. Se emplea la prueba para valorar si la diferencia es estadísticamente significativa.

9. ¿Cuáles son algunas variaciones de las aplicaciones de la prueba de la t?

Hay variaciones de la prueba de la t de Student: la prueba de una cola y la prueba de dos colas

(también conocidas como prueba unilateral y prueba bilateral). Por ejemplo, se emplea la prue-

ba de una cola cuando se investiga si μ es mayor o menor que la media hipotética, μ0, pero el

investigador está probando sólo si es «mayor que» o «menor que», no la posibilidad de que μ

pudiera ser cualquiera de ellas. Se emplea la prueba de dos colas para probar que μ no es igual

a μ0; en otras palabras, podría ser mayor que o menor que.

10. ¿Qué es el error estándar de la media muestral?

El error estándar de la media muestral (SE) es el cociente entre la desviación estándar de la

muestra y la raíz cuadrada del tamaño muestral, y se emplea en el cálculo del cociente crítico

(t) en una prueba de la t. Así como la desviación estándar describe la variabilidad de las obser-

vaciones, el error estándar mide la variabilidad de las medias. Podemos imaginar, de modo

aproximado, que el error estándar es la desviación estándar de las medias muestrales,

y «error» es el término estadístico tradicional para indicar la variación por azar.

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT212

Page 210: Epidemiología y bioestadística secretos   nordness1ed

11. ¿Cómo se calcula el error estándar en el caso de una única muestra?

En el caso de una muestra, puede calcularse el error estándar utilizando la desviación estándar

de la muestra si se conoce el tamaño de la muestra. El error estándar:

s s2

= = n n

A partir de este cálculo, se observa que a medida que aumenta el tamaño de la muestra (n),

disminuye el error estándar.

12. ¿Qué son los grados de libertad?

Los grados de libertad dependen del tamaño de la muestra, y se calculan a partir de dicho

tamaño en el caso de una muestra. En una distribución, los grados de libertad son el número

de parámetros que pueden variarse de forma independiente, y se utilizan para realizar ajustes

en el tamaño de la muestra.

13. ¿Cómo se calculan los grados de libertad en el caso de una única muestra o

de pares pareados?

En el diseño de una muestra o de pares pareados, los grados de libertad (df) se definen como

el número de observaciones menos uno (df = n – 1); en otras palabras, sólo n – 1 observaciones

pueden variar libremente. Así, si el tamaño de la muestra es 15, los grados de libertad (df)

son 14.

14. ¿Cómo se calculan los grados de libertad en el caso de dos muestras

independientes?

Con tal de que las varianzas sean iguales, los grados de libertad de dos muestras independien-

tes son la suma de los grados de libertad de cada muestra. En ocasiones se expresa del

siguiente modo:

df = (n1 – 1) + (n2 – 1) = n1 + n2 – 2. Por ejemplo, si el tamaño de una muestra es 14 y el tamaño

de la otra muestra es 17, los df (en el modelo de dos muestras) = (14 – 1) + (17 – 1) = 29.

15. ¿Por qué son importantes los grados de libertad?

Se emplean los grados de libertad, junto con el cociente crítico y el modelo de Gossett, la

distribución de la t de Student, para aproximar la verosimilitud (es decir, probabilidad) de

que un valor tan extremo como el cociente crítico ocurra por azar solo. A medida que aumen-

tan los grados de libertad, la curva t adopta un aspecto similar a la curva z normal. (Véase

la Figura 16-1.)

Moore DS: The Basic Practice of Statistics, 2nd ed. New York, W.H. Freeman & Company, 2000.

16. ¿En qué difieren los resultados de los procedimientos que utilizan la

distribución de la t con respecto a los que utilizan la distribución de la z?

Cuando se utiliza el modelo de distribución de la t frente al modelo normal (es decir, distribu-

ción z), los intervalos de confianza son ligeramente más amplios, y los valores de p, ligera-

mente mayores. La distribución de la t es diferente con respecto a la distribución normal por-

que la desviación estándar depende del tamaño de la muestra. Cuando el tamaño de las

muestras es de 30 o más, la distribución de la t y la distribución de la z son esencialmente

idénticas.

A medida que aumenta el tamaño de la muestra, la curva t se aproxima a la curva normal

con una similitud creciente. Este fenómeno se produce porque la desviación estándar de la

muestra (s) estima de modo más preciso la desviación estándar de la población (σ). Por consi-

guiente, con muestras grandes, la sustitución de σ por s causa una variación menor.

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT 213

Page 211: Epidemiología y bioestadística secretos   nordness1ed

17. ¿Qué son los cocientes críticos?

Las diferentes variaciones de las pruebas de la t apoyan conclusiones sobre medias poblacio-

nales calculando un cociente denominado cociente crítico. Se compara este cociente crítico

con valores en una tabla estadística (p. ej., una tabla de valores de la t) en relación con los gra-

dos de libertad observados. En los Apéndices A y B de este libro se incluyen las tablas estadís-

ticas. Se define el cociente crítico para las medias como la diferencia entre las medias muestra-

les y poblacionales, dividida por el error estándar de la media de la muestra.

Diferencia entre la media muestral y la media poblacionalCociente crítico =

Error estándar de la media muestral

o bien, utilizando los símbolos estadísticos:

x– – μot =

s/ n

[x– = media de la muestra; μo = media hipotética de la población; s = desviación estándar de la

muestra; n = tamaño de la muestra]

18. ¿Cómo se calculan los cocientes críticos en la prueba de una muestra sobre la

media?

Supongamos que reunimos la siguiente información en relación con la prueba de una muestra:

la media de la muestra es 10, la media poblacional es 9,6, y la desviación estándar es 1, en una

muestra de tamaño 16. Entonces:

x– – μo 10 – 9,6 0,4Cociente crítico = t = = = = 1,6

s/ n 1/ 16 0,25

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT214

Figura 16-1. Grados de libertad. La línea ininterrumpida, distribución normal estandarizada; línea derayas interrumpidas, distribución de la t con 9 grados de libertad, y línea de puntos, distribución de la tcon 4 grados de libertad.

0,4

0,3

0,2

0,1

0

Page 212: Epidemiología y bioestadística secretos   nordness1ed

19. ¿Cómo se calculan los cocientes críticos en relación con los datos pareados?

Supongamos que reunimos datos para un diseño de datos pareados. Tenemos dos conjuntos

de datos que son pares apareados. Por ejemplo, el conjunto de datos 1 está recogido a partir

de nueve sujetos antes de una intervención y el conjunto de datos 2 está recogido de los mis-

mos nueve sujetos después de la intervención. La primera medida es calcular la diferencia de

los datos (d) y a continuación aplicar a este conjunto de datos los procedimientos para una

muestra. Tenemos en mente que f para los datos de las diferencias será siempre 0 si no hay

diferencias en los datos de pares pareados. Supongamos que la media de la muestra (de los

datos de las diferencias) es –1,2 y que la desviación estándar de la muestra (de los datos de las

diferencias) es 1, en una muestra de tamaño 9. Entonces:

d–

– μo –1,2 – 0 –1,2Cociente críticod = td= = = = –3,6

Sd/ n 1/ 9 1/3

Los subíndices d son una señal de que estos cálculos son sobre los datos de diferencias en

relación con los datos pareados. En la prueba de la t pareada, la media sólo se calcula una vez.

Por consiguiente, sólo se pierde un grado de libertad.

20. ¿Cómo se calculan los cocientes críticos en una prueba con datos de dos

muestras?

En el caso de una prueba de dos muestras, éstas han de ser independientes, y cada muestra

debe proceder de una población normal subyacente de las que se desconocen las desviaciones

estándar poblacionales.

t = (–x1 – –x 2) – (μ1 – μ2)

Obsérvese que ponemos con los correspondientes subíndices las cantidades asociadas con las

muestras 1 y 2. En ocasiones, μ1-μ2 = 0, y el cálculo se convierte en

–x1 – –x2t =

SED (–x1 – –x2)

21. ¿Cómo se calcula el error estándar de la diferencia (SED) y los grados de

libertad cuando se comparan dos muestras independientes?

Los cálculos para la situación de dos muestras son muy engorrosos y, generalmente, se utiliza el

apoyo de la tecnología. Tenemos dos elecciones para los cálculos de la SED (–x1 – –x2) y de los df:

1) no agrupados (cuando se sabe que las poblaciones subyacentes no tienen igual varianza), y

2) agrupados (cuando deseamos suponer que las poblaciones subyacentes tienen igual varianza).

s12 s2

2

Para no agrupados, SED (–x1 – x2) = +n1 n2

s12 s2

2

( + )2

n1 n2

df =

1 s12 1 s2

2( )2

+ ( )2

n1 – 1 n1 n2 – 1 n2

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT 215

(se redondea este valor hacia abajo hasta el número •

entero más próximo)

Page 213: Epidemiología y bioestadística secretos   nordness1ed

En cuanto a las agrupadas, calculamos en primer lugar la varianza común:

(n1 – 1)s12 + (n2 – 1)s2

2

sp2 =

n1 + n2 – 2

sp2 sp

2

SED agrupadas(–x1 – –x2 = + y df = (n1 – 1) + (n2 – 1) = n1 + n2 – 2

n1 n2

22. ¿Qué indica el tamaño del cociente crítico?

En cada caso, buscamos el cociente crítico en la tabla estadística apropiada, para determinar el

valor de p (es decir, la probabilidad de que la media observada se deba al azar sólo). Cuanto

mayor sea el cociente crítico (y menor la p), más probable es que la diferencia entre la media

de la muestra y la poblacional hipotética (o medias) no se deba a la variación por azar, y que la

diferencia sea estadísticamente significativa. En general, en la literatura médica, se considera

que la diferencia es significativa si el valor de p es ≤ 0,05. Se emplea en la tabla los grados de

libertad para ajustar los cocientes críticos por el tamaño de la muestra. Cuando se utilizan las

tablas, hay que considerar el valor absoluto del cociente crítico (p. ej., si t = –2,50, hay que cal-

cular las probabilidades utilizando la t = 2,50).

23. ¿Qué son las pruebas de una cola y de dos colas?

Cuando llevamos a cabo pruebas de significación, comenzamos con una hipótesis nula (H0),

afirmación por defecto sobre nuestro parámetro poblacional hipotético. La prueba valora la

fuerza de los datos contra la H0. La hipótesis alternativa (Ha) indica el efecto para el que espe-

ramos encontrar datos que nos apoyen. La Ha puede ser de un lado (por ejemplo, Ha = µ > 0 o

Ha = µ < 0) o de dos lados (por ejemplo, Ha: µ ≠ 0). La hipótesis alternativa de un lado establece

el interés en los efectos extremos en una dirección o en la otra, mientras que las pruebas de

dos lados tratan de ver si el parámetro de interés difiere en algún valor.

24. ¿Cómo completamos una prueba de la t de una muestra?

Nuestra situación es como sigue: tenemos 10 pacientes femeninas sanas de edades com-

prendidas entre 30 y 35 años, que nunca realizan ejercicio físico. La Tabla 16-1 nos proporcio-

na la lectura de la densidad ósea de cadera más reciente de cada paciente (mg/cm2). ¿Propor-

cionan estos datos una prueba concluyente al nivel de significación del 5% de que las pacien-

tes femeninas sanas de edades entre 30 y 35 años que nunca realizan ejercicio físico tienen

unos resultados de densidad ósea inferiores al promedio de 945 mg/cm2?

1. Para una H0 µ = 945 y para una Ha µ < 945 [prueba de la cola izquierda, a un lado]

–x – µ 940,6 – 9452. t = = t ~ ~ –1,1933, y df = 10 – 1 = 9

s/ n 11,66/ 10

De la Tabla 16-2, para una superficie en la cola izquierda de la distribución de la t que sea

menor del 5% con 9 grados de libertad, nuestro cociente crítico es ≤ -1,833. El valor de t es

–1,1933, que es > –1,8333 (es decir, lejos de 0).

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT216

TA B L A 1 6 - 1 . L E C T U R A M Á S R E C I E N T E D E D E N S I DA D Ó S E A E N L A C A D E R A ( m g / c m 2 )E N 1 0 PA C I E N T E S

Paciente 1 2 3 4 5 6 7 8 9 10

Densidad ósea 948 940 950 920 936 952 958 934 940 928

Page 214: Epidemiología y bioestadística secretos   nordness1ed

*Para una t calculada, si t (valor absoluto de t) es mayor que el valor mostrado, se rechaza la hipótesis nula.aVéase punto 24.bVéase punto 25.cVéase punto 27.

TABLA 16-2 . N IVEL DE S IGNIF ICACIÓN PARA LA PRUEBA DE LA t DE STUDENT UNIDIRECCIORAL*

df

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

40

60

120

χ

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT 217

0,000

636,619

31,598

12,941

8,610

6,859

5,959

5,405

5,041

4,781

4,587

4,437

4,318

4,221

4,140

4,073

4,015

3,965

3,922

3,883

3,850

3,819

3,792

3,767

3,745

3,725

3,707

3,690

3,674

3,659

3,646

3,551

3,460

3,373

3,291

0,01

31,821

6,965

4,541

3,747

3,365

3,143

2,998

2,896

2,821

2,764

2,718

2,681

2,650

2,624

2,602

2,583

2,567

2,552

2,539

2,528

2,518

2,508

2,500

2,492

2,485

2,479

2,473

2,467

2,462

2,457

2,423

2,390

2,358

2,326

0,10

3,078

1,886

1,638

1,533

1,476

1,440

1,415

1,397

1,383

1,372

1,363

1,356

1,350

1,345

1,341

1,337

1,333

1,330

1,328

1,325

1,323

1,321

1,319

1,318

1,316

1,315

1,314

1,313

1,311

1,310

1,303

1,296

1,289

1,282

0,05

6,314

2,920

2,353

2,132

2,015

1,943

1,895

1,860

1,833a

1,812

1,796

1,782b

1,771

1,761

1,753

1,746

1,740

1,734

1,729

1,725

1,721

1,717

1,714

1,711

1,708

1,706

1,703

1,701

1,699

1,697

1,684

1,671

1,658

1,645

0,025

12,706

4,303

3,182

2,776

2,571

2,447

2,365

2,306

2,262

2,228

2,201

2,179

2,160

2,145

2,131

2,120

2,110

2,101

2,093

2,086

2,080c

2,074

2,069

2,064

2,060

2,056

2,052

2,048

2,045

2,042

2,021

2,000

1,980

1,960

0,005

63,657

9,925

5,841

4,604

4.032

3,707

3,499

3,355

3,250

3,169

3,106

3,055

3,012

2,977

2,947

2,921

2,898

2,878

2,861

2,845

2,831

2,819

2,807

2,797

2,787

2,779

2,771

2,763

2,756

2,750

2,704

2,660

2,617

2,576

Page 215: Epidemiología y bioestadística secretos   nordness1ed

3.• No podemos rechazar la H0.

4.• A tenor de estos datos, no tenemos pruebas significativas al nivel del 5% para concluir que las

pacientes femeninas sanas de edades comprendidas entre 30 y 35 años que nunca realizan

ejercicio físico tengan resultados de densidad ósea menores que el promedio de 945 mg/cm2.

25. ¿Cómo completamos una prueba de la t de pares pareados?

Consideremos el siguiente ejemplo: tenemos 13 pacientes a los que hemos estado tratando

con hipocolesterolemiantes. La Tabla 16-3 indica la concentración de colesterol total antes del

tratamiento y después de 60 días de medicación. ¿Proporcionan estos datos pruebas suficien-

tes a nivel de significación del 5% para concluir que la medicación produjo una reducción en la

concentración de colesterol?

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT218

TA B L A 1 6 - 3 . C O L E S T E R O L TOTA L A N T E S Y D E S P U É S D E L T R ATA M I E N TO

Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13

Antes del 220 240 190 210 250 230 240 250 230 225 180 200 230

tratamiento

Después del 198 199 182 200 228 215 200 190 200 208 160 175 220

tratamiento

Para completar una prueba de datos pareados, hay que calcular primero los datos de lasdiferencias (Tabla 16-4). Una «reducción en la concentración del colesterol total» significa quela diferencia que calculamos (antes y después) es mayor que cero.

1.• Para una H0 μd = 0 y para Ha μd > 0 [prueba de la cola derecha, a un lado]

De la Tabla 16-2, para que la superficie en la cola izquierda de la distribución t sea menorque del 5% para 12 grados de libertad, nuestro cociente crítico debe ser • 1,782. El valor de tes 5,9457, que es • 1,7823. Rechazamos firmemente H0.4. A tenor de estos datos, tenemos fuertes pruebas al nivel de significación del 5% para con-

cluir que la medicación produjo una reducción en la concentración del colesterol total.

26. ¿Cómo completamos una prueba de la t de dos muestras?

Consideremos el siguiente ejemplo: queremos probar la efectividad de una nueva medicaciónfrente a la cefalea. Aleatorizamos a 12 pacientes con cefaleas al grupo experimental que tomala medicación durante 1 mes, y a 12 pacientes con cefaleas a un grupo control que tomaplacebo durante 1 mes. Los pacientes vuelven y completan el Headache Assessment Survey.

d–

– μ 24,19 – 02. td = ~ ~ 5,9457 y df 13 – 1 = 12

sd / n 14,93/ 13

TA B L A 1 6 - 4 . C Á L C U L O D E L A S D I F E R E N C I A S

Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13

Datos de las 22 41 8 10 22 15 40 60 30 17 20 25 10

diferencias:

antes-después

Page 216: Epidemiología y bioestadística secretos   nordness1ed

(–xE – –xC) sE2 sc

2 18,562 16,642

2.• t = y SED(–xE ––xc) = + = ~ + ~ 7,196

SED (–xE – –xC) nE nC 12 12

(–xE – –xC) 58,67 – 48,5Por consiguiente: t = ~ = 1,413 y

SED((–xE – –xC) 7,196

Por consiguiente, redondeando hacia abajo, se emplea df = 21. De la Tabla 16-6, para que el

área en ambas colas de la distribución de la t sea menor del 5%, nuestro cociente crítico ha

de ser • 2,080. El valor de t es 1,413, que es • 2,080.

3.• No podemos rechazar la H0.

4.• A tenor de estos datos, no tenemos pruebas al nivel de significación del 5%, para concluir

que los resultados del Headache Assessment Survey son diferentes en el grupo experimen-

tal con respecto al grupo control.

27. ¿Puede utilizarse la tabla de una cola para calcular un valor de p para una

prueba de dos colas, como en la pregunta anterior?

Sí. Sin embargo, en ocasiones sólo se dispone de tablas de una sola cola. Dado que la distribu-

ción de la t es simétrica con respecto a cero, pueden efectuarse fácilmente los cálculos utilizan-

do las tablas de una cola. El ardid consiste en dividir la probabilidad deseada por 2, para dar

cuenta de ambas colas. Por ejemplo, en la pregunta 26, utilizando una tabla de dos colas

observamos que nuestro cociente crítico ha de ser mayor que 2,080 para una probabilidad de

por lo menos el 95% para rechazar correctamente la hipótesis nula. Utilizando una tabla de una

cola, elegiríamos 0,025 como la «probabilidad de la cola» porque se consideraron ambas

colas. Esta «probabilidad de la cola» sería 0,025 � 2 = 0,05, el valor utilizado directamente en

una tabla de dos colas. Utilizando ahora df = 21 y un valor de probabilidad de 0,025 en una

tabla de una cola, encontramos que el cociente crítico ha de ser mayor que 2,080, que precisa-

mente es el resultado obtenido a partir de la tabla de dos colas. (Véase la Tabla 16-2.)

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT 219

Los resultados se expresan en la Tabla 16-5. ¿Proporcionan estos datos prueba al nivel designificación del 5% para concluir que los resultados en el Headache Assessment Survey sondiferentes en los grupos experimental y frente al control?No suponemos que las poblaciones de base (es decir, Headache Assessment Survey Resultspara todos los pacientes que toman la medicación y Headache Assessment Survey Resultspara todos los pacientes que toman el placebo) tienen varianzas iguales. Así, completamos loscálculos no agrupados.

1.• Para H0, μE = μC y para Ha, μE • μC [prueba de dos colas con dos lados]

s12 s2

2 (18,562 16,642

( + )2

( + )2

n1 n2 12 12 2.681,196df = ~ ~ ~ 21,74

1 s12 1 s2

2 21 18,562 1 16,642( )

2

+ ( ) + ( )2

+ ( )2

n1 – 1 n1 n2 – 1 n2 12 – 1 12 12 – 1 12

TA B L A 1 6 - 5 . P U N T UA C I O N E S E N E L H E A DA C H E S U R V E Y

Grupo experimental 64 56 36 55 20 70 80 77 68 60 78 40

Grupo control 33 50 45 80 22 40 64 50 72 44 34 48

123,314

Page 217: Epidemiología y bioestadística secretos   nordness1ed

TA B L A 1 6 - 6 . N I V E L D E S I G N I F I C A C I Ó N PA R A U N A P R U E BA D E L A t D E S T U D E N T B I D I R E C C I O N A L *

df

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

40

60

120

χ

0,001

636,619

31,598

12,941

8,610

6,859

5,959

5,405

5,041

4,781

4,587

4,437

4,318

4,221

4,140

4,073

4,015

3,965

3,922

3,883

3,850

3,819

3,792

3,767

3,745

3,725

3,707

3,690

3,674

3,659

3,646

3,551

3,460

3,373

3,291

0,02

31,821

6,965

4,541

3,747

3,365

3,143

2,998

2,896

2,821

2,764

2,718

2,681

2,650

2,624

2,602

2,583

2,567

2,552

2,539

2,528

2,518

2,508

2,500

2,492

2,485

2,479

2,473

2,467

2,462

2,457

2,423

2,390

2,358

2,326

0,20

3,078

1,886

1,638

1,533

1,476

1,440

1,415

1,397

1,383

1,372

1,363

1,356

1,350

1,345

1,341

1,337

1,333

1,330

1,328

1,325

1,323

1,321

1,319

1,318

1,316

1,315

1,314

1,313

1,311

1,310

1,303

1,296

1,289

1,282

0,10

6,314

2,920

2,353

2,132

2,015

1,943

1,895

1,860

1,833

1,812

1,796

1,782

1,771

1,761

1,753

1,746

1,740

1,734

1,729

1,725

1,721

1,717

1,714

1,711

1,708

1,706

1,703

1,701

1,699

1,697

1,684

1,671

1,658

1,645

0,05

12,706

4,303

3,182

2,776

2,571

2,447

2,365

2,306

2,262

2,228

2,201

2,179

2,160

2,145

2,131

2,120

2,110

2,101

2,093

2,086

2,080a

2,074

2,069

2,064

2,060

2,056

2,052

2,048

2,045

2,042

2,021

2,000

1,980

1,960

0,01

63,657

9,925

5,841

4,604

4.032

3,707

3,499

3,355

3,250

3,169

3,106

3,055

3,012

2,977

2,947

2,921

2,898

2,878

2,861

2,845

2,831

2,819

2,807

2,797

2,787

2,779

2,771

2,763

2,756

2,750

2,704

2,660

2,617

2,576

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT220

*Para una t calculada, si t (valor absoluto de t) es mayor que el valor mostrado, se rechaza la hipótesis nula.aVéase punto 24.

Page 218: Epidemiología y bioestadística secretos   nordness1ed

28. ¿Qué son los intervalos de confianza?

El intervalo de confianza (CI) es un intervalo para englobar un parámetro poblacional (p. ej., lamedia o μ) con unos valores extremos calculados a partir de los datos como sigue: –x ± (coefi-ciente de confianza/(SE). Se elige el coeficiente de confianza para dar una estimación que darálugar a un nivel de confianza dado de que el parámetro se encontrará dentro de los límites delintervalo. Por ejemplo, para un CI del 95%, el coeficiente de confianza es el valor de t, tomadoa partir de la tabla apropiada, que separa el 95% central de la distribución del área de la cola.

29. ¿Cómo se calcula un intervalo de confianza del 95%?

Supongamos que tenemos un conjunto de datos apropiado para el que n = 18, –X = 42, y

s = 6,3. Creamos un IC del 95% para μ, la verdadera media de la población de la que procede elconjunto de datos.

Nota: Dado que df = 18 – 1 = 17, el cociente crítico (tc) = 2,110 para una prueba de dos colas

(Véase la Tabla 16-2.)

x ± (coeficiente de confianza del 95%)(SE) = 42 ± 2,110 (6,3/ 18)

42 – 2,110(6,3/ 18) ~ 38,87 y 42 + 2,110(6,3/ 18) ~ 45,13

Por consiguiente, el IC del 95% es (38,87, 45,13), y podemos decir que, si recogemos datossimilares muchas veces y calculamos intervalos de confianza del 95% a partir de los datos, el95% de los intervalos de confianza contendrían la verdadera media poblacional.

30. ¿Cómo sabemos si se debe emplear la t o la z?

Utilizando los principios de inferencia estadística, podemos extraer conclusiones generalizadassobre una población utilizando datos a partir de una muestra aleatoria. Los procedimientospara construir intervalos de confianza sobre μ (es decir, la media poblacional) con σ (es decir,desviación estándar de la población) desconocida, son similares a cuando σ es conocida. Sinembargo, se utiliza s en lugar de σ, y t (para la distribución de la t) se utiliza en lugar de z (parala distribución normal). Por consiguiente, cuando se conoce σ, se construyen intervalos z, ycuando no se conoce σ, se construyen intervalos t.

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT 221

PUNTOS CLAVE: LA DISTRIBUCIÓN DE LA t Y LA PRUEBA DE LA t DE STUDENT

1.• Cuando se emplean procedimientos de la t, los supuestos son que: 1) la muestra es una muestra

aleatoria simple procedente de una población con una distribución aproximadamente normal;

2) la desviación estándar de la población es desconocida, y 3) el tamaño muestral es inferior

a 30 en una o en las dos muestras.

2.• Se emplea la prueba de la t para comparar la media de una muestra y la media poblacional, dos

muestras independientes o la misma muestra en dos momentos diferentes (con frecuencia, antes

y después de un tratamiento).

3.• La distribución de la t es similar a la distribución normal en tres aspectos: 1) es simétrica en torno

al 0; 2) tiene forma de campana, y 3) tiene un único pico.

4.• La distribución de la t difiere de la distribución normal en que: 1) la distribución de la t tiene unas

colas mayores que las de la distribución normal (es decir, la distribución de la t tiene más

probabilidad en las colas); 2) un mayor número de grados de libertad (df) significa colas

más pequeñas (por tanto, cuanto mayores sean los grados de libertad, más próxima

a la distribución normal), y 3) unos df más pequeños significan unas colas más grandes.

5.• En muestras mayores de 30, la distribución de la t es casi idéntica a la distribución normal (es decir,

a la distribución de la z).

Page 219: Epidemiología y bioestadística secretos   nordness1ed

31. ¿Cómo varía la amplitud de un intervalo de confianza y cómo afecta a su

utilidad?

La utilidad del intervalo viene determinada por su amplitud (es decir, la diferencia entre los

valores extremos superior e inferior). Unos intervalos amplios no aportan información precisa

sobre la localización de la verdadera media poblacional. Además, unos intervalos amplios pue-

den indicar que la recogida de más datos puede ayudar a describir algo firme sobre un paráme-

tro dado. Unos intervalos reducidos proporcionan una mejor información sobre la localización

de la media poblacional.

32. ¿De qué modo difiere la amplitud del intervalo de confianza con los cambios

en el nivel de confianza?

Si el tamaño de la muestra n permanece igual, la disminución del nivel de confianza de un

intervalo disminuye la anchura del intervalo de confianza, y el aumento del nivel de confianza

de un intervalo aumenta su precisión. Generalmente, se eligen niveles de confianza del 95%,

pero se pueden considerar los intervalos de confianza del 90, 99 y 99,9%.

33. ¿Qué es la suma de cuadrados?

La suma de cuadrados (SS) o la suma de cuadrados total (TSS) se define como la suma de los

cuadrados de las desviaciones estándares. La SS y la TSS suelen asociarse con el análisis de la

varianza (ANOVA), un método específico para analizar la variación entre múltiples grupos.

34. ¿Qué es el ANOVA? ¿Cuándo se utiliza?

Es una prueba estadística de significación, diseñada para determinar si existe una diferencia

significativa entre múltiples medias muestrales. El estadístico F relaciona el cociente de la

varianza que se da entre las medias, con la varianza que se produce dentro de los propios gru-

pos. Cuanto mayor sea el estadístico F, más significativo es el resultado. Se calcula la SS para

calcular el estadístico F del ANOVA.

35. ¿Qué es la ji al cuadrado? ¿Cuándo se utiliza?

La prueba de la ji al cuadrado es una prueba de significación estadística que no analiza de

modo específico un parámetro poblacional (como la media). Se emplea la prueba de la ji al

cuadrado en dos situaciones:■ Bondad del ajuste: esta prueba de hipótesis trata del aspecto de si la distribución de un con-

junto de datos dado en categorías «se ajusta» a una distribución de datos uniforme.■ Independencia: esta prueba de hipótesis trata el aspecto de si se relacionan las categorías

en una tabla de contingencia de dos por dos.

LA DISTRIBUCIÓN DE LA t DE STUDENT Y LA PRUEBA DE LA t DE STUDENT222

BIBLIOGRAFÍA

1.• Altman DG: Practical Statistics for Medical Research. Boca Raton, FL, CRC Press, 1990.2.• Bland M: An Introduction to Medical Statistics, 3rd ed. Oxford, Oxford University Press, 2000.3.• Dawson BK: Basic and Clinical Biostatistics, 3rd ed. New York, McGraw-Hill/Appleton & Lange, 2000.4.• Moore DS: The Basic Practice of Statistics, 2nd ed. New York, W.H. Freeman & Company, 2000.5.• “Student” (W.S. Gosset): The probable error of a mean. Biometrika 6(1):1–25, 1908.6.• Zar JH: Biostatistical Analysis, 4th ed. Princeton, NJ, Prentice Hall, 1999.

PÁGINA WEB

http://www.csm.ornl.gov

Page 220: Epidemiología y bioestadística secretos   nordness1ed

223

ANÁLISIS BIVARIANTEMoore H. Jan, MD, MPH

1. ¿Qué es un análisis bivariante?

El análisis univariante implica la recogida y análisis de los datos en una variable. En el análisis

bivariante, se extiende este proceso a dos variables.

2. ¿Por qué se realiza el análisis bivariante?

El análisis bivariante se realiza cuando se cree que puede haber alguna asociación entre las dos

variables. Clásicamente, se investiga una relación entre un factor de riesgo (una variable inde-

pendiente) y un desenlace de salud (una variable dependiente). Este capítulo examina alguno

de los métodos empleados en el análisis bivariante.

3. ¿Indica una relación causal una asociación observada?

No. Encontrar una asociación es, sencillamente, el primer paso para apoyar una relación de

causa a efecto entre dos variables.

4. ¿Qué métodos se emplean para determinar asociaciones entre variables?

Se utilizan varios métodos estadísticos para identificar asociaciones. En gran medida, los

métodos que pueden utilizarse dependen de las características de los datos.

5. ¿Cuál es la primera buena pregunta que podríamos plantearnos al elegir

un método estadístico?

Una primera buena cuestión es si los datos son cuantitativos o cualitativos. Los datos cuantita-

tivos son numéricos, con cierto sentido de rango o de orden. Los datos cualitativos son

categóricos, como el sexo (p. ej., hombre o mujer) o la raza.

6. ¿Se puede realizar una nueva agrupación de los datos cuantitativos?

Sí. Los datos cuantitativos pueden someterse a una nueva agrupación en datos continuos o

discretos.

7. ¿Hay restricciones en los valores que se pueden asignar a una variable

continua?

No hay restricciones sobre el valor que puede adoptar una variable continua. Una variable

diseñada para medir la altura humana es un claro ejemplo de una variable cuantitativa conti-

nua. Se puede asignar también un valor a cualquier valor a lo largo del continuo de los pesos

potenciales.

8. ¿Qué hay de discreto en los datos discretos?

Los datos discretos pueden tomar sólo ciertos valores. Por ejemplo, una variable designada

como el número de nevus en una persona puede asumir sólo valores de números enteros

(p. ej., 0, 1, 2, 3...)

CA

PÍT

ULO

17

Page 221: Epidemiología y bioestadística secretos   nordness1ed

9. ¿Importa el modo de presentación de los datos cuando se decide por los

mejores métodos de análisis?

Sí. En el análisis bivariante de los datos se deben considerar las propiedades de cada variable,

porque cada una de ellas puede tener características diferentes. Por ejemplo, un conjunto de

datos compuesto de determinaciones individuales de la presión sanguínea y edades en años

representa el emparejamiento de datos continuos y discretos. La selección de la herramienta

del mejor análisis depende de ambas variables.

10. ¿Qué son datos pareados?

En los datos pareados se supone que el valor de una variable se asocia con el valor de la otra,

por lo general porque representan datos de una entidad u objeto único (p. ej., un individuo).

Que los datos sean o no pareados restringe también la elección de los métodos estadísticos

bivariantes.

11. ¿Hay consideraciones con respecto a nuestro análisis cuando tratamos con

datos continuos?

Sí. En relación con los datos continuos tenemos que considerar la distribución de los datos y

preguntarnos, ¿podemos suponer que existe una distribución normal?

12. ¿Qué son las pruebas paramétricas?

Muchas pruebas adoptan normalidad (es decir, los datos siguen una distribución normal o

binomial), y reciben la denominación de pruebas paramétricas. Entre las pruebas paramétricas

figuran la prueba de correlación de Pearson y la regresión lineal.

13. ¿Qué sucede si no se puede hacer el supuesto de normalidad en el conjunto

de datos?

Reciben la denominación de pruebas no paramétricas las que no hacen suposición de normali-

dad. Entre los ejemplos de pruebas no paramétricas figuran la prueba de Wilcoxon, la prueba

de la U de Mann-Whitney, la prueba de Kruskal-Wallis y la prueba de McNemar. Puede ser difí-

cil decidir si se deben utilizar pruebas paramétricas o no paramétricas. En ocasiones, son de

utilidad las pruebas de normalidad.

14. Enumere los métodos utilizados habitualmente para analizar datos continuos

cuantitativos.

■ Diagramas de dispersión.■ Correlación de Pearson.■ Correlación de rangos de Spearman (no paramétrica).■ Prueba de Wilcoxon (no paramétrica).■ Prueba de la U de Mann-Whitney (no paramétrica).■ Prueba de Kruskal-Wallis (no paramétrica).

15. ¿Qué es un diagrama de dispersión?

Un diagrama de dispersión es, probablemente, la forma más sencilla de un análisis bivariante,

pero este ejercicio elemental puede aportar mucha información significativa por el poder del

medio visual. Puede aplicarse un diagrama de dispersión a los datos continuos o a los datos

discretos, o a una combinación de ellos.

16. ¿Qué otros términos recibe un diagrama de dispersión?

Sinónimos de diagrama de dispersión son nube de puntos, nube de dispersión y gráfica de dis-

tribución de conjunto.

ANÁLISIS BIVARIANTE224

Page 222: Epidemiología y bioestadística secretos   nordness1ed

17. ¿Cómo se crea un diagrama de dispersión?

Para crear un diagrama de dispersión, sencillamente, se representa una variable frente a otra

en una gráfica con el eje de las x y el de las y, creando un conjunto de puntos. A continuación,

puede examinarse esta «nube de puntos» en busca de cualquier relación visual. Puede ilus-

trarse el poder de este método por el diagrama (Fig. 17-1) del valor de las monedas en el

bolsillo izquierdo de una muestra de hombres en una clase de bioestadística, representado

frente al tamaño de los zapatos.

ANÁLISIS BIVARIANTE 225

Figura 17-1. Ejemplo de un diagrama de dispersión.

Tamaño del zapato

1,2

1

0,8

0,6

0,4

0,2

0

Cambio (monedas) en el bolsillo frente al tamañodel zapato en un grupo de varones

Valo

r d

el cam

bio

en

el b

ols

illo

izq

uie

rdo

151050

18. ¿De qué modo puede ser útil un diagrama de dispersión?

Un diagrama de dispersión puede ser muy útil en el análisis inicial de datos cuantitativos biva-

riantes. Por ejemplo, un rápido vistazo a la Figura 17-1 sugiere que no hay relación entre la

cantidad de cambio (monedas) en el bolsillo izquierdo de un varón y el tamaño de sus zapatos.

19. ¿Cuál es una debilidad importante del diagrama de dispersión?

Un diagrama de dispersión no es cuantitativo y, con frecuencia, es útil tener un valor numérico

que indique la magnitud de la relación o asociación entre las dos variables.

20. ¿Qué es el coeficiente de correlación de Pearson?

Si queremos examinar la relación o asociación entre dos variables continuas de modo cuantita-

tivo, podemos calcular el coeficiente de correlación de Pearson, también conocido como la

correlación producto-momento o coeficiente de correlación poblacional.

21. ¿Cómo podemos decir cuál es la variable independiente (es decir, la

predictora) y cuál es la variable dependiente (es decir, el desenlace) a partir de

un coeficiente de correlación?

No podemos. Es importante observar que aquí no se hace supuesto alguno sobre la interde-

pendiencia de las variables: ninguna de ellas está en función de la otra. En efecto, se considera

que cada una depende de la otra. Nuestro interés aquí no es tanto la predicción del valor de las

variables como la determinación de la asociación entre las dos variables.

Page 223: Epidemiología y bioestadística secretos   nordness1ed

22. ¿Cómo se calcula el coeficiente de correlación de Pearson?

Puede calcularse el coeficiente de correlación de Pearson utilizando uno de los muchos progra-

mas de estadística por ordenador. Una fórmula para su cálculo es como sigue:

(•xi)(•yi)•(xiyi) – nr =

(•xi)2 (•yi)

2( •xi2 – )( •yi

2 – )n n

donde r es el coeficiente de correlación de Pearson, y xi e yi son los valores pareados de las

variables asociadas.

23. ¿Cuál es el recorrido de los valores que puede tener r?

El coeficiente de correlación r toma un valor que va desde –1 a +1. Un valor de r = 1 sugiere

una correlación positiva perfecta en la que puede describirse la asociación entre x e y por

una línea recta con una pendiente positiva. Un valor de r = –1 indica una correlación negativa

perfecta.

ANÁLISIS BIVARIANTE226

PUNTOS CLAVE: COEFICIENTE DE CORRELACIÓN DE PEARSON

1.• Ambas variables son continuas.

2.• Ambas variables se hallan distribuidas normalmente.

3.• Los datos son pareados.

24. ¿Cuál es la finalidad del coeficiente de correlación de Pearson?

El coeficiente de correlación de Pearson expresa, en términos cuantitativos, la asociación suge-

rida por un diagrama de dispersión de las dos variables. Un valor de r = 0 implica una ausencia

total de asociación, mientras que los valores r = 1 y r = –1 implican asociaciones positivas y

negativas perfectas, respectivamente. Aunque la correlación es muy valiosa en el análisis ini-

cial, es importante observar que la correlación no indica una relación de causa a efecto, y que

la correlación cero no excluye una relación entre las dos variables. La Figura 17-2 ofrece varios

ejemplos de diagramas de dispersión que dan diferentes valores de r.

25. Considere el siguiente ejemplo hipotético, con datos pareados de altura

y peso.

La Tabla 17-1 resume los datos de altura y peso de los miembros de una clase hipotética de

bioestadística. La Figura 17-3 muestra el diagrama de dispersión correspondiente. Queda

implícita una correlación positiva. Para estos datos,

(1.258) – (3.188)224.866 –

18r de Pearson = = 0,833

(1.258)2 (3.188)2

88.280 – 581.622 –18 18

Este valor indica una correlación positiva elevada (es decir, cercana a 1). ¿Implica una relación

de causa a efecto? No. La correlación de Pearson no hace hipótesis sobre causa y efecto ni

sobre dependencia.

Page 224: Epidemiología y bioestadística secretos   nordness1ed

26. Recoge usted las puntuaciones de los exámenes finales y las tasas

de asistencia a clase (en porcentajes) en relación con un grupo de estudiantes

universitarios matriculados en un curso de inglés. La correlación de las dos

variables es 0,23. ¿Cuál es su interpretación?

Es una relación positiva baja, lo que sugiere una baja relación. Sin embargo, esta conclusión no

es necesariamente cierta. Debe examinarse el diagrama de dispersión para valorar formas más

sutiles de relación.

27. ¿Qué es la regresión lineal?

Un método más sofisticado para el análisis de dos variables continuas cuantitativas es la regre-

sión lineal simple («simple» indica aquí que sólo hay dos variables). Hay ciertas similitudes

entre este método y la correlación, pero en la regresión lineal una variable se considera depen-

diente de la otra.

28. ¿Puede utilizarse la regresión lineal como herramienta de predicción?

En cierto sentido, estamos valorando si puede utilizarse el valor de una variable independiente

para predecir el valor de la variable dependiente. Un ejemplo de una aplicación podría ser si se

puede utilizar el peso (la variable independiente) para predecir la presión sanguínea (la variable

dependiente). En una regresión lineal simple, se determina el «mejor ajuste» de los datos en el

que la variable dependiente se representa en el eje de las y frente a la variable independiente en

el eje de las x. La Figura 17-4 muestra una línea del «mejor ajuste» trazada en relación con un

conjunto de datos ficticios razonablemente bien correlacionados.

29. ¿Cuál es la función de la línea en la regresión lineal simple determinada?

Sabemos por el álgebra que una línea recta puede ser descrita como y = mx + b, donde m es la

pendiente y b es la intersección en el eje y. Puede determinarse el «mejor ajuste» de m y b por

un planteamiento matemático denominado método de los mínimos cuadrados. Este método

proporciona los siguientes valores para m y b:

ANÁLISIS BIVARIANTE 227

Figura 17-2. Cuatro diagramas de dispersión. (De Brochert A: Platinum Vignettes: Behavioral Scienceand Biostatistics. Philadelphia, Hanley & Belfus, 2003.)

Sin correlación (r = 0) Fuerte correlación negativa (r = +0,7)

Correlación negativa perfecta (r = –1,0) Débil correlación positiva (r = +0,3)

Page 225: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS BIVARIANTE228

TA B L A 1 7 - 1 . • DATO S D E L A A LT U R A Y D E L P E S O D E L O S M I E M B R O S D E U N A C L A S E

H I P OT É T I C A D E B I O E S TA D Í S T I C A

Individuo

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

xy

10.032

12.744

12.420

17.472

13,940

14.516

11.658

13.468

7.440

6.540

11.868

9.045

14.454

14.076

11.340

15.403

13.206

15.244

224.866

y2

23.104

31.329

32.400

50.176

42.025

36.481

30.276

33.124

14.400

11.881

29.584

18.225

39.204

41.616

26.244

44.521

34.596

42.436

581.622

Altura (pulgadas),

x

66

72

69

78

68

76

67

74

62

60

69

67

73

69

70

73

71

74

1.258

Peso (libras),

y

152

177

180

224

205

191

174

182

120

109

172

135

198

204

162

211

186

206

3.188

x2

4.356

5.184

4.761

6.084

4.624

5.776

4.489

5.476

3.844

3.600

4.761

4.489

5.329

4.761

4.900

5.329

5.041

5.476

88.280

Figura 17-3. Diagrama de dispersión del peso frente a la altura en unahipotética clase de bioestadística.

Altura (pulgadas)

80706050

250

200

150

100

50

Pes

o (l

ibra

s)

Page 226: Epidemiología y bioestadística secretos   nordness1ed

•(xi ––x) (yi – –y ) n •xi yi – (•xi)( •yi)

m = =

•(xi–x–)2 n •xi2 – (•xi)

2

b = –y – m–x

donde –x es la media de la variable independiente, e –y es la media de la variable dependiente.

La mayoría de análisis de regresión se llevan a cabo utilizando un programa de ordenador.

ANÁLISIS BIVARIANTE 229

Figura 17-4. Línea recta con «mejor ajuste» para datos bivaria-dos, determinada por regresión lineal simple.

0,5

0,4

0,3

0,2

0,1

00,40,30,20,10

X

Y

PUNTOS CLAVE: REGRESIÓN LINEAL SIMPLE

1.• Los datos son continuos y pareados.

2.• Para cada x, los valores de y asociados siguen una distribución normal.

30. ¿Qué es el coeficiente de determinación?

Un parámetro de interés significativo en la regresión lineal recibe la denominación de coeficien-

te de determinación o r2. Es una medida de lo bien que una ecuación de regresión describe la

relación entre las dos variables. De modo más específico, representa la proporción de la varia-

bilidad en la variable independiente y (medida por la diferencia con respecto a la media) que es

explicada por la línea de regresión. El valor de r2 varía entre 0 y 1, donde 1 indica que todos los

puntos caen directamente sobre la línea de regresión. Por ello, cuanto mayor sea r2, mejor será

el ajuste de la línea de regresión a los puntos de los datos. La fórmula de r2 es la siguiente:

(•xi)2

m2 (•xi2 – )

nr2 =

(•yi)2

•yi 2 –

n

31. ¿Pueden utilizarse pruebas estadísticas para evaluar el ajuste de la línea

de regresión?

También se pueden utilizar pruebas estadísticas para evaluar el ajuste de la línea de regresión a

los puntos de los datos. Suele tomar la forma de prueba de hipótesis; en otras palabras, probar

la hipótesis de que la pendiente de la línea es cero. Si se puede rechazar la hipótesis nula de

Page 227: Epidemiología y bioestadística secretos   nordness1ed

que la pendiente es cero, una línea representa un ajuste bueno o razonable a los puntos de los

datos.

32. ¿Qué es la prueba de la F?

Uno de los métodos de prueba más habitual para valorar la línea de regresión es la prueba de

la F. El estadístico de prueba es el cociente de varianzas obtenido a partir de la metodología

ANOVA (análisis de la varianza). La mayor parte del análisis de regresión, en la actualidad, se

lleva a cabo por ordenador, y el programa estadístico del ordenador suele mostrar una tabla del

ANOVA cuando se aplica la regresión lineal. Esta tabla muestra el valor de p asociado para el

cociente de varianza calculado. Si el valor de p es inferior al nivel de significación estadística

elegido (generalmente designado como nivel α y con frecuencia fijado en α = 0,05), entonces

puede rechazarse la hipótesis nula. También puede aplicarse la prueba de la t para probar la

hipótesis nula, pero esta estrategia no se comenta aquí.

33. Ponga un problema ejemplo en el que se utilice el coeficiente de determinación.

Apliquemos la regresión simple a los siguientes datos cuantitativos, continuos, pareados e

hipotéticos (Tabla 17-2), que constan de las presiones sanguíneas sistólicas promedio, medi-

das en el mismo momento, diariamente, durante 5 días, y el índice de masa corporal (BMI) a

partir de una muestra aleatoria de varones de edades comprendidas entre 35 y 45 años que no

reciben tratamiento por hipertensión. De los datos de la Tabla 17-2,

(23)[(88.274) – (635)(3146)]m = = 1,837

(23)(18.303) – (635)2

b = 136,783 – (1,837)(27,609) = 86,071

(635)2

(1,837)2 (18.303 – )23

r2 = = 0,574(3.146)2

434.852 –23

Así, la pendiente y la intersección de la línea de regresión lineal vienen dados por 1,837 y

86,071, respectivamente. El coeficiente de determinación, 0,574, no está próximo a 1, lo que

sugiere que la línea de regresión no da cuenta de gran parte de la variación en la variable inde-

pendiente y. La tabla del ANOVA para los datos viene dada abajo, donde: df, grados de libertad;

SS, suma de cuadrados; MS, cuadrado de la media, y VR, cociente de varianzas.

ANÁLISIS BIVARIANTE230

No se tratará aquí sobre los detalles del procedimiento analítico del ANOVA. El valor de p

arriba indicado sería estadísticamente significativo a un nivel α = 0,05 (o 0,01, para tal caso);

así, puede rechazarse la hipótesis nula de que la pendiente m es cero a estos niveles de signifi-

cación. En la Figura 17-5 se muestran los puntos de los datos y la línea de regresión. Es intere-

RegresiónResidual

Total

Valor de p

0,0000283

MS

2.602,811

91,957

VR

28,305

df

1

21

22

SS

2.602,811

1.931,102

4.533,913

Page 228: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS BIVARIANTE 231

TA B L A 1 7 - 2 . P R E S I Ó N S A N G U Í N E A S I S T Ó L I C A Y DATO S D E L B M I . DATO S H I P OT É T I C O S .

Individuo

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

Promedio

xy

2.242

2.684

3.584

3.886

4.896

4.032

5.184

5.852

3.212

2.688

2.160

5.180

3.692

3.864

4.380

2.320

2.976

2.464

5.082

5.056

3.500

3.864

5.476

88.274

y2

13.924

14.884

16.384

17.956

20.736

15.876

26.244

23.716

21.316

16.384

14.400

21.904

20.164

19.044

21.316

13.456

15.376

12.544

23.716

24.964

19.600

19.044

21.904

434.852

BMI (x)

19

22

28

29

34

32

32

38

22

21

18

35

26

28

30

20

24

22

33

32

25

28

37

635

27,609

x2

361

484

784

841

1.156

1.024

1.024

1.444

484

441

324

1.225

676

784

900

400

576

484

1.089

1.024

625

784

1.369

18.303

BP sistólica mmHg(y)

118

122

128

134

144

126

162

154

146

128

120

148

142

138

146

116

124

112

154

158

140

138

148

3.146

136,783

Figura 17-5. Línea de regresión lineal simple para datos hipotéticos depresión sanguínea sistólica y BMI.

Índice de masa corporal

BP

sis

tólic

a, m

mH

g

170

150

130

110

90

70

50

403530252015

Page 229: Epidemiología y bioestadística secretos   nordness1ed

sante observar que el valor de p es muy bajo y, sin embargo, el coeficiente de determinación no

fue muy alto (0,574), como se recordará. Esto no significa necesariamente que sea una con-

traindicación. El rechazo de la hipótesis nula sólo significa que si vamos a ajustar una línea

recta a los datos, la pendiente de la línea no será cero (no significa necesariamente que la línea

recta es el mejor ajuste a los datos). El valor de r2 relativamente bajo sugiere otra cosa.

34. ¿Cuál es el supuesto en relación con los valores de y (es decir, una variable

dependiente) para cualquier valor dado de x (es decir, una variable

independiente) en los modelos de regresión lineal?

Un supuesto importante de la regresión lineal simple es que para cada valor de x hay una sub-

población de valores de y que se hallan distribuidos normalmente.

ANÁLISIS BIVARIANTE232

PUNTOS CLAVE: CORRELACIÓN DE RANGOS DE SPEARMAN

1.• No se hacen supuestos de normalidad en relación con las variables.

2.• Las variables son continuas o discretas.

3.• Los datos son pareados.

35. ¿En qué se diferencian las pruebas no paramétricas de las pruebas

paramétricas comentadas (es decir, el coeficiente de correlación de Pearson y

la regresión lineal)?

Los métodos no paramétricos requieren menos supuestos, especialmente con respecto a la nor-

malidad (es decir, datos que siguen una distribución normal). Además, los métodos no paramé-

tricos tienden a ser simples, y se pueden obtener los resultados con una relativa rapidez.

36. ¿En qué situaciones se utilizan clásicamente las pruebas no paramétricas?

Situaciones clásicas en las que se emplean los métodos no paramétricos incluyen datos clara-

mente anormales y el análisis de una muestra pequeña.

PUNTOS CLAVE: PRUEBA DEL RANGO CON SIGNO DE WILCOXON

1.• No se hacen supuestos de normalidad sobre los datos (es decir, no paramétrica).

2.• Los datos son pareados, continuos o discretos.

3.• Deseamos conocer si la diferencia dentro de cada par es significativa.

37. ¿Qué es la correlación de rangos de Spearman?

La correlación de rangos de Spearman es un análogo no paramétrico al coeficiente de correla-

ción de Pearson. Al igual que el coeficiente de correlación de Pearson, el método intenta

determinar si existe una asociación entre dos variables mutuamente dependientes, sin supo-

ner que una variable dependa de la otra. Las variables pueden ser continuas o discretas, y son

pareadas.

Page 230: Epidemiología y bioestadística secretos   nordness1ed

38. ¿Cuáles son los principios en la correlación de rangos de Spearman?

Es una forma de probar una hipótesis en la que según la hipótesis nula (HA) no hay relación

entre las dos variables, y la hipótesis alternativa es que sí hay una relación. Se calcula un coefi-

ciente de correlación de rangos, rx, y se emplea para obtener un estadístico de prueba; a conti-

nuación, se compara éste con una tabla de valores críticos, para determinar el nivel de signifi-

cación estadística.

ANÁLISIS BIVARIANTE 233

PUNTOS CLAVE: PRUEBA DE LA U DE MANN-WHITNEY

1.• No se supone que los datos sigan una distribución normal.

2.• Los datos no son pareados, pero representan mediciones realizadas en dos grupos que difieren en algún modo (p. ej., expuestos frente a no expuestos).

3.• Deseamos conocer si la diferencia en las mediciones entre los dos grupos es estadísticamentesignificativa al comparar las medianas.

39. ¿Cómo se calcula el coeficiente de correlación de Spearman?

En primer lugar, hay que clasificar por magnitud los valores dentro de cada variable, de 1 a n.

Se calcula la diferencia (di) en relación con cada par de observaciones (xi , yi) al restar el rango

de yj del rango de xi. A continuación, se calcula el coeficiente de correlación de rangos de

Spearman de acuerdo con la siguiente fórmula:

6•di2

rs = 1 –n(n2 – 1)

Para n • 30, se convierte en el estadístico de prueba. Para n > 30, hay que utilizar

z = rs n – 1

40. Ponga un ejemplo de cómo se calcula el coeficiente de correlación de rangos

de Spearman.

Podemos aplicar la prueba de Spearman a los datos de la altura y del peso utilizados en un

ejemplo previo (véase la pregunta 25). La hipótesis nula es que la altura y el peso son mutua-

mente independientes. Nuestra hipótesis alternativa es que el peso aumenta con la altura

(es decir, una correlación directa). En la Tabla 17-3, cada uno de los valores figura clasificado

de menor a mayor dentro de su grupo respectivo, comenzado con 1. di representa la diferencia

entre los rangos de xi e yi (específicamente, xi – yi). En este ejemplo, también se ilustra el méto-

do para tratar con empates: se asigna un rango calculado, que representa el promedio de los

rangos con empates. Si el número de empates no es grande, puede utilizarse la fórmula usual

(en la pregunta 39), como en este caso. Dado que n • 30 en relación con los datos de arriba, el

estadístico viene dado por la fórmula

6(240,5)rs = 1 – = 0,752

18(182 – 1)

Para α = 0,05, la tabla de los valores críticos del estadístico de prueba de Spearman da 0,3994

para n = 18. Dada la hipótesis alternativa de arriba, estamos interesados en una prueba de un

lado, en la que rechazaremos la hipótesis nula si rs > 0,3994. Al ser verdad, rechazamos la

hipótesis nula y aceptamos la hipótesis alternativa con un valor de p < 0,05.

Page 231: Epidemiología y bioestadística secretos   nordness1ed

41. ¿Qué es el valor de la tau de Kendall?

Un método similar a la correlación de rangos de Spearman es la tau de Kendall. Al igual que la

correlación de rangos de Spearman, se aplica a datos pareados, y se supone que los datos son

continuos o discretos. No hay suposiciones de normalidad. En la mayoría de los casos, los

resultados de la correlación de rangos de Spearman y la tau de Kendall son comparables, pero

esta última prueba es más difícil de calcular.

42. Explique la prueba de Wilcoxon.

Otra prueba no paramétrica para los datos cuantitativos no pareados es la prueba de rangos

con signo de Wilcoxon. En esta prueba, se intenta valorar si la diferencia entre los valores de

cada par es significativa o no lo es (es decir, la hipótesis alternativa es que la diferencia no es

cero). Esta prueba es diferente tanto de la correlación de rangos de Spearman como del valor

de la tau de Kendall; ambas implican correlación. Sin embargo, al igual que la prueba de Spear-

man, se determina la diferencia entre cada par de datos y a continuación se clasifica. Se asigna

un signo positivo o negativo a la clasificación, dependiendo del signo de la diferencia original.

Se suman de modo separado los rangos positivos y los negativos, y se emplean para determi-

nar el nivel de significación estadística utilizando una tabla especial.

43. ¿Hay modos para analizar datos de dos grupos diferentes (en vez de datos

pareados)?

Sí. Hasta ahora nos hemos centrado en métodos no paramétricos de análisis de datos parea-

dos. Consideremos ahora la prueba de la U de Mann-Whitney, una prueba no paramétrica que

ANÁLISIS BIVARIANTE234

TA B L A 1 7 - 3 . E J E M P L O D E L C O E F I C I E N T E D E C O R R E L A C I Ó N D E S P E A R M A N

Individuo

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

d2

2

16

1

0

81

25

6,25

30,25

0

0

4

2,25

0,25

36

25

12,25

0

0,25

240,5

Orden y

4

8

9

18

15

12

7

10

2

1

6

3

13

14

5

17

11

16

Altura (pulgadas, x)

66

72

69

78

68

76

67

74

62

60

69

67

73

69

70

73

71

74

Orden x

3

12

8

18

6

17

4,5

15,5

2

1

8

4,5

13,5

8

10

13,5

11

15,5

Peso (libras) y

152

177

180

224

205

191

174

182

120

109

172

135

198

204

162

211

186

206

d

–1

4

–1

0

–9

5

–2,5

5,5

0

0

2

1,5

0,5

–6

5

–3,5

0

–0,5

Page 232: Epidemiología y bioestadística secretos   nordness1ed

se emplea para determinar si dos conjuntos de datos continuos o discretos son significativa-

mente «diferentes». Un ejemplo de una aplicación de la prueba de la U de Mann-Whitney es la

determinación de una característica (p. ej., el peso) en grupos de expuestos y de no expuestos.

Como se ha observado arriba, la variable que se mide o recoge es cuantitativa y continua o dis-

creta. Se supone que los dos conjuntos de datos son independientes y extraídos de modo alea-

torio. Los estadísticos de interés en esta prueba son las medianas de ambos conjuntos de

datos, y la prueba determina si la diferencia entre las medianas a un nivel dado es estadística-

mente significativa o no lo es.

44. ¿Hay alguna prueba no paramétrica para comparar las medianas de más

de dos muestras?

Sí. La prueba de Kruskall-Wallis es otra prueba no paramétrica que puede emplearse para

determinar si las medianas de dos muestras son diferentes. A diferencia de la prueba de la U de

Mann-Whitney, no se limita sólo a dos muestras. Sin embargo, al igual que con la prueba de la

U de Mann-Whitney, se supone que las muestras son aleatorias e independientes.

45. ¿Es posible analizar dos grupos de datos categóricos?

Sí. Con frecuencia se efectúa el análisis estadístico de datos que implican dos variables categó-

ricas. Un ejemplo es la ausencia o la presencia de tos en casos de faringitis por estreptococos

betahemolíticos del grupo A frente a la faringitis por estreptococos betahemolíticos no pertene-

cientes al grupo A. Este tipo de datos lleva de modo natural a la representación en tablas

(denominadas tablas de contingencia) en las que se representan las categorías en filas y

columnas. Así, el ejemplo arriba indicado vendría representado en la siguiente tabla de contin-

gencia de 2 � 2 del siguiente modo:

ANÁLISIS BIVARIANTE 235

Faringitis estreptocócica del grupo A

Faringitis estreptocócica de un grupo distinto al A

Sin tos

B

D

Con tos

A

C

46. Explique la tabla de contingencia arriba representada.

A-D representa el recuento de casos, con el par de características determinadas por la intersec-

ción de las filas y de las columnas. Por ejemplo, los sujetos A tenían tos y faringitis estreptocó-

cica A, mientras que los sujetos C tenían tos y faringitis estreptocócica no A. El total de sujetos

con tos es A + C, y el número total de sujetos del estudio es A + B + C + D.

47. ¿Qué es el estadístico ji al cuadrado?

El estadístico de la ji al cuadrado es una prueba no paramétrica de recuento bivariante o datos

de frecuencias. Este método de modelado examina la disparidad entre las frecuencias de

recuentos reales y las frecuencias de recuentos esperados, cuando es cierta la hipótesis nula

de que no hay diferencia entre los grupos. Podemos aplicar la prueba de la ji al cuadrado para

determinar si existe una asociación entre la faringitis estreptocócica del grupo A y la tos.

48. ¿Cómo se calcula el estadístico ji al cuadrado?

En este método se calcula el estadístico de la prueba de la ji al cuadrado por la siguiente fórmula:

r c (Oij – Eij)2

χ2 = • •i = 1 j = 1 Eij

Page 233: Epidemiología y bioestadística secretos   nordness1ed

donde Eij = (Oi x Oj)/n; r = número de filas; c = número de columnas; Oij = número observado en

la intersección de la fila i y de la columna j; Eij = número esperado en la intersección de la fila iy de la columna j; Oi = suma de los términos para la fila i (en la tabla de arriba, O1 = suma de las

filas de entradas = A + B); Oj = suma de las entradas de la columna j (en la tabla de arriba, O2 =

suma de entradas en la segunda columna = B + D), y n = número total de casos (arriba, n = A +

B + C + D).

49. ¿Cómo se utiliza el estadístico ji al cuadrado calculado?

Una vez calculado el estadístico ji al cuadrado, puede determinarse la probabilidad de que los

recuentos de frecuencias en la tabla se deban al azar (es decir, que la hipótesis nula sea cierta)

en relación con el número de grados de libertad, a partir de una tabla estandarizada de la ji al

cuadrado. Para cualquier número dado de grados de libertad, cuanto mayor sea el estadístico de

la ji al cuadrado, más improbable es que las disparidades en las frecuencias se deban al azar.

ANÁLISIS BIVARIANTE236

50. ¿Cuáles son los criterios de Cochran?

Los criterios de Cochran deben cumplirse en el caso de que se quiera aplicar el estadístico de

la ji al cuadrado, tal como se ha observado arriba. Estos criterios son:■ Todos los valores esperados en cada celda tienen una frecuencia • 1.■ El 80% de los valores esperados en cada celda debe ser • 5.

El número de términos o celdas para su suma vendrá dado, en general, por r � c. Por consi-

guiente, en la tabla de arriba, habría 2 � 2, o 4 términos para la suma del estadístico de la ji al

cuadrado.

51. ¿Cuál es el número máximo de filas o de columnas para que se pueda calcular

el estadístico de la ji al cuadrado?

Teóricamente, no hay un límite en el número de filas o de columnas (una variable podría tener

fácilmente más de dos categorías), y el cálculo podría llegar a ser tedioso. Es muy recomenda-

ble emplear un programa estadístico de ordenador.

52. ¿Existe alguna fórmula simplificada para el cálculo del estadístico de la ji al

cuadrado en la tabla de contingencia de 2 � 2?

Afortunadamente, sí existe. En relación con la tabla de 2 � 2 de arriba, la fórmula se simplifica

en la siguiente:

n(ad – bc)2

(a + c)(b + d)(a + b)(c + d)

53. ¿Cómo se pueden determinar los grados de libertad en una tabla de

contingencia?

Para aplicar la prueba de la ji al cuadrado hay que determinar los grados de libertad, dados por

la fórmula df = (r – 1)(c – 1). En una tabla de 2 � 2, df = 1; en una tabla de 3 � 3 hay (3 – 1)(3 – 1)

PUNTOS CLAVE: PRUEBA DE LA JI AL CUADRADO

1.• Las variables son categóricas.

2.• Los datos representan recuentos, y pueden representarse en una tabla de r filas y c columnas, una tabla de contingencia de r � c.

3.• Se deben satisfacer los criterios de Cochran para aplicar la prueba de la ji al cuadrado básica.

χ2 =

Page 234: Epidemiología y bioestadística secretos   nordness1ed

=

4 grados de libertad. Después de elegir el nivel de significación (α), se debe consultar la distri-

bución de la ji al cuadrado para determinar si se puede rechazar la hipótesis nula de que no

existe asociación.

54. Ponga un problema ejemplo que utilice el estadístico de la ji al cuadrado en

una tabla de 2 � 2.

Hipótesis: los suplementos de vitamina C reducen la susceptibilidad de una persona al resfria-

do común. Consideremos 90 sujetos seleccionados aleatoriamente y agrupados atendiendo al

hecho de si toman o no suplementos de vitamina C. A continuación, figura una tabla de 2 � 2

para esta muestra:

ANÁLISIS BIVARIANTE 237

Toman suplementos de vitamina C

No toman suplementos de vitamina C

Sin resfriado común

23

27

Con resfriado común

12

28

Se calcula el estadístico ji al cuadrado utilizando la ecuación de la pregunta 52:

n (ad – bc)2 90 [(12)(27) – (23)(28)]2

(a + c)(b + d)(a + b)(c + d) (40)(50)(35)(55)

9.216.000

3.850.000

= 2,39

Ji al cuadrado igual a 2,39, con (2 – 1)(2 – 1) = 1 grado de libertad.

Ahora, consultando en el Apéndice C las distribuciones de la ji al cuadrado y suponiendo

que p = 0,05 (es decir, un nivel de confianza del 95% de que la diferencia no se debe al azar),

encontramos que la ji al cuadrado ha de ser, por lo menos, 3,841 para demostrar una diferencia

significativa. Por consiguiente, tenemos que aceptar la hipótesis nula de que la vitamina C no

tiene efecto sobre la susceptibilidad al resfriado común.

55. ¿Qué es la corrección de Yates?

La corrección de Yates es una corrección para la continuidad de las tablas de 2 � 2. Algunos

expertos creen que es necesaria esta corrección especialmente cuando los recuentos de fre-

cuencias son bajos, porque el estadístico de la ji al cuadrado es un valor discreto (ya que se

calcula a partir de datos enteros) cuya distribución sigue, aproximadamente, una distribución

continua (es decir, la distribución de la ji al cuadrado). Matemáticamente, la corrección de

Yates se lleva a cabo de modo sencillo restando 0,5 del valor absoluto de la diferencia entre los

valores observados (O) y esperados (E), antes de elevar al cuadrado el denominador.

(|O – E| – 0,5)2

χ2 de Yates = •E

56. ¿Se debe utilizar siempre la corrección de Yates para la continuidad cuando se

efectúen pruebas de la ji al cuadrado?

Depende de nosotros. No está universalmente aceptado que esta corrección sea necesaria.

En efecto, para grandes recuentos en las tablas de contingencias, probablemente no sea nece-

saria, aunque se sugiere clásicamente cuando se analizan muestras de pequeño tamaño.

χ2 =

χ2 =

χ2

=

Page 235: Epidemiología y bioestadística secretos   nordness1ed

57. ¿Qué sucede si no se satisfacen los criterios de Cochran?

Si no se satisfacen los criterios de Cochran para el empleo de la técnica de la ji al cuadrado

(p. ej., si los recuentos en algunas celdillas son muy bajos), se puede aplicar la prueba exacta

de Fisher para tablas de 2 � 2.

58. ¿Qué sucede cuando analizamos datos categóricos que, en realidad,

son pareados?

Como se acaba de indicar, la prueba de la ji al cuadrado no supone datos pareados. En el caso

de datos categóricos pareados puede aplicarse la prueba de McNemar. En este caso, se valora

una característica o calidad particular en el mismo individuo bajo condiciones diferentes, o en

individuos que han sido emparejados por factores de confusión potenciales.

59. ¿Puede poner un ejemplo del empleo apropiado de la prueba de McNemar?

Un ejemplo es un estudio sobre la ocurrencia de cefaleas en individuos emparejados después

de la ingestión de la misma medicación. Otro ejemplo podría ser la ocurrencia de infecciones

óticas (otitis media) en individuos en las edades de 5 y 15 años.

ANÁLISIS BIVARIANTE238

Con el empleo de la prueba de McNemar, se valoraría si hay una diferencia estadística -

mente significativa en la ocurrencia de infecciones óticas en las dos edades en la muestra.

Si la muestra es grande, el estadístico de la prueba de McNemar podría calcularse del siguien-

te modo.

(b – c)2

b + c

Después de seleccionar el nivel de significación estadístico (por lo general, α = 0,05), se

emplearía la distribución de la ji al cuadrado para determinar si se puede rechazar la hipótesis

nula de que no hay diferencia.

60. ¿Puede utilizarse la prueba de McNemar si hay más de un desenlace posible?

Aunque en nuestros ejemplos había variables con dos desenlaces, se ha extendido la prueba de

McNemar a variables con más de dos desenlaces.

61. Describa la regresión logística.

La regresión logística es un método estadístico análogo a la regresión lineal para el análisis de

los datos categóricos. En la regresión logística, la variable dependiente es categórica (en el

caso más sencillo, dicotómica, o con dos desenlaces, como la ausencia o la presencia de

enfermedad). Las variables independientes pueden ser categóricas o bien continuas o discre-

tas. Al igual que la regresión lineal, la regresión logística es una herramienta poderosa que se

ha utilizado ampliamente en investigación médica. Se pueden valorar las variables indepen-

dientes por su contribución al desenlace de la variable dependiente (p. ej., la presencia de

enfermedad).

Infecciones óticas a los 5 años de edad

Sin infecciones óticas a los 5 años de edad

Sin infecciones óticas

a los 15 años de edad

B

D

Infecciones óticas

a los 15 años de edad

A

C

χ2 =

Page 236: Epidemiología y bioestadística secretos   nordness1ed

62. ¿Puede efectuarse la regresión logística cuando más de una variable

independiente puede, potencialmente, afectar al desenlace?

Sí. En el caso más simple, la regresión logística implica el modelado de una variable depen-

diente dicotómica en una única variable independiente que es categórica o cuantitativa. En la

mayoría de las aplicaciones se valoran múltiples variables independientes en el modelo de

regresión.

63. ¿Pueden utilizarse los modelos de regresión logística para cuantificar el riesgo?

Otra característica importante y muy útil de la regresión logística es la capacidad para calcular

oportunidades relativas de un desenlace de la variable dependiente (p. ej. cáncer de pulmón)

dados unos valores específicos de una de las variables independientes (p. ej., fumar o no

fumar) mientras se controlan valores de las otras variables independientes (p. ej., ingesta de

alcohol, historia familiar y empleo de antioxidantes).

ANÁLISIS BIVARIANTE 239

PÁGINAS WEB

1.• http://www.mste.uiuc.edu/hill/dstat/dstat.html

2.• http://www.davidmlane.com/hyperstat/index.html

3.• http://www.emedicine.com/emerg/topic758.htm

BIBLIOGRAFÍA

1.• Brochert A: Platinum Vignettes: Behavioral Science and Biostatistics. Philadelphia, Hanley & Belfus, 2003.2.• Daly LE, Bourke GJ: Interpretation and Uses of Medical Statistics, 5th ed. Oxford, Blackwell Science Ltd.,

2000.3.• Kirkwood BR: Essentials of Medical Statistics. Oxford, Blackwell Science Ltd., 1988.4.• Norman GR, Streiner DL: Biostatistics: The Bare Essentials, 2nd ed. Toronto, B.C. Decker, 2000.

Page 237: Epidemiología y bioestadística secretos   nordness1ed

241

CA

PÍT

ULO

18ANÁLISIS MULTIVARIABLE

Y MULTIVARIANTE Robbie Ali, MD, MPH, MPPM

1. ¿Qué es un análisis multivariable?

Según Katz, «el análisis multivariable es una herramienta para determinar las contribuciones

relativas de las diferentes causas a un suceso o desenlace único».

Katz MH: Multivariable Analysis: A Practical Guide for Clinicians. Cambridge, Cambridge University Press,

1999.

2. ¿Cuál es la diferencia entre un análisis multivariable y un análisis

multivariante?

Se emplea el análisis multivariable para datos con una variable del desenlace dependiente pero

más de una variable independiente. Se emplea el análisis multivariante para datos con más de

una variable del desenlace dependiente así como más de una variable independiente.

3. Enumere los empleos habituales del análisis multivariable.

■ Cuantificar asociaciones: indica hasta qué punto varias variables independientes, por sepa-

rado y en conjunto, explican o predicen la variación en una variable dependiente (p. ej., bon-

dad del ajuste de un modelo).■ Examinar la interacción entre variables independientes: se produce interacción cuando dos

o más variables independientes, cuando se dan juntas, producen un efecto diferente a la

simple adición de sus efectos individuales.■ Ajustar las variables de confusión potenciales en un estudio controlado; una variable de

confusión es un factor (p. ej., ingesta de alcohol) que lleva a una correlación observada

entre dos variables (p. ej., fumar y cirrosis) que no se origina de una relación causal entre

ellas sino más bien por su relación común con la variable de confusión.■ Desarrollar modelos que predigan valores o probabilidades de ciertos desenlaces: por ejem-

plo, el análisis multivariable podría permitir la predicción de si se podría recuperar un

paciente con cáncer que tiene un conjunto de características y que recibe un cierto

tratamiento.

PUNTOS CLAVE: EMPLEOS DEL ANÁLISIS MULTIVARIABLE

1.• Cuantificar asociaciones.

2.• Examinar la interacción entre variables independientes.

3.• Ajustar las variables de confusión potenciales en un estudio controlado.

4.• Desarrollar modelos para predecir valores o probabilidades de ciertos desenlaces.

Page 238: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS MULTIVARIABLE Y MULTIVARIANTE242

4. ¿Cómo se decide qué tipo de análisis multivariable se debe emplear?

Observe los datos. La Figura 18-1 resume las siguientes directrices:

Figure 18-1. Cómo elegir el tipo apropiado de análisis multivariable. (Adaptado de Jekel JF, KatzDL, Elmore JG: Epidemiology, Biostatistics, and Preventive Medicine. Philadelphia,•W.B. Saunders,2001, pp 209-217.)

■ Si la variable dependiente consta de datos categóricos dicotómicos (dos desenlaces,

p. ej., sí o no, con enfermedad o sin enfermedad, vivo o muerto), puede emplearse la regre-

sión logística.■ Si la variable dependiente incluye también un factor de tiempo (p. ej., curva de superviven-

cia), se puede emplear el modelo de riesgos proporcionales de Cox.■ Si la variable dependiente consta de datos categóricos nominales (es decir, más de dos

desenlaces), puede emplearse el análisis logarítmico lineal. Si alguna o todas las variables

independientes son continuas, pueden agruparse en categorías nominales para hacerlo.■ Si tanto las variables dependientes como las independientes constan de datos continuos, se

emplea la regresión múltiple.■ En el caso de una variable dependiente continua, con variables independientes categóricas,

se emplea el análisis de la varianza (ANOVA), y si hay variables independientes categóricas y

continuas, se emplea el análisis de la covarianza (ANCOVA).

5. ¿Qué nombre se da a una línea que describe la relación entre una variable

dependiente continua y una variable independiente, que permite la predicción

de la variable dependiente a partir de la independiente?

Línea de regresión.

6. Exponga una ecuación simple para una línea de regresión, y explique sus

elementos.

Y = a + bX + E

donde Y es la variable dependiente, a es una constante igual a la intersección en el eje de las y

(es decir, valor de Y cuando X = 0), b es la pendiente de la línea (es decir, el coeficiente de

regresión), X es la variable independiente, y E es el término de error.

7. ¿Son siempre rectas las líneas de regresión?

No. La ecuación del punto 6 describe una línea recta. Otras ecuaciones de regresión describen

curvas; por ejemplo,

Variable dependiente (VD)

Categórica

Dicotómica(2 desenlaces)

Factor tiempo

(p. ej., curva de

supervivencia):

RIESGOS PRO-

PORCIONALES

DE COX

Nominal

(> 2 desenlaces):

ANÁLISIS LOG-

LINEAL (se

pueden agrupar

las variables

independientes

[VI] continuas

en categorías

nominales)

Sin factor

tiempo:

REGRESIÓN

LOGÍSTICA

Datos VI

categóricos:

ANOVA

Datos VI

continuos:

REGRESIÓN

MÚLTIPLE

Datos VI

categóricos

y continuos:

ANCOVA

Continua

Page 239: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS MULTIVARIABLE Y MULTIVARIANTE 243

■ Parábolas: Y = a � bX � cX2

■ Curvas exponenciales: Log(Y) = a � bX■ Curvas logarítmicas: Y = a � b Log(X)■ Curvas geométricas: Log(Y) = a � b Log(X)

Estas ecuaciones de regresión se emplean para modelar datos de relaciones entre variables

dependientes e independientes como ecuaciones de curvas que se aproximan.

PUNTOS CLAVE: DATOS Y PRUEBAS

1.• Si la variable dependiente consta de datos categóricos dicotómicos, se puede emplear la regresión

logística.

2.• Si la variable dependiente incluye también un factor de tiempo (p. ej., una curva de supervivencia),

se puede emplear el modelo de riesgos proporcionales de Cox.

3.• Si la variable dependiente consta de datos categóricos nominales (es decir, más de dos

desenlaces), se puede emplear el análisis logarítmico lineal. Si alguna o todas las variables

independientes son continuas, tal vez haya que agruparlas en categorías nominales para hacerlo.

4.• Si tanto las variables dependientes como independientes constan de datos numéricos, se emplea

la regresión múltiple.

5.• En el caso de una variable dependiente continua con variables independientes categóricas, se

emplea el ANOVA (o ANCOVA, si hay tanto variables independientes categóricas como continuas).

8. Enumere tres requerimientos de los datos para el análisis de regresión.

1.• La variable dependiente ha de ser continua.

2.• La variable dependiente debe tener una distribución normal (a menos que se empleen técni-

cas avanzadas).

3.• La variabilidad de la variable dependiente debe permanecer igual para todos los valores de

la variable independiente (a menos que se empleen técnicas avanzadas).

9. ¿En qué se diferencian los requerimientos de los datos para la regresión con

respecto a los de la correlación?

Para la correlación, tanto la variable dependiente como la variable independiente deben tener

una distribución normal. En el análisis de regresión, sólo se requiere que la variable dependien-

te esté normalmente distribuida. No se requiere que la variable independiente tenga una distri-

bución normal; en efecto, el investigador puede seleccionar su valor.

10. ¿Con qué término se designa una medida de una bondad del ajuste de un

modelo de regresión particular, igual a la proporción de la variación en la

variable dependiente (es decir, variación explicada/variación total, que va de

0-1) que explica el modelo?

Coeficiente de determinación (R2). Por ejemplo, en el estudio 1 con una población muestral 1,

un diagrama de dispersión del desenlace Y (altura del niño) frente al factor X1 (edad del niño)

puede mostrar puntos que se agrupan alrededor de una línea, con un R2 próximo a 1, mientras

que en el estudio 2, con población muestral 2, un diagrama de dispersión del desenlace Y2

(cociente de inteligencia) frente al factor X2 (presión sanguínea) puede mostrar una nube de

puntos sin relación real con una línea, con un R2 próximo a 0.

Page 240: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS MULTIVARIABLE Y MULTIVARIANTE244

11. ¿Qué nombre recibe el tipo de análisis que describe la relación entre una

variable dependiente continua y dos o más variables independientes, que

permite la predicción de la variable dependiente a partir de las variables

independientes?

Regresión múltiple.

12. Ponga un ejemplo de una ecuación de regresión múltiple, y explique sus

elementos.

Y = a � b1X1 � b2X2 � b3X3

donde Y es la variable dependiente (p. ej., presión sanguínea); a es una constante; X1, X2 y X3

son variables independientes (p. ej., edad, raza y sexo); y b1, b2 y b3 son los coeficientes de

regresión que sirven como factores de ponderación de las contribuciones relativas de X1, X2 y

X3 al desenlace Y.

PUNTOS CLAVE: REGRESIÓN SIMPLE

1.• Una línea de regresión simple describe la relación entre una variable dependiente continua

y una variable independiente.

2.• Un ejemplo de una ecuación simple para una línea de regresión es Y = a + bX, donde Y es la variable

dependiente, a es una constante (es decir, el valor de la intersección con el eje de las y),

b es la pendiente de la línea (es decir, coeficiente de regresión) y X es la variable independiente.

3.• Para el análisis de regresión, la variable dependiente ha de ser continua. Por cada cambio unitario

en X habrá un cambio unitario b en Y.

4.• A menos que se empleen técnicas especiales, la variable dependiente debe tener una distribución

normal y tener variabilidad que se mantenga igual para todos los valores de la variable

independiente.

5.• El coeficiente de determinación (R2) describe la bondad del ajuste de un modelo de regresión,

como la proporción de la variación en la variable dependiente (es decir, variación

explicada/variación total, que va de 0 a 1) que explica el modelo. Cuanto más próximo a 1 esté R2,

mejor explica el modelo la variación.

13. ¿Cómo se estiman los coeficientes de regresión (b) en las ecuaciones de

regresión múltiple?

Por el método de los mínimos cuadrados ordinarios: se minimiza la suma de los residuos al

cuadrado (es decir, términos de error) entre el plano de regresión (análogo a la línea de regre-

sión) y los valores observados para cada variable dependiente. Esto proporciona la ecuación

que «mejor se ajusta» a los datos observados.

14. ¿Qué significa que el valor de p para los coeficientes de regresión de una

o más variables independientes sea pequeño (es decir, < 0,05) en una ecuación

de regresión múltiple?

Significa que hay suficientes pruebas en los datos que muestran que la variable independiente

tiene una asociación, con la variable dependiente, mayor de lo que se podría esperar por el azar

solo; por tanto, se rechaza la hipótesis nula.

Page 241: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS MULTIVARIABLE Y MULTIVARIANTE 245

15. ¿Por qué es importante este concepto en la construcción de modelos con

ecuaciones de regresión múltiple?

En la construcción de modelos podemos añadir, de modo progresivo, variables a la ecuación

de regresión y mantenerlas o rechazarlas si los coeficientes de regresión son estadísticamente

significativos.

16. ¿Cuál es el método estadístico de elección para analizar de qué modo varias

variables independientes predicen una variable dependiente dicotómica (es

decir, desenlace)?

Regresión logística.

17. ¿Qué es la regresión logística?

La regresión logística es una herramienta utilizada para encontrar el modelo del mejor ajuste

para una relación entre una o más variables independientes y una variable dependiente que es

dicotómica o binaria. Una variable dependiente dicotómica tiene sólo dos desenlaces posibles

(p. ej., sí o no, verdadero o falso, éxito o fracaso, o vivo o muerto). La variable dependiente en

la regresión logística recibe también la denominación de variable ficticia (dummy), que signifi-

ca que puede codificarse como 0 o 1.

PUNTOS CLAVE: REGRESIÓN LINEAL MÚLTIPLE

1.• La regresión lineal múltiple describe una relación entre una variable dependiente continua y dos

o más variables independientes, lo que permite la predicción de la variable dependiente a partir

de las variables independientes.

2.• Un ejemplo sencillo de una ecuación de regresión múltiple es Y = a � b1X1 � b2X2 � b3X3,

donde Y es la variable dependiente; a es una constante; b1, b2 y b3 son coeficientes de regresión,

y X1, X2 y X3 son variables independientes. Para un cambio unitario en X1, hay un cambio unitario

de b en Y (manteniendo X2 y X3 constantes).

3.• Se estiman los coeficientes de regresión (b) en las ecuaciones de regresión múltiple por el método

de los cuadrados mínimos ordinarios.

4.• En la construcción de modelos, a menos que exista una interacción significativa entre las variables

independientes, puede eliminarse una variable independiente con un coeficiente de regresión no

estadísticamente significativo de 0 (p > 0,05). Si p < 0,05 debe retenerse la variable.

18. ¿En qué difiere la ecuación de regresión logística de la ecuación de regresión

lineal?

La ecuación de regresión logística es una transformación no lineal de la ecuación de regresión

lineal. Esta transformación «logit» da lugar a un modelo de regresión «logit» en lugar de

modelo de regresión «probit» de una distribución normal estándar. Gráficamente, la transfor-

mación «logit» convierte el modelo de la línea recta de la regresión lineal en un modelo logísti-

co con forma de S, asintótica con respecto a los valores 0 y 1 de Y (Fig. 18-2).

19. Ponga un ejemplo de cómo puede transformarse una ecuación de regresión

lineal en una ecuación de regresión logística.

Consideremos la siguiente ecuación de regresión lineal:

Y (variable dependiente dicotómica) = a (constante) � b1X1 � b2X2 � ... � E (error)

Page 242: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS MULTIVARIABLE Y MULTIVARIANTE246

Puede transformarse en una ecuación de regresión logística de modo que si p es la probabi-

lidad de que se produzca el desenlace Y (Y = 1),

Log oportunidad relativa = Logit (p) = ln[p/(1 – p)] = a � b1X1 � b2X2 � ...� E (error)

y, tomando la exponencial de ambos lados,

Oportunidad = [p/(1 – p)] = expa expb1X1 expb2expX2 ... expe

donde los elementos de la ecuación tienen los siguientes significados: ■ X1, X2, ...son las variables independientes.■ b1, b2, son los coeficientes de regresión de las variables independientes.■ ln es el logaritmo natural o neperiano (es decir, el logaritmo con base e)■ exp = e = 2,71828...

20. Recuerde qué son el logaritmo natural o neperiano (ln) y exp (e) = 2,71828.

¿Por qué se emplean en la regresión logística?

Exp (es decir, exponencial, en ocasiones también denominado e) es la base del sistema de

logaritmos naturales o neperianos. El valor numérico de e es igual a una serie de factoriales

inversas sumadas: 1 � 1/1 � 1/(1�2) � 1/(1�2�3) �...�1/(1�2�3�...�∞), con ∞ = infi-

nito. Exp tiene una propiedad única entre los números, porque expx (es decir, la función

logarítmica con base e) es la única función logarítmica que es igual a su propia derivada. Esto

significa que la pendiente de una línea tangente a expx (es decir, la velocidad de cambio de

expx) para cualquier valor de x es igual a expx. Significa también que el logaritmo natural de ex

es x: así, el logaritmo natural de e(e1) = 1 y el logaritmo natural de 1(e0) = 0.

Cuando algo cambia a una velocidad que es igual a su propio valor, se dice que está sufrien-

do un crecimiento exponencial (como sucede en el interés compuesto continuo) o una des-

composición exponencial (como sucede con los materiales radiactivos). Los logaritmos natu-

rales son útiles en las funciones de modelado como éstas, y para analizar sus pendientes por

medio de ecuaciones diferenciales. El coeficiente de regresión b en regresión logística es dicha

Figure 18-2. Líneas de regresión lineal y logística. (Adaptado de Whitehead J: AnIntroduction to Logistic Regression at http://www.personal.ecu.edu/whiteheadj/data/logit/.)

Línea de regresión lineal

Línea de

regresión logística

Y

Y = 1

Y = 0 X

Page 243: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS MULTIVARIABLE Y MULTIVARIANTE 247

pendiente. La transformación logística de las líneas de regresión lineal con logaritmos natura-

les corrige varios problemas que surgen con la regresión lineal (véase la pregunta 21).

Se puede encontrar una explicación más profunda de los logaritmos naturales, pero de lec-

tura relativamente fácil, en e: The Story of a Number, de Eli Maor (Princeton, 1998). Es un tema

convincente, pero no principal.

21. Cite tres razones por las que la regresión logística y el modelo «logit» son

mejores que la regresión lineal y los mínimos cuadrados ordinarios, para la

predicción de probabilidades con una variable dependiente dicotómica.

1.• En el modelo lineal, el error no tiene una distribución normal, lo cual no es bueno para la

regresión. La transformación «logit» se ocupa de esto.

2.• En el modelo lineal, los términos de error se denominan heteroescedásticos (es decir, la

varianza de la variable dependiente cambia con los diferentes valores de las variables

independientes). Esto tampoco es bueno para la regresión lineal. La transformación «logit»

también se ocupa de esto.

3.• En el modelo lineal, las probabilidades predichas pueden ser mayores que 1 o menores

que 0, una imposibilidad teórica. Después de la transformación «logit», las probabilidades

estimadas se encontrarán entre 0 y 1.

22. ¿Cómo puede interpretarse un coeficiente logit (p. ej., exp b)?

Como oportunidad relativa (OR) que es, Expb (es decir, 2,71828… para la potencia b) es la

OR del coeficiente individual b para la variable independiente X. Esto indica la cantidad relativa

por la que la oportunidad relativa global, o la probabilidad de Y = 1/(probabilidad de que

Y = 0), cambia cuando el valor de la variable independiente X aumenta en 1 unidad, con el

resto de los factores sin cambios. Obsérvese que en la regresión logística, los coeficientes b

representan la verosimilitud máxima, y no los cuadrados mínimos ordinarios, como en la

regresión lineal.

PUNTOS CLAVE: REGRESIÓN LOGÍSTICA

1.• La regresión logística se emplea clásicamente para encontrar el modelo con el mejor ajuste para

una relación entre una o más variables independientes y una variable dependiente que

es dicotómica o binaria.

2.• La ecuación de la regresión logística es una transformación no lineal de la ecuación de regresión

lineal. Esta transformación «logit» da lugar a un modelo de regresión «logit», en lugar

de un modelo de regresión «probit» de una distribución estándar normal.

3.• Un coeficiente «logit» (p. ej., expb) puede interpretarse como una oportunidad relativa que indica

la cantidad relativa por la que cambia la oportunidad relativa global cuando el valor de la variable

independiente X aumenta en 1 unidad.

4.• Puede analizarse la significación estadística del coeficiente b utilizando el estadístico de Wald;

en otras palabras, [b/error estándarb]2.

5.• En los modelos de construcción, como en la regresión lineal, a menos que exista una interacción

significativa entre las variables independientes, puede eliminarse una variable independiente

con un coeficiente de regresión no significativamente diferente de 0 (es decir, p > 0,5). Si p < 0,05,

se debe retener la variable.

Page 244: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS MULTIVARIABLE Y MULTIVARIANTE248

23. ¿Cuál es la significación estadística del coeficiente b analizado en la regresión

logística?

Utilizando el estadístico de Wald: [b/error estándarb]2. Al modelar, puede eliminarse una varia-

ble independiente con un coeficiente de regresión no significativamente diferente de 0

(es decir, p > 0,05) del modelo de regresión. Si p < 0,05, la variable contribuye de modo signifi-

cativo a la predicción de la variable del desenlace, y debe ser retenida.

24. ¿Cuándo se utiliza el análisis de la varianza (ANOVA)? ¿Cómo funciona?

Se utiliza el ANOVA con datos cuando la variable dependiente es continua (p. ej., presión san-

guínea) y todas las variables independientes son categóricas (p. ej., diferentes tipos de medica-

ción). El ANOVA puede analizar si hay diferencias significativas entre las medias en varios gru-

pos, sin aumentar la tasa de error de tipo I (como resultaría al llevar a cabo múltiples pruebas

de la t). Se emplea el ANOVA unidireccional cuando hay una variable independiente, mientras

que se utiliza el ANOVA de N direcciones cuando hay más de una.

El ANOVA describe la variación total en los datos del estudio al dividir la variación explicada

por las variables independientes (es decir, diferencias de grupos), la variación causada por la

interacción entre las variables independientes, y la variación causada por el error aleatorio (es

decir, el azar). A continuación, se comparan las variaciones de los componentes con la varia-

ción causada por el error aleatorio por medio del estadístico F.

25. ¿Qué métodos multivariantes utiliza el estadístico F?

El ANOVA y el análisis de la covarianza (ANCOVA). El cociente F es igual a la varianza entre gru-

pos dividida por la varianza dentro de los grupos. La varianza para cada uno de éstos es, sim-

plemente, la suma de los cuadrados (SS) dividida por los grados de libertad (df):

SS/df (entre grupos)

Cociente F =

SS/df (dentro de los grupos)

La prueba de la F, como la prueba de la t de Student, compara medias, pero puede comparar

más de dos medias al mismo tiempo. Analiza si la variación entre las medias de los grupos se

debe al azar solo o a verdaderas diferencias entre los grupos. Se pueden consultar los valores

de p en relación con el estadístico F en una tabla de F.

26. ¿Cuántos grados de libertad tiene el estadístico F?

Dos. Uno por la varianza entre grupos y otro por la varianza dentro de los grupos.

27. ¿Qué significa que el cociente de F sea mucho mayor que 1?

Significa que se debe rechazar la hipótesis nula que dice que no hay diferencias significativas

entre los grupos. A la inversa, si el estadístico F está próximo a 1, no puede rechazarse la hipó-

tesis nula, ya sea porque el estudio era demasiado pequeño o porque la varianza del estudio

era completamente explicable por el azar y no por diferencias reales en los agrupamientos utili-

zando las variables independientes.

28. ¿Cuándo se utiliza el análisis de la covarianza? ¿Cómo funciona?

Se utiliza el ANCOVA cuando los datos que van a analizarse constan de una variable dependien-

te continua a lo largo de variables independientes tanto categóricas como continuas. Lo prime-

ro que hace el método es ajustar la variable o variables independientes continuas (p. ej., edad

o peso) en toda la regresión, y luego analiza la varianza de las variables categóricas como en el

ANOVA, utilizando la prueba de la F para comparar la varianza entre grupos y dentro de los

grupos.

Page 245: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS MULTIVARIABLE Y MULTIVARIANTE 249

29. ¿Qué método estadístico se utiliza con frecuencia para analizar covariantes

en las curvas de supervivencia (p. ej., Kaplan-Meier)?

El modelo de riesgos proporcionales de Cox es una forma de modelo de regresión multivaria-

ble utilizado para analizar curvas de supervivencia y estudios clínicos con un desenlace dicotó-

mico (p. ej., muerto o vivo, con enfermedad o sin enfermedad). Permite la comparación de

sujetos con características diferentes y distintos puntos de partida y de llegada de la observa-

ción en el tiempo.

30. ¿Qué es una función de riesgo?

En un estudio que analiza los tiempos de supervivencia (o períodos sin enfermedad) de los

sujetos, una función de riesgo es un modo de estimar la supervivencia (o período sin enferme-

dad) de cada sujeto. Esta función de riesgo es una función exponencial. Para un sujeto dado,

su valor depende del valor del riesgo basal y de los valores de los coeficientes de regresión (es

decir, expβ) de las variables independientes de dicho sujeto (es decir, covariantes).

31. ¿Cuáles son las hipótesis en el modelo de riesgos proporcionales de Cox?

El modelo da por sentado que se puede estimar la supervivencia de cada sujeto (o período sin

enfermedad) por una función de riesgo. El modelo también da por sentada la proporcionalidad

de los riesgos, de aquí el nombre. Esto significa que admite una tasa de riesgos basal o subya-

cente (p. ej., riesgo de muerte por año de observación) con una relación multiplicativa con

alguna función de las covariantes para cada sujeto. También significa que el valor de cada

covariante representa un riesgo relativo que es constante en el tiempo, y que dos individuos

con valores particulares de las covariantes tendrán un cociente de los riesgos estimados que

es constante en el tiempo.

32. ¿Qué hipótesis clave no da el modelo de riesgos proporcionales de Cox?

El modelo no hace supuestos sobre la naturaleza o forma de la función de riesgos o distribu-

ción de la supervivencia. Tampoco hace supuestos de que los sujetos se hallen en observación

durante los mismos períodos de tiempo o que los sujetos sean similares; más bien, controla

estas diferencias entre los sujetos (al tratarlos como variables independientes) y durante perío-

dos de observación diferentes.

33. ¿Son realmente siempre constantes en el tiempo las tasas de riesgos

asociadas con las características de los sujetos (es decir, covariantes)?

No necesariamente. En un estudio dado, los riesgos asociados con algunas covariantes pueden

depender del tiempo. Por ejemplo, en un estudio prospectivo de 10 años de contaminación

PUNTOS CLAVE: ANÁLISIS DE LA VARIANZA (ANOVA)

1.• Se emplea el ANOVA con datos en los que la variable dependiente es continua y todas las variables

independientes son categóricas.

2.• El ANOVA utiliza el estadístico F.

3.• El estadístico F tiene dos grados de libertad, uno por la covarianza entre los grupos y el otro

por la varianza dentro de los grupos.

4.• Se rechaza la hipótesis nula si el cociente de F es mucho mayor que 1.

Page 246: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS MULTIVARIABLE Y MULTIVARIANTE250

ambiental externa y desarrollo de asma en niños, el hecho de que fumen los padres puede

representar un mayor riesgo para los niños más pequeños. A menos que se tengan en cuenta

tales cambios del riesgo en el tiempo, puede cuestionarse la validez del análisis.

34. ¿Qué método estadístico es útil para analizar los factores en las tablas

de frecuencias (es decir, tabulaciones cruzadas) en términos de interacciones,

significación estadística y ajuste de modelos?

Análisis logarítmico lineal. Una tabla de frecuencias multidireccional (es decir, una tabla de

tabulación cruzada de dos o más factores) es un modo de resumir datos sobre variables en

interacción (p. ej., en un estudio de pacientes con meningitis, las frecuencias de los síntomas

de presentación, como fiebre, cefalea y dolor de nuca de acuerdo con la edad, raza y sexo del

paciente). En el modelado logarítmico lineal se «traducen» en una tabla de frecuencias multidi-

reccional y sus valores observados por medio de transformaciones logarítmicas a varios efec-

tos principales y los efectos de interacción que se sumen linealmente para formar ecuaciones

logarítmicas lineales. Esas ecuaciones logarítmicas lineales derivadas expresan así relaciones

entre factores en la tabla de frecuencias en términos muy similares a los utilizados en el

ANOVA, y permiten probar si hay relaciones estadísticamente significativas.

35. ¿Qué herramienta estadística sirve para saber cuál de varias variables

discrimina mejor entre dos o más grupos que se dan de forma natural?

Análisis de función discriminante, que es una técnica multivariante utilizada para detectar cuál

de entre las diversas variables es la que mejor discrimina entre dos o más grupos. Por ejemplo,

un investigador desea detectar qué variables (p. ej., edad, sexo, raza) en los antecedentes de

los pacientes con cierta enfermedad discriminan mejor entre: 1) los que se recuperan comple-

tamente; 2) los que remiten, y 3) los que tienen una mala evolución. En términos de cálculo por

ordenador, el análisis de la función discriminante es similar al análisis multivariante de la

varianza (MANOVA).

PUNTOS CLAVE: OTROS MÉTODOS

1.• Se emplea el análisis de la covarianza (ANCOVA) cuando los datos que han de ser analizados

constan de una variable dependiente continua junto con variables independientes tanto categóricas

como continuas.

2.• El modelo de riesgos proporcionales de Cox es una forma de modelo de regresión multivariable

utilizado para analizar curvas de supervivencia (p. ej., Kaplan-Meier), por ejemplo, y estudios

clínicos con un desenlace dicotómico en el tiempo (p. ej., muerto o vivo, con enfermedad

o sin enfermedad).

3.• El análisis logarítmico lineal es útil para analizar factores en las tablas de frecuencias (es decir,

tabulaciones cruzadas) en términos de interacciones, significación estadística o ajuste de modelos.

4.• Se emplea el análisis de la función discriminante para detectar cuál de las diversas variables

discrimina mejor entre dos o más grupos.

5.• Se emplea el análisis por grupos para organizar variables en grupos relativamente homogéneos

o «agregados» («grupos»).

6. Se emplea la correlación canónica para explorar la relación entre dos conjuntos de variables.

Page 247: Epidemiología y bioestadística secretos   nordness1ed

ANÁLISIS MULTIVARIABLE Y MULTIVARIANTE 251

36. ¿Qué herramienta estadística se emplea en taxonomía, matrices de similitud

y dendrogramas?

El análisis por grupos, que es una herramienta multivariante utilizada para organizar variables

en grupos relativamente homogéneos o «agregados». Supone la generación de una matriz de

similitudes. Un análisis por grupos produce un dendrograma (es decir, un diagrama arbóreo).

Los grupos formados representan grupos con miembros más similares entre sí que a miem-

bros de otros grupos.

37. ¿Qué herramienta estadística se utiliza para comparar conjuntos de variables?

La correlación canónica, que es una herramienta multivariante utilizada para explorar la rela-

ción entre dos conjuntos de variables. Un ejemplo puede ser la relación entre: 1) una lista de

diversos factores de riesgo de asma (p. ej., pólenes, contaminación ambiental, frío y ejercicio

físico), y 2) una lista de síntomas desarrollados del asma (p. ej., sibilancias, tos y disnea). La

correlación canónica supone el cálculo de los valores propios (eigenvalues), que nos dicen qué

parte de la varianza se explica por la correlación entre las diversas variantes en las dos listas.

AGRADECIMIENTO

El autor desea expresar su gratitud a Abdus Wahed, PhD, Department of Biostatistics, Graduate

School of Public Health, University of Pittsburgh por sus útiles sugerencias y comentarios sobre este

capítulo.

BIBLIOGRAFÍA

1.• Jekel JF, Katz DL, Elmore JG: Epidemiology, Biostatistics, and Preventive Medicine. Philadelphia, W.B.Saunders, 2001, pp 209–217.

2.• Katz MH: Multivariable Analysis: A Practical Guide for Clinicians. Cambridge, Cambridge University Press,1999.

PÁGINAS WEB

1• http://www.statsoft.com/textbook/stathome.html

2.• http://www.personal.ecu.edu/whiteheadj/data/logit/

Page 248: Epidemiología y bioestadística secretos   nordness1ed

253

ANÁLISIS DE LA SUPERVIVENCIAAshita Tolwani, MD, MSc

1. ¿Qué es el análisis de la supervivencia?

El análisis de la supervivencia es un método estadístico para estudiar el tiempo transcurrido

desde el ingreso en el estudio y un suceso posterior. La variable de interés es el tiempo trans-

currido hasta que se produce el suceso. Es característico hacer referencia al suceso como fra-

caso. Un ejemplo habitual es el tiempo transcurrido desde el tratamiento hasta la muerte.

2. ¿Cuál es la característica del análisis de la supervivencia que lo hace singular?

En el análisis de la supervivencia, el tiempo de observación desigual de los sujetos en estudio.

Este hecho hace que el análisis de la supervivencia sea incompatible con muchos diseños de

estudio convencionales.

3. ¿Se emplea el análisis de la supervivencia solamente en estudios sobre

mortalidad?

No. Otros ejemplos son:■ Tiempo desde el tratamiento de una enfermedad hasta la recidiva.■ Tiempo de desempleo, medido desde la fecha de despido.■ Tiempo hasta que se produzca una avería en una pieza de un aparato o equipo.

4. ¿Qué otros términos reciben los datos de supervivencia?

■ Datos del tiempo hasta el suceso.■ Datos de la vida de un sujeto.■ Datos del tiempo hasta el fracaso.■ Datos de fiabilidad.■ Datos de duración.■ Datos de la historia de sucesos.

5. ¿Cuáles son algunos de los objetivos del análisis de la supervivencia?

■ Efectuar predicciones sobre una población.■ Comparar el efecto del tratamiento entre dos grupos.■ Investigar la importancia de características específicas sobre la supervivencia.

6. ¿Por qué no se pueden utilizar las técnicas de regresión estándar para

determinar si ciertas variables se correlacionan con los tiempos de

supervivencia o fracaso?

■ La variable de interés dependiente (es decir, tiempo de supervivencia o tiempo hasta el fra-

caso) no tiene una distribución normal; los tiempos de supervivencia suelen seguir una dis-

tribución exponencial, de Weibull o de Gompertz.■ Las técnicas de regresión estándar no toman en consideración la censura, y pueden produ-

cir sesgo en las estimaciones de las distribuciones del tiempo de supervivencia y cantidades

relacionadas.

CA

PÍT

ULO

19

Page 249: Epidemiología y bioestadística secretos   nordness1ed

7. ¿Qué significa la expresión datos censurados?

En un experimento en el que los sujetos son seguidos en el tiempo hasta que se produzca un

suceso de interés, no siempre es posible seguir a cada sujeto hasta que se observe el suceso.

Si ya no se sigue a un sujeto, por la razón que sea, todo lo que se sabe es que el tiempo hasta

el suceso fue, por lo menos, de una duración igual al tiempo en que el sujeto fue observado por

última vez. El tiempo hasta el suceso observado bajo tales circunstancias es desconocido y,

por ello, censurado.

8. ¿Se pueden pasar por alto los datos censurados cuando se efectúa el

análisis?

No. No se pueden pasar por alto estas observaciones, ya que comportan una información

importante, a pesar de ser incompletos. En relación con cada sujeto, se sabe, por lo menos,

que el tiempo del sujeto hasta el suceso es mayor que el tiempo en observación.

9. ¿Cuáles son los datos esenciales requeridos para efectuar un análisis de

supervivencia?

■ Tiempo de ingreso en el estudio.■ Criterio de valoración del estudio.■ Fecha del último seguimiento.■ Estado del paciente en el momento del último seguimiento (es decir, censurado o no

censurado).

10. Exponga tres razones por las que se podría producir la censura.

■ Un sujeto no experimenta el suceso antes de que finalice el estudio.■ Se pierde a una persona durante el período de estudio.■ Una persona se retira del estudio.

11. ¿Cuál es el principal supuesto de la censura?

Suponemos que el tiempo de censura y el tiempo de fracaso son independientes. En otras

palabras, se supone que los sujetos censurados tienen la misma curva de supervivencia subya-

cente después del tiempo de censura que los pacientes no censurados. Se hallan, por tanto, en

el mismo riesgo de fracaso que los que permanecen en el estudio. Se conoce este término

como censura no informativa.

12. ¿Cuál es la diferencia entre la censura derecha, la censura izquierda y la

censura de intervalos?

■ Se produce la censura derecha cuando la observación cesa antes de que se observe el suce-

so. En el momento t, la censura derecha significa que el verdadero tiempo de supervivencia

es, por lo menos, t.■ Se produce la censura izquierda cuando la observación no comienza hasta después de que

se haya producido el suceso. La censura izquierda en el tiempo t significa que el verdadero

tiempo de supervivencia es, como mucho, t. Por ejemplo, en un estudio de pacientes infec-

tados con hepatitis C puede comenzar el seguimiento cuando se produce por vez primera

un resultado positivo al virus de la hepatitis C, pero desconocemos el tiempo exacto desde

la primera exposición al virus. Por ello, el tiempo de supervivencia está censurado en la

izquierda.■ La censura de intervalos significa conocer que la supervivencia verdadera sólo se ha produ-

cido en algún momento dentro de un intervalo de tiempo conocido.

ANÁLISIS DE LA SUPERVIVENCIA254

Page 250: Epidemiología y bioestadística secretos   nordness1ed

13. ¿Cuál es el tipo de censura más habitual?

La censura derecha es el tipo de censura más frecuente.

14. En la Figura 19-1, las letras A a E representan pacientes en un estudio de

supervivencia. ¿Qué pacientes están censurados?

■ Los pacientes B y E alcanzan el «fracaso». El paciente B es observado desde el comienzo del

estudio. El paciente E ingresa en el estudio en el año 3 y es seguido hasta que se produce el

fracaso en el año 5,5. No hay censura.■ El paciente D ingresa en el estudio en el año 2 y es seguido hasta el año 4, en que se pierde

para el seguimiento; su tiempo censurado es de 2 años.■ Los pacientes A y C son seguidos hasta el final del estudio. En relación con el paciente A, el

tiempo de supervivencia está censurado porque es, por lo menos, de 7 años. El paciente C

ingresa en el estudio en el año 2 y es seguido durante el resto del estudio sin que se produz-

ca el «fracaso»; su tiempo censurado es de 5 años.

En resumen, los pacientes B y E alcanzan el fracaso y los pacientes A, C y D están censurados.

ANÁLISIS DE LA SUPERVIVENCIA 255

Figura 19-1. Pacientes en un estudio de supervivencia.

15. ¿Cuáles son los tipos de censura derecha?

■ Se produce una censura simple de tipo I cuando todos los individuos son censurados en el

mismo momento fijo. Suele ocurrir cuando se sigue a una población durante un intervalo de

tiempo fijo.■ Se produce una censura progresiva de tipo I cuando los individuos ingresan en diferentes

momentos y son seguidos hasta una fecha fija. El desenlace de interés es la duración entre

el ingreso y el suceso.

Se produce el suceso

Años

1 2

AT = 7

T = 3

T = 5

T = 2

T = 2,5

B

C

D

E

X

3 4 5 6 7

Final del estudio

Perdido

Final del estudio

Page 251: Epidemiología y bioestadística secretos   nordness1ed

■ Se produce la censura de tipo II cuando un estudio termina en el momento en que hay un

número de sucesos previamente especificados.■ Se produce una censura al azar cuando el estudio está diseñado para que termine después

de un tiempo fijo, pero no todos los sujetos censurados tienen el mismo tiempo de censura.

El tiempo de censura y el tiempo de supervivencia T son independientes.

16. ¿De qué modo la censura puede producir un sesgo en los resultados?

A medida que aumenta el número de pacientes censurados en un estudio, cualquier diferen-

cia entre los pacientes censurados y los no censurados puede aumentar la probabilidad

de sesgo. Convencionalmente, el número de pacientes censurados debe ser inferior al 5% del

total.

17. ¿Qué es una función de supervivencia?

Una función de supervivencia describe la proporción de sujetos que sobreviven hasta un

momento dado o superior.

18. ¿Cómo se define matemáticamente la función de supervivencia?

Se define la función de supervivencia como S(t) = P(T > t), la probabilidad de que un individuo

sobreviva más tiempo que un tiempo especificado t. S(t) indica la probabilidad de que la varia-

ble T (tiempo de supervivencia) aleatoria supere un tiempo t especificado. En otras palabras, la

función de supervivencia proporciona una predicción del porcentaje de personas que espera-

mos que «sobrevivan» hasta un momento dado.■ T es la variable aleatoria en relación con el tiempo de supervivencia de una persona.■ t representa cualquier valor de interés específico en relación con la variable T aleatoria.

19. Enumere las propiedades de todas las funciones de supervivencia.

■ Las funciones de supervivencia no aumentan.■ En el tiempo t = 0, S(t) = S(0) = 1. Al comienzo del estudio, la probabilidad de sobrevivir

después de t = 0 es uno, ya que aún no ha habido nadie que haya tenido el suceso. Es decir,

todos son supervivientes en el tiempo = 0.■ En el momento = ∞, S(t) = S(∞) = 0. Si el período de estudio aumentase sin límite, nadie

sobreviviría.

20. ¿Cuál es la función de riesgos?

La función de riesgos calcula el riesgo (una probabilidad) de que un individuo sometido a

observación en un tiempo t tenga un suceso en dicho momento. La función de riesgo repre-

senta la tasa instantánea de sucesos en un individuo que ya ha sobrevivido hasta el tiempo t.

21. ¿Qué es la tasa de fracaso condicional?

La tasa de fracaso condicional es otro nombre para la función de riesgos. Otro modo de expre-

sarlo es que la tasa de fracaso condicional h(t) da el potencial instantáneo de fracaso en el

tiempo t por unidad de tiempo, dada la supervivencia hasta el tiempo t.

22. ¿Cómo se define matemáticamente la función de riesgos?

Se define la función de riesgos por h(t) = f(t)/S(d) la densidad condicional para T, dada una

supervivencia hasta el tiempo t, evaluada en dicho momento. Una definición equivalente es:

h(t) = lím P(T < t � δt|T = t)δt → 0 δt

ANÁLISIS DE LA SUPERVIVENCIA256

Page 252: Epidemiología y bioestadística secretos   nordness1ed

23. Explique por qué la función de riesgos es una tasa y no una probabilidad.

El numerador en esta función es la probabilidad condicional. El denominador denota un

pequeño intervalo de tiempo. Por división, la probabilidad por unidad de tiempo se convierte en

una tasa. La escala de este cociente varía entre 0 e infinito.

24. ¿En qué se diferencia la función de riesgos de la función de supervivencia?

La función de superviviente indica el porcentaje de los sujetos que no tienen un suceso, mien-

tras que la función de riesgos da una tasa de sucesos. El riesgo se relaciona con la tasa de

sucesos incidentes (actual), mientras que la supervivencia refleja la no ocurrencia acumulativa.

ANÁLISIS DE LA SUPERVIVENCIA 257

PUNTOS CLAVE: ANÁLISIS DE LA SUPERVIVENCIA

1.• El análisis de la supervivencia cuantifica el tiempo hasta un suceso dicotómico único.

2.• Trata bien los datos censurados.

3.• La supervivencia y el riesgo pueden interconvertirse matemáticamente.

4.• Se pueden comparar estadística y gráficamente las curvas de supervivencia de Kaplan-Meier.

5.• Los modelos de riesgos proporcionales de Cox ayudan a distinguir las contribuciones individualesde las covariantes a la supervivencia, con tal de que se satisfagan ciertos supuestos.

25. Indique las características de la función de riesgos.

■ Es siempre • 0.■ No tiene límite superior, porque es una tasa y no una probabilidad, como se expresa en la

fórmula.

26. Indique y exprese gráficamente los diferentes tipos de funciones de riesgo.

■ Modelo de supervivencia exponencial (Fig. 19-2). La función de riesgos es constante. Es

éste un ejemplo de h(t) en personas sanas. Una persona que continúa sana durante el estu-

dio tiene un potencial instantáneo constante de enfermar durante el período de tiempo.

Figura 19-2. Modelo de supervivencia exponencial.

h (t)

t

Page 253: Epidemiología y bioestadística secretos   nordness1ed

■ Modelo de Weibull creciente (Fig. 19-3). Un ejemplo de este tipo de gráfico es el de los

pacientes con cáncer que no responden al tratamiento, en los que el suceso de interés es la

muerte. El potencial de que muera un paciente por la enfermedad aumenta a medida que

aumenta el tiempo de supervivencia, porque el pronóstico empeora.

ANÁLISIS DE LA SUPERVIVENCIA258

Figura 19-3. Modelo de Weibull creciente.

■ Modelo de Weibull decreciente (Fig 19-4). Puede esperarse este tipo de gráfico en las per-

sonas que se recuperan de una intervención quirúrgica, en los que el suceso de interés es la

muerte. El potencial de morirse después de la intervención quirúrgica disminuye a medida

que aumenta el tiempo transcurrido desde la intervención.

Figura 19-4. Modelo de Weibull decreciente.

■ Modelo de supervivencia logarítmico-normal (Fig. 19-5). Un ejemplo de este tipo de gráfico

es el de los pacientes que tienen una enfermedad en la que el potencial de morirse aumenta

en las primeras fases de la enfermedad y disminuye posteriormente.

h (t)

t

h (t)

t

Page 254: Epidemiología y bioestadística secretos   nordness1ed

27. ¿Cuál es la relación matemática entre S(t) y h(t)?

–[dS(t)/dt]h(t) =

S(t)

En el caso de que matemáticamente tenga inclinación, si se redistribuye e integra la ecua-

ción, puede observarse una tasa de riesgos acumulativa H(t) integrada en el tiempo que es

igual al logaritmo natural de S(t).

28. ¿Cuáles son los dos procedimientos de análisis de supervivencia básicos que

permiten determinar la supervivencia global de grupos únicos, tomando en

consideración tanto las observaciones censuradas como las no censuradas?

■ Análisis de las tablas de vida (o método actuarial).■ Método de la curva de supervivencia de Kaplan-Meier.

29. ¿Qué es el análisis de una tabla de vida?

La técnica de la tabla de vida proporciona una buena indicación de la distribución de los fraca-

sos en el tiempo. Supone dividir el período total de observación del grupo en intervalos fijos.

Por cada intervalo, se calcula la proporción de supervivientes al final del intervalo atendiendo al

número conocido que ha experimentado el suceso del criterio de valoración durante el interva-

lo y el número estimado que ha estado en riesgo al comienzo del intervalo.

Se supone que todas las pérdidas y ganancias de sujetos se producen de modo aleatorio a

lo largo del intervalo; por consiguiente, se estima que el período observado es el valor medio

del intervalo de tiempo.

La Figura 19-6 muestra la tabla de vida o método actuarial del análisis de supervivencia, uti-

lizado en el Veterans Administration Coronary Artery Bypass Surgery Cooperative Study.

30. ¿Qué es el estimador producto límite de Kaplan-Meier?

El método de Kaplan-Meier permite la estimación de la función de supervivencia directamente a

partir de los tiempos de supervivencia o de fracaso continuos. Permite el cálculo de la propor-

ción de supervivientes hasta un momento dado de que se produzca un fracaso o suceso, más

que a intervalos fijos, y genera las curvas de supervivencia características «en peldaños de

escalera».

ANÁLISIS DE LA SUPERVIVENCIA 259

Figura 19-5. Modelo de supervivencia logarítmico-normal.

h (t)

t

Page 255: Epidemiología y bioestadística secretos   nordness1ed

31. ¿Cuál es la ventaja del producto límite de Kaplan-Meier sobre el método de la

tabla de vida?

La ventaja del producto límite de Kaplan-Meier sobre el método de la tabla de vida para analizar

los datos del tiempo de supervivencia y de fracaso es que las estimaciones resultantes no

dependen del agrupamiento de los datos en un cierto número de intervalos temporales. El

método de Kaplan-Meier y el método de la tabla de vida son idénticos si los intervalos de la

tabla de vida contienen, como mucho, una observación.

32. Ponga un ejemplo del cálculo de las estimaciones del tiempo de supervivencia

de Kaplan-Meier.

Estamos interesados en determinar el tiempo transcurrido hasta la coagulación en el filtro de

diálisis en pacientes que comienzan la diálisis continua. En el estudio comienzan a ser someti-

dos a diálisis 10 pacientes con los siguientes resultados: en el paciente 1 se produce la coagu-

lación a las 24 horas, el paciente 2 fallece a las 10 horas, el paciente 3 es apartado de la diálisis

y llevado a cirugía a las 6 horas de iniciarse la diálisis, en el paciente 4 se produce la coagula-

ción a las 42 horas, en el paciente 5 se produce la coagulación 9 horas después de comenzar la

diálisis, en el paciente 6 se produce la coagulación 10 horas después, en el paciente 7 se pro-

duce la coagulación a las 6 horas, en el paciente 8 se produce la coagulación a las 2 horas, en

el paciente 9 se produce la coagulación a las 12 horas y en el paciente 10 se produce la coagu-

lación a las 5 horas. Utilizando este ejemplo, construya una tabla de los datos censurados y de

los no censurados (Tabla 19-1).

ANÁLISIS DE LA SUPERVIVENCIA260

Figura 19-6. Método actuarial del análisis de supervivencia, utilizado en elVeterans Administration Coronary Artery Bypass Surgery CooperativeStudy. (De Jekel JF, Katz DL, Elmore JG: Epidemiology, Biostatistics, andPreventive Medicine, 2.ª ed. Philadelphia, W.B. Saunders, 2001, p 188,Fig. 11-4.)

Quirúrgicos

Médicos

Pro

po

rció

n d

e s

up

erv

ivie

nte

s

Años desde el tratamiento

1,00

0,90

0,80

0,70

0,60

0,50

0,40

0,30

0,20

0,10

0,00

11109876543210

0,83

0,76

0,66

0,52

0,38

71S97M

35S35M

0,50

Page 256: Epidemiología y bioestadística secretos   nordness1ed

33. Ordene el ejemplo anterior por suceso y tiempo de censura.

Véase la Tabla 19-2.

ANÁLISIS DE LA SUPERVIVENCIA 261

TA B L A 1 9 - 1 . DATO S C E N S U R A D O S Y N O C E N S U R A D O S

Paciente Número

1

2

3

4

5

6

7

8

9

10

Tiempo hasta el suceso/censura

24 horas

10 horas

6 horas

42 horas

9 horas

10 horas

6 horas

2 horas

12 horas

5 horas

Censurados (Sí/No)

No

No

No

No

No

No

No

No

TA B L A 1 9 - 2 . O R D E N A C I Ó N D E L O S DATO S P O R S U C E S O Y T I E M P O D E C E N S U R A

Tiempo

2

5

6

10

12

24

42

Probabilidad

acumulativa

0,10

0,10 � 0,11(1 – 0,10) = 0,20

0,20 � 0,25(1 – 0,9) = 0,23

0,23 � 0,20(1 – 0,23) = 0,38

0,38 � 0,33(1 – 0,38) = 0,59

0,59 � 0,50(1 – 0,59) = 0,80

0,80 � 1(1 – 0,8) = 1

Suceso

1

1

2

1

1

1

1

Probabilidad condicional

del suceso

1/10 (0,10)

1/9 (0,11)

2/8 (0,25)

1/5 (0,20)

1/3 (0,33)

1/2 (0,5)

1/1 (1)

En riesgo

10

9

8

5

3

2

1

Censura

0

0

1

1

0

0

0

34. ¿Cuál es la mediana de tiempo hasta la coagulación en el ejemplo anterior?

Utilizando la columna de la probabilidad acumulativa, la mediana de tiempo hasta la coagu -

lación (es decir, el tiempo en que se ha producido la coagulación en el 50% de los filtros)

está entre 10 y 12 horas, porque el 50% cae entre las probabilidades acumulativas

del 38 y el 59%.

35. ¿Cómo se representa la curva de Kaplan-Meier?

■ Se representa gráficamente la curva en función del peldaño (Fig. 19-7).■ El tiempo en el eje de las x.■ La probabilidad acumulativa o «supervivencia», en el eje de las y.■ Los sujetos censurados se representan como marcas.■ El número de sujetos «en riesgo» se registra, con frecuencia, por debajo del eje de las x.

Page 257: Epidemiología y bioestadística secretos   nordness1ed

36. ¿Cuál es la limitación de la curva de supervivencia de Kaplan-Meier?

No tiene en cuenta la confusión o modificación del efecto por otras covariantes.

37. ¿Cuándo se podría desear comparar dos curvas de supervivencia diferentes?

Cuando se desee comparar el tiempo de supervivencia entre grupos diferentes.

38. ¿Cómo se comparan estadísticamente las curvas de Kaplan-Meier de dos

grupos diferentes?

La prueba del orden logarítmico (log-rank test) proporciona una comparación global de las

curvas de Kaplan-Meier. Es una prueba de la ji al cuadrado de muestras grandes, que compara

los desenlaces observados con los esperados, en donde las categorías vienen definidas por el

tiempo de fracaso en un conjunto de datos total. Las comparaciones se efectúan en cada

momento del «suceso».

39. ¿Cuáles son los supuestos de la prueba del orden logarítmico?

■ Los tiempos de supervivencia son ordinales o continuos.■ El riesgo de un suceso en un grupo, comparado con el riesgo en el otro grupo, no cambia

con el tiempo. Se conoce este hecho como supuesto de los riesgos proporcionales.

40. ¿Qué otras pruebas se emplean para comparar curvas de supervivencia?

■ La prueba del orden logarítmico de Mantel-Haenszel.■ El cociente de riesgos.

41. ¿Qué es el cociente de riesgos?

El cociente de riesgos es la medida del efecto en el análisis de la supervivencia que describe la

relación entre la exposición y el desenlace. Un cociente de riesgos inferior a 1 significa ausen-

cia de efecto. Un cociente de riesgo de 5 indica que el grupo expuesto tiene un riesgo 5 veces

mayor que el grupo no expuesto. Un cociente de riesgos de 1/5 indica que el grupo expuesto

tiene un riesgo que es la quinta parte del observado en el grupo no expuesto.

42. ¿Cómo se valoran las relaciones entre las diversas covariantes y el tiempo de

supervivencia?

Se emplea el modelo de regresión de riesgos proporcionales de Cox para valorar el efecto de

múltiples covariantes sobre la supervivencia.

ANÁLISIS DE LA SUPERVIVENCIA262

Figura 19-7. Curva de Kaplan-Meier.

Tiempo en meses

Proporciónacumulativa desupervivientes

1,0

0,8

0,6

0,4

0,2

0,0

0• 10 20 40 50 6030

Page 258: Epidemiología y bioestadística secretos   nordness1ed

BIBLIOGRAFÍA

1.• Gordis L: Epidemiology, 3rd ed. Philadelphia, W.B. Saunders, 2004.2.• Jekel JF, Katz DL, Elmore JG: Epidemiology, Biostatistics, and Preventive Medicine, 2nd ed. Philadelphia, W.B.

Saunders, 2001.

ANÁLISIS DE LA SUPERVIVENCIA 263

PÁGINAS WEB

1.• http://www.apha.org/public_health/epidemiology.htm

2.• http://www.amstat.org/sections/epi/SIE_Home.htm

3.• http://www.apic.org

4.• http://www.biostat.ucsf.edu/epidem/epidem.html

Page 259: Epidemiología y bioestadística secretos   nordness1ed

265

APÉNDICE A

TA B L A A . • D I S T R I B U C I Ó N N O R M A L E S TA N DA R I Z A DA – P R O BA B I L I DA D E S D E L A S C O L A S ( TA B L A D E L O S VA L O R E S z ) *

z

0,00

0,01

0,02

0,0251

0,03

0,04

0,05

0,0502

0,06

0,07

0,0753

0,08

0,09

0,10

0,1004

0,11

0,12

0,1257

0,13

0,14

0,15

0,1510

0,16

0,17

0,1764

0,18

0,19

0,20

0,2019

Probabilidad

de dos colas

0,8181

0,8103

0,8026

0,80

0,7949

0,7872

0,78

0,7795

0,7718

0,7642

0,76

0,7566

0,7490

0,7414

0,74

0,7339

0,7263

0,72

0,7188

0,7114

0,7039

0,70

0,6965

0,6892

0,6818

0,68

0,6745

0,6672

0,66

Probabilidad de

la cola superior

0,4090

0,4052

0,4013

0,40

0,3974

0,3936

0,39

0,3897

0,3859

0,3821

0,38

0,3783

0,3745

0,3707

0,37

0,3669

0,3632

0,36

0,3594

0,3557

0,3520

0,35

0,3483

0,3446

0,3409

0,34

0,3372

0,3336

0,33

Probabilidad de

la cola superior

0,5000

0,4960

0,4920

0,49

0,4880

0,4840

0,4801

0,48

0,4761

0,4721

0,47

0,4681

0,4641

0,4602

0,46

0,4562

0,4522

0,45

0,4483

0,4443

0,4404

0,44

0,4364

0,4325

0,43

0,4286

0,4247

0,4207

0,42

Probabilidad

de dos colas

1,0000

0,9920

0,9840

0,98

0,9761

0,9681

0,9601

0,96

0,9522

0,9442

0,94

0,9362

0,9283

0,9203

0,92

0,9124

0,9045

0,9

0,8966

0,8887

0,8808

0,88

0,8729

0,8650

0,86

0,8571

0,8493

0,8415

0,84

z

0,23

0,24

0,25

0,2533

0,26

0,27

0,2793

0,28

0,29

0,30

0,3055

0,31

0,32

0,33

0,3319

0,34

0,35

0,3585

0,36

0,37

0,38

0,3853

0,39

0,40

0,41

0,4125

0,42

0,43

0,4399

(Continúa)

Page 260: Epidemiología y bioestadística secretos   nordness1ed

APÉNDICE A266

TA B L A A . • D I S T R I B U C I Ó N N O R M A L E S TA N DA R I Z A DA – P R O BA B I L I DA D E S D E L A S C O L A S ( TA B L A D E L O S VA L O R E S z ) * ( C o n t . )

z

Probabilidad

de dos colas

Probabilidad de

la cola superior

Probabilidad de

la cola superior

Probabilidad

de dos colas z

0,6599

0,6527

0,6455

0,4413

0,44

0,4354

0,4295

0,4237

0,42

0,4179

0,4122

0,4065

0,4009

0,40

0,3953

0,3898

0,3843

0,38

0,3789

0,3735

0,3681

0,3628

0,36

0,3576

0,3524

0,3472

0,3421

0,34

0,3371

0,3320

0,3271

0,3222

0,32

0,3173

0,3125

0,3077

0,3030

0,3

0,2983

0,3300

0,3264

0,3228

0,2206

0,22

0,2177

0,2148

0,2119

0,21

0,2090

0,2061

0,2033

0,2005

0,20

0,1977

0,1949

0,1922

0,19

0,1894

0,1867

0,1841

0,1814

0,18

0,1788

0,1762

0,1736

0,1711

0,17

0,1685

0,1660

0,1635

0,1611

0,16

0,1587

0,1562

0,1539

0,1515

0,15

0,1492

0,4168

0,4129

0,41

0,32

0,3192

0,3156

0,3121

0,31

0,3085

0,3050

0,3015

0,3

0,2981

0,2946

0,2912

0,29

0,2877

0,2843

0,2810

0,28

0,2776

0,2743

0,2709

0,27

0,2676

0,2643

0,2611

0,26

0,2578

0,2546

0,2514

0,25

0,2483

0,2451

0,2420

0,24

0,2389

0,2358

0,2327

0,21

0,22

0,2275

0,4677

0,47

0,48

0,49

0,4959

0,50

0,51

0,52

0,5244

0,53

0,54

0,55

0,5534

0,56

0,57

0,58

0,5828

0,59

0,60

0,61

0,6128

0,62

0,63

0,64

0,6433

0,65

0,66

0,67

0,6745

0,68

0,69

0,70

0,7063

0,71

0,72

0,73

0,8337

0,8259

0,82

0,64

0,6384

0,6312

0,6241

0,62

0,6171

0,6101

0,6031

0,6

0,5961

0,5892

0,5823

0,58

0,5755

0,5687

0,5619

0,56

0,5552

0,5485

0,5419

0,54

0,5353

0,5287

0,5222

0,52

0,5157

0,5093

0,5029

0,50

0,4956

0,4902

0,4839

0,48

0,4777

0,4715

0,4654

0,44

0,45

0,46

0,77

0,7722

0,78

0,79

0,80

0,8064

0,81

0,82

0,83

0,84

0,8416

0,85

0,86

0,87

0,8779

0,88

0,89

0,90

0,91

0,9154

0,92

0,93

0,94

0,95

0,9542

0,96

0,97

0,98

0,99

0,9945

1,00

1,01

1,02

1,03

1,036

1,04

Page 261: Epidemiología y bioestadística secretos   nordness1ed

APÉNDICE A 267

TA B L A A . • D I S T R I B U C I Ó N N O R M A L E S TA N DA R I Z A DA – P R O BA B I L I DA D E S D E L A S C O L A S ( TA B L A D E L O S VA L O R E S z ) * ( C o n t . )

z

Probabilidad

de dos colas

Probabilidad de

la cola superior

Probabilidad de

la cola superior

Probabilidad

de dos colas z

0,2937

0,2891

0,2846

0,2801

0,1585

0,1556

0,1527

0,1499

0,1471

0,1443

0,1416

0,14

0,1389

0,1362

0,1336

0,1310

0,1285

0,1260

0,1236

0,1211

0,12

0,1188

0,1164

0,1141

0,1118

0,1096

0,1074

0,1052

0,1031

0,1010

0,10

0,0989

0,0969

0,0949

0,0930

0,0910

0,0891

0,0873

0,1469

0,1446

0,1423

0,1401

0,0793

0,0778

0,0764

0,0749

0,0735

0,0721

0,0708

0,07

0,0694

0,0681

0,0668

0,0655

0,0643

0,0630

0,0618

0,0606

0,06

0,0594

0,0582

0,0571

0,0559

0,0548

0,0537

0,0526

0,0516

0,0505

0,05

0,0495

0,0485

0,0475

0,0465

0,0455

0,0446

0,0436

0,23

0,2296

0,2266

0,2236

0,14

0,1379

0,1357

0,1335

0,1314

0,13

0,1292

0,1271

0,1251

0,1230

0,1210

0,12

0,1190

0,1170

0,1151

0,1131

0,1112

0,11

0,1093

0,1075

0,1056

0,1038

0,1020

0,1003

0,10

0,0985

0,0968

0,0951

0,0934

0,0918

0,0901

0,09

0,0885

0,0869

0,7388

0,74

0,75

0,76

1.080

1,09

1,10

1,11

1,12

1,1264

1,13

1,14

1,15

1,16

1,17

1,175

1,18

1,19

1,20

1,21

1,22

1,227

1,23

1,24

1,25

1,26

1,27

1,28

1,282

1,29

1,30

1,31

1,32

1,33

1,34

1,341

1,35

1,36

0,46

0,4593

0,4533

0,4473

0,28

0,2757

0,2713

0,2670

0,2627

0,26

0,2585

0,2543

0,2501

0,2460

0,2420

0,24

0,2380

0,2340

0,2301

0,2263

0,2225

0,22

0,2187

0,2150

0,2113

0,2077

0,2041

0,2005

0,20

0,1971

0,1936

0,1902

0,1868

0,1835

0,1802

0,18

0,1770

0,1738

1,05

1,06

1,07

1,08

1,41

1,42

1,43

1,44

1,45

1,46

1,47

1,476

1,48

1,49

1,50

1,51

1,52

1,53

1,54

1,55

1,555

1,56

1,57

1,58

1,59

1,60

1,61

1,62

1,63

1,64

1,645

1,65

1,66

1,67

1,68

1,69

1,70

1,71

(Continúa)

Page 262: Epidemiología y bioestadística secretos   nordness1ed

APÉNDICE A268

TA B L A A . • D I S T R I B U C I Ó N N O R M A L E S TA N DA R I Z A DA – P R O BA B I L I DA D E S D E L A S C O L A S ( TA B L A D E L O S VA L O R E S z ) * ( C o n t . )

z

Probabilidad

de dos colas

Probabilidad de

la cola superior

Probabilidad de

la cola superior

Probabilidad

de dos colas z

0,0854

0,0836

0,0819

0,0801

0,08

0,0324

0,0316

0,0308

0,0300

0,0293

0,0285

0,0278

0,0271

0,0264

0,0257

0,0251

0,0244

0,0238

0,0232

0,0226

0,0220

0,0214

0,0209

0,0203

0,02

0,0198

0,0193

0,0188

0,0183

0,0178

0,0173

0,0168

0,0164

0,0160

0,0155

0,0151

0,0147

0,0143

0,0139

0,0427

0,0418

0,0409

0,0401

0,04

0,0162

0,0158

0,0154

0,0150

0,0146

0,0143

0,0139

0,0136

0,0132

0,0129

0,0125

0,0122

0,0119

0,0116

0,0113

0,0110

0,0107

0,0104

0,0102

0,01

0,0099

0,0096

0,0094

0,0091

0,0089

0,0087

0,0084

0,0082

0,0080

0,0078

0,0075

0,0073

0,0071

0,0069

0,0853

0,0838

0,0823

0,0808

0,08

0,0392

0,0384

0,0375

0,0367

0,0359

0,0352

0,0344

0,0336

0,0329

0,0322

0,0314

0,0307

0,0301

0,03

0,0294

0,0287

0,0281

0,0274

0,0268

0,0262

0,0256

0,025

0,0244

0,0239

0,0233

0,0228

0,0222

0,0217

0,0212

0,0207

0,0202

0,02

0,0197

0,0192

1,37

1,38

1,39

1,40

1,405

1,76

1,77

1,78

1,79

1,80

1,81

1,82

1,83

1,84

1,85

1,86

1,87

1,88

1,881

1,89

1,90

1,91

1,92

1,93

1,94

1,95

1,960

1,97

1,98

1,99

2,00

2,01

2,02

2,03

2,04

2,05

2,054

2,06

2,07

0,1707

0,1676

0,1645

0,1615

0,16

0,0784

0,0767

0,0751

0,0734

0,0719

0,0703

0,0688

0,0672

0,0658

0,0643

0,0629

0,0615

0,0601

0,06

0,0588

0,0574

0,0561

0,0549

0,0536

0,0524

0,0512

0,05

0,0488

0,0477

0,0466

0,0455

0,0444

0,0434

0,0424

0,0414

0,0404

0,04

0,0394

0,0385

1,72

1,73

1,74

1,75

1,751

2,14

2,15

2,16

2,17

2,18

2,19

2,20

2,21

2,22

2,23

2,24

2.25

2,26

2,27

2,28

2,29

2,30

2,31

2,32

2,326

2,33

2,34

2,35

2,36

2,37

2,38

2,39

2,40

2,41

2,42

2,43

2,44

2,45

2,46

Page 263: Epidemiología y bioestadística secretos   nordness1ed

Fuente de los datos: National Bureau of Standards. Applied Mathematics Series-23. US Government Printing Office,Washington, D.C., 1953. Resumido por Shott, S. Statistics for Health Professionals. Philadelphia, W.B. SaundersCompany, 1990. Utilizada con permiso.* Instrucciones para el empleo de la tabla para determinar el valor de p que corresponde a un valor z calculado:en la columna de la izquierda (encabezada con z), se mira el valor de z hallado en los cálculos. Mire la primera columna de la derecha (valor de p con una cola) o la segunda columna a la derecha (para un valor de p con dos colas)que corresponde al valor de z obtenido. Por ejemplo, un valor de z de 1,74 corresponde a un valor de p de dos colas de 0,0819.Instrucciones para el empleo de la tabla para determinar el valor de z que corresponde a un valor p calculado:para encontrar el valor apropiado de z para su empleo en los límites de confianza o determinaciones del tamaño de lamuestra, se define un valor p deseado con una cola o con dos colas, se mira en la segunda o tercera columna, respectivamente, y se determina el valor correspondiente de z en la izquierda. Por ejemplo, para un alfa de 0,05 condos colas, el valor correspondiente de z es 1,960; y para una beta de una cola de 0,20, el valor correspondiente de zes 0,8416.

TA B L A A . • D I S T R I B U C I Ó N N O R M A L E S TA N DA R I Z A DA – P R O BA B I L I DA D E S D E L A S C O L A S ( TA B L A D E L O S VA L O R E S z ) * ( C o n t . )

z

APÉNDICE A 269

0,0135

0,0131

0,0128

0,0124

0,0121

0,0117

0,0027

0,0023

0,002

0,0019

0,0016

0,0014

0,0012

0,001

0,0010

0,0008

0,0007

0,0006

0,0005

0,0004

0,0003

0,0003

0,0002

0,0002

0,0001

0,0068

0,0066

0,0064

0,0062

0,0060

0,0059

0,0013

0,0011

0,001

0,0010

0,0008

0,0007

0,0006

0,0005

0,0005

0,0004

0,0003

0,0003

0,0002

0,0002

0,0002

0,0001

0,0001

0,0001

0,0001

0,0188

0,0183

0,0179

0,0174

0,0170

0,0166

0,0057

0,0055

0,0054

0,0052

0,0051

0,005

0,0049

0,0048

0,0047

0,0045

0,0044

0,0043

0,0041

0,0040

0,0035

0,0030

0,0026

0,0022

0,0019

0,0016

2,08

2,09

2,10

2,11

2,12

2,13

2,53

2,54

2,55

2,56

2,57

2,576

2,58

2,59

2,60

2,61

2,62

2,63

2,64

2,65

2,70

2,75

2,80

2,85

2,90

2,95

0,0375

0,0366

0,0357

0,0349

0,0340

0,0332

0,0114

0,0111

0,0108

0,0105

0,0102

0,01

0,0099

0,0096

0,0093

0,0091

0,0088

0,0085

0,0083

0,0080

0,0069

0,0060

0,0051

0,0044

0,0037

0,0032

2,47

2,48

2,49

2,50

2,51

2,52

3,00

3,05

3,090

3,10

3,15

3,20

3,25

3,291

3,30

3,35

3,40

3,45

3,50

3,55

3,60

3,65

3,70

3,75

3,80

Probabilidad

de dos colas

Probabilidad de

la cola superior

Probabilidad de

la cola superior

Probabilidad

de dos colas z

Page 264: Epidemiología y bioestadística secretos   nordness1ed

TA B L A B . • P U N T UA C I Ó N O VA L O R D E L P O R C E N TA J E S U P E R I O R PA R A L A S D I S T R I B U C I O N E SD E L A t *

Probabilidad de la cola superior

df

271

APÉNDICE B

12,706

4,303

3,182

2,776

2,571

2,447

2,365

2,306

2,262

2,228

2,201

2,179

2,160

2,145

2,131

2,120

2,110

2,101

2,093

2,086

2,080

2,074

2,069

2,064

2,060

2,056

2,052

2,048

2,045

1,963

1,386

1,250

1,190

1,156

1,134

1,119

1,108

1,100

1,093

1,088

1,083

1,079

1,076

1,074

1,071

1,069

1,067

1,066

1,064

1,063

1,061

1,060

1,059

1,058

1,058

1,057

1,056

1,055

0,325

0,289

0,277

0,271

0,267

0,265

0,263

0,262

0,261

0,260

0,260

0,259

0,259

0,258

0,258

0,258

0,257

0,257

0,257

0,257

0,257

0,256

0,256

0,256

0,256

0,256

0,256

0,256

0,256

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

0,727

0,617

0,584

0,569

0,559

0,553

0,549

0,546

0,543

0,542

0,540

0,539

0,537

0,537

0,536

0,535

0,534

0,534

0,533

0,533

0,532

0,532

0,532

0,531

0,531

0,531

0,531

0,530

0,530

1,376

1,061

0,978

0,941

0,920

0,906

0,896

0,889

0,883

0,879

0,876

0,873

0,870

0,868

0,866

0,865

0,863

0,862

0,861

0,860

0,859

0,858

0,858

0,857

0,856

0,856

0,855

0,855

0,854

6,314

2,920

2,353

2,132

2,015

1,943

1,895

1,860

1,833

1,812

1,796

1,782

1,771

1,761

1,753

1,746

1,740

1,734

1,729

1,725

1,721

1,717

1,714

1,711

1,708

1,706

1,703

1,701

1,699

3,078

1,886

1,638

1,533

1,476

1,440

1,415

1,397

1,383

1,372

1,363

1,356

1,350

1,345

1,341

1,337

1,333

1,330

1,328

1,325

1,323

1,321

1,319

1,318

1,316

1,315

1,314

1,313

1,311

0,0250,150,40 0,30 0,20 0,050,10

(Continúa)

Page 265: Epidemiología y bioestadística secretos   nordness1ed

TA B L A B . P U N T UA C I Ó N O VA L O R D E L P O R C E N TA J E S U P E R I O R PA R A L A S D I S T R I B U C I O N E SD E L A t * ( C o n t . )

Probabilidad de la cola superior

df

APÉNDICE B272

2,042

2,021

2,000

1,980

1,960

1,055

1,050

1,045

1,041

1,036

0,256

0,255

0,254

0,254

0,253

30

40

60

120

0,530

0,529

0,527

0,526

0,524

0,854

0,851

0,848

0,845

0,842

1,697

1,684

1,671

1,658

1,645

1,310

1,303

1,296

1,289

1,282

0,150,40 0,30 0,20 0,050,10 0,025

Page 266: Epidemiología y bioestadística secretos   nordness1ed

TA B L A B . • P U N T UA C I Ó N O VA L O R D E L P O R C E N TA J E S U P E R I O R PA R A L A S D I S T R I B U C I O N E SD E L A t * ( C o n t . )

Probabilidad de la cola superior

df

273

Fuente: Shott, S, Statistics for Health Professionals. Philadelphia, W.B. Saunders, 1990. Utilizada con permiso.* Instrucciones para el empleo de la tabla: para determinar el valor de p que corresponde a un valor de t calculado,primero se mira en la línea que corresponde a la columna de los grados de libertad (df) en la izquierda. A continuación en el centro de la tabla se mira el valor que más se aproxima al valor de t encontrado a partir de loscálculos. (1) Para una prueba de la t de una cola: se mira en la fila superior para encontrar la probabilidad correspondiente. Por ejemplo, un valor de t de 2,147 con 30 df corresponde a un valor de p de 0,02. Si el valor de tobservado se encuentra entre los valores dados, se dan los dos valores de p entre los que caen los resultados de laprueba de la t. Por ejemplo, si se encuentra una t de 2,160 con 30 df, la probabilidad se expresa como sigue:0,015 < p < 0,02. (2) Para una prueba de la t con dos colas: el procedimiento es el mismo que para la prueba de unacola, con la excepción de que el valor de p obtenido debe ser duplicado para incluir la probabilidad de la otra cola. Porejemplo, si una prueba de la t de dos colas da un valor de t de 2,147 con 30 df, se debe duplicar el valor de p de dichacolumna (0,02) para dar el valor correcto de p de 0,04.

636,590

31,598

12,924

8,610

6,869

5,959

5,408

5,041

4,781

4,587

4,437

4,318

4,221

4,140

4,073

4,015

3,965

3,922

3,883

3,849

3,819

3,792

3,768

3,745

3,725

3,707

3,690

3,674

3,659

3,646

3,551

3,460

3,373

3,291

42,434

8,073

5,047

4,088

3,634

3,372

3,203

3,085

2,998

2,932

2,879

2,836

2,801

2,771

2,746

2,724

2,706

2,689

2,674

2,661

2,649

2,639

2,629

2,620

2,612

2,605

2,598

2,592

2,586

2,581

2,542

2,504

2,468

2,432

15,895

4,849

3,482

2,999

2,757

2,612

2,517

2,449

2,398

2,359

2,328

2,303

2,282

2,264

2,249

2,235

2,224

2,214

2,205

2,197

2,189

2,183

2,177

2,172

2,167

2,162

2,158

2,154

2,150

2,147

2,123

2,099

2,076

2,054

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

40

60

120

21,205

5,643

3,896

3,298

3,003

2,829

2,715

2,634

2,574

2,527

2,491

2,461

2,436

2,415

2,397

2,382

2,368

2,356

2,346

2,336

2,328

2,320

2,313

2,307

2,301

2,296

2,291

2,286

2,282

2,278

2,250

2,223

2,196

2,170

31,821

6,965

4,541

3,747

3,365

3,143

2,998

2,896

2,821

2,764

2,718

2,681

2,650

2,624

2,602

2,583

2,567

2,552

2,539

2,528

2,518

2,508

2,500

2,492

2,485

2,479

2,473

2,467

2,462

2,457

2,423

2,390

2,358

2,326

127,322

14,089

7,453

5,598

4,773

4,317

4,029

3,833

3,690

3,581

3,497

3,428

3,372

3,326

3,286

3,252

3,222

3,197

3,174

3,153

3,135

3,119

3,104

3,091

3,078

3,067

3,057

3,047

3,038

3,030

2,971

2,915

2,860

2,807

63,657

9,925

5,841

4,604

4,032

3,707

3,499

3,355

3,250

3,169

3,106

3,055

3,012

2,977

2,947

2,921

2,898

2,878

2,861

2,845

2,831

2,819

2,807

2,797

2,787

2,779

2,771

2,763

2,756

2,750

2,704

2,660

2,617

2,576

0,00050,00750,02 0,015 0,01 0,00250,005

Page 267: Epidemiología y bioestadística secretos   nordness1ed

275

APÉNDICE C

Véanse las páginas 276-279 para la Tabla C.

Page 268: Epidemiología y bioestadística secretos   nordness1ed

276APÉN

DICE C

TA B L A C . P U N T UA C I Ó N O VA L O R D E L P O R C E N TA J E S U P E R I O R PA R A L A S D I S T R I B U C I O N E S D E L A J I A L C UA D R A D O * ( C o n t . )

Probabilidad

df

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

0,60

0,275

1,022

1,869

2,753

3,655

4,570

5,493

6,423

7,357

8,295

9,237

10,182

11,129

12,078

13,030

13,983

14,937

15,893

16,850

17,809

18,768

19,729

0,70

0,148

0,713

1,424

2,195

3,000

3,828

4,671

5,527

6,393

7,267

8,148

9,034

9,926

10,821

11,721

12,624

13,531

14,440

15,352

16,266

17,182

18,101

0,95

0,00393

0,103

0,352

0,711

1,145

1,635

2,167

2,733

3,325

3,940

4,575

5,226

5,892

6,571

7,261

7,962

8,672

9,390

10,117

10,851

11,591

12,338

0,9995

0,000000393

0,00100

0,0153

0,0639

0,158

0,299

0,485

0,710

0,972

1,265

1,587

1,934

2,305

2,697

3,108

3,536

3,980

4,439

4,912

5,398

5,896

6,404

0,995

0,0000393

0,0100

0,0717

0,207

0,412

0,676

0,989

1,344

1,735

2,156

2,603

3,074

3,565

4,075

4,601

5,142

5,697

6,265

6,844

7,434

8,034

8,643

0,99

0,000157

0,0201

0,115

0,297

0,554

0,872

1,239

1,646

2,088

2,558

3,053

3,571

4,107

4,660

5,229

5,812

6,408

7,015

7,633

8,260

8,897

9,542

0,975

0,000982

0,0506

0,216

0,484

0,831

1,237

1,690

2,180

2,700

3,247

3,816

4,404

5,009

5,629

6,262

6,908

7,564

8,231

8,907

9,591

10,283

10,982

0,90

0,0158

0,211

0,584

1,064

1,610

2,204

2,833

3,490

4,168

4,865

5,578

6,304

7,042

7,790

8,547

9,312

10,085

10,865

11,651

12,443

13,240

14,041

0,80

0,0642

0,446

1,005

1,649

2,343

3,070

3,822

4,594

5,380

6,179

6,989

7,807

8,634

9,467

10,307

11,152

12,002

12,857

13,716

14,578

15,445

16,314

Page 269: Epidemiología y bioestadística secretos   nordness1ed

TA B L A C . P U N T UA C I Ó N O VA L O R D E L P O R C E N TA J E S U P E R I O R PA R A L A S D I S T R I B U C I O N E S D E L A J I A L C UA D R A D O * ( C o n t . )

Probabilidad

dl

Probabilidad

df

23

24

25

26

27

28

29

30

35

40

45

50

60

70

80

90

100

120

140

160

180

200

277APÉN

DICE C

0,70

19,021

19,943

20,867

21,792

22,719

23,647

24,577

25,508

30,178

34,872

39,585

44,313

53,809

63,346

72,915

82,511

92,129

111,419

130,766

150,158

169,588

189,049

0,95

13,091

13,848

14,611

15,379

16,151

16,928

17,708

18,493

22,465

26,509

30,612

34,764

43,188

51,739

60,391

69,126

77,929

95,705

113,659

131,756

149,969

168,279

0,9995

6,924

7,453

7,991

8,538

9,093

9,656

10,227

10,804

13,787

16,906

20,137

23,461

30,340

37,467

44,791

52,276

59,896

75,467

91,391

107,597

124,033

140,660

0,995

9,260

9,886

10,520

11,160

11,808

12,461

13,121

13,787

17,192

20,707

24,311

27,991

35,534

43,275

51,172

59,196

67,328

83,852

100,655

117,679

134,884

152,241

0,99

10,196

10,856

11,524

12,198

12,879

13,565

14,256

14,953

18,509

22,164

25,901

29,707

37,485

45,442

53,540

61,754

70,065

86,923

104,034

121,346

138,820

156,432

0,975

11,689

12,401

13,120

13,844

14,573

15,308

16,047

16,791

20,569

24,433

28,366

32,357

40,482

48,758

57,153

65,647

74,222

91,573

109,137

126,870

144,741

162,728

0,90

14,848

15,659

16,473

17,292

18,114

18,939

19,768

20,599

24,797

29,051

33,350

37,689

46,459

55,329

64,278

73,291

82,358

100,624

119,029

137,546

156,153

174,835

0,80

17,187

18,062

18,940

19,820

20,703

21,588

22,475

23,364

27,836

32,345

36,884

41,449

50,641

59,898

69,207

78,558

87,945

106,806

125,758

144,783

163,868

183,003

0,60

20,690

21,652

22,616

23,579

24,544

25,509

26,475

27,442

32,282

37,134

41,995

46,864

56,620

66,396

76,188

85,993

95,808

115,465

135,149

154,856

174,580

194,319

Page 270: Epidemiología y bioestadística secretos   nordness1ed

278APÉN

DICE C

TA B L A C . P U N T UA C I Ó N O VA L O R D E L P O R C E N TA J E S U P E R I O R PA R A L A S D I S T R I B U C I O N E S D E L A J I A L C UA D R A D O * ( C o n t . )

Probabilidad

dl

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

0,005

7,879

10,597

12,838

14,860

16,750

18,548

20,278

21,955

23,589

25,188

26,757

28,300

29,819

31,319

32,801

34,267

35,718

37,156

38,582

39,997

41,401

42,796

44,181

45,559

46,928

48,290

0,05

12,116

15,202

17,730

19,997

22,105

24,103

26,018

27,868

29,666

31,420

33,137

34,821

36,478

38,109

39,719

41,308

42,879

44,434

45,973

47,498

49,011

50,511

52,000

53,479

54,947

56,407

0,01

6,635

9,210

11,345

13,277

15,086

16,812

18,475

20,090

21,666

23,209

24,725

26,217

27,688

29,141

30,578

32,000

33,409

34,805

36,191

37,566

38,932

40,289

41,638

42,980

44,314

45,642

0,10

2,706

4.605

6,251

7.779

9,236

10,645

12,017

13,362

14,684

15,987

17,275

18,549

19,812

21,064

22,307

23,542

24,769

25,989

27,204

28,412

29,615

30,813

32,007

33,196

34,382

35,563

0,50

0,455

1,386

2,366

3,357

4,351

5,348

6,346

7,344

8,343

9,342

10,341

11,340

12.340

13,339

14,339

15,338

16,338

17,338

18,338

19,337

20,337

21,337

22,337

23,337

24,337

25,336

0,40

0,708

1,833

2,946

4,045

5,132

6,211

7,283

8,351

9,414

10,473

11,530

12,584

13,636

14,685

15,733

16,780

17,824

18,868

19,910

20,951

21,991

23,031

24,069

25,106

26,143

27,179

0,30

1,074

2,408

3,665

4,878

6,064

7,231

8,383

9,524

10,656

11,781

12,899

14,011

15,119

16,222

17,322

18,418

19,511

20,601

21,689

22,775

23,858

24,939

26,018

27,096

28,172

29,246

0,20

1,642

3,219

4,642

5,989

7,289

8,558

9,803

11,030

12,242

13,442

14,631

15,812

16,985

18,151

19,311

20,465

21,615

22,760

23,900

25,038

26,171

27,301

28,429

29,553

30,675

31,795

0,05

3,841

5,991

7,815

9,488

11,070

12,592

14,067

15,507

16,919

18,307

19,675

21,026

22,362

23,685

24,996

26,296

27,587

28,869

30,144

31,410

32,671

33,924

35,172

36,415

37,652

38,885

0,025

5,024

7,378

9,348

11,143

12,833

14,449

16,013

17,535

19,023

20,483

21,920

23,337

24,736

26,119

27,488

28,845

30,191

31,526

32,852

34,170

35,479

36,781

38,076

39,364

40,646

41,923

Page 271: Epidemiología y bioestadística secretos   nordness1ed

Fuente de los datos: derechos de autor 1982, Novartis. Reimpresa con permiso de Geigy Scientific Tables, 8.a ed., editada por Lentner, C. Todos los derechos reservados. Resumida por Shott, S. Statistics for Health Professionals, Philadelphia, W.B. Saunders Company, 1990.*Instrucciones para el uso de la tabla: determinar los grados de libertad (df) apropiados a la prueba de la ji al cuadrado calculada e ir a la línea correspondiente más próxima, utilizando la columnade la izquierda (encabezada con df). En dicha línea, moverse hacia la derecha en el cuerpo de la tabla y encontrar el valor de la ji al cuadrado que corresponde al calculado. Se encuentra el correspon-diente valor de p en la parte alta de dicha columna. Por ejemplo, con 6 df, la ji al cuadrado calculada de 12,592 corresponde a un valor de p de 0,05. Si el valor de la ji al cuadrado calculado cae entredos columnas de la tabla, se ponen los dos valores de p entre los que caen los resultados de la prueba de la ji al cuadrado. Por ejemplo, con 6 df, la probabilidad de una ji al cuadrado de 13,500 seexpresa como sigue: 0,025 < p < 0,05.

TA B L A C . P U N T UA C I Ó N O VA L O R D E L P O R C E N TA J E S U P E R I O R PA R A L A S D I S T R I B U C I O N E S D E L A J I A L C UA D R A D O * ( C o n t . )

Probabilidad

df

27

28

29

30

35

40

45

50

60

70

80

90

100

120

140

160

180

200

279APÉN

DICE C

0,70

49,645

50,993

52,336

53,672

60,275

66,766

73,166

79,490

91,952

104,215

116,321

128,299

140,169

163,648

186,847

209,824

232,620

255,264

0,60

57,858

59,300

60,735

62,162

69,199

76,095

82,876

89,561

102,695

115,578

128,261

140,782

153,167

177,603

201,683

225,481

249,048

272,423

0,80

46,963

48,278

49,588

50,892

57,342

63,691

69,957

76,154

88,379

100,425

112,329

124,116

135,807

158,950

181,840

204,530

227,056

249,455

36,741

37,916

39,087

40,256

46,059

51,805

57,505

63,167

74.397

85,527

96,578

107,565

118,498

140,233

161,827

183,311

204,704

226,021

0,9995

26,336

27,336

28,336

29,336

34,336

39,335

44,335

49,335

59,335

69,334

79,334

89,334

99,334

119,334

139,334

159,334

179,334

199,334

0,995

28,214

29,249

30,283

31,316

36,475

41,622

46,761

51,892

62,135

72,358

82,566

92,761

102,946

123,289

143,604

163,898

184,173

204,434

0,99

30,319

31,391

32,461

33.530

38,859

44,165

49,452

54,723

65,227

75,689

86,120

96,524

106,906

127,616

148,269

168,876

189,446

209,985

32,912

34,027

35,139

36,250

41,778

47,269

52,729

58,164

68,972

79,715

90,405

101,054

111,667

132,806

153,854

174,828

195,743

216,609

40,113

41,337

42,557

43,773

49,802

55,758

61,656

67,505

79,082

90,531

101,879

113,145

124,342

146,567

168,613

190,516

212,304

233,994

43,195

44,461

45,722

46,979

53,203

59,342

65,410

71,420

83,298

95,023

106,629

118,136

129,561

152,211

174,648

196,915

219,044

241,058

0,975 0,95 0,90

Page 272: Epidemiología y bioestadística secretos   nordness1ed

281

ÍNDICE ALFABÉTICO

A

Accidente cerebrovascular mortal, cálculo riesgo, 46-47

Acuerdo intragrupal, pruebas diagnósticas, 209Aerosolización, agente infeccioso, 92Agency for Toxic Substances and Disease Registry

(ATSDR), 66Ajuste tasas, 40-43– – método directo, 40, 42-43– – – indirecto, 40, 42-43Alaska, fallecimientos ocupacionales, 70, 72Aleatorización, control factor confusión, 112– ensayo clínico, 98, 109, 110, 112– finalidad, 109– selección muestra, 191Alfa α, 175, 176– – definición, 134– – relación beta (β), 176Alfabeto, conjunto datos discretos, 149American Statistical Association, 21– – Society, 21Análisis bivariante, 223-240

– – definición, 223– – diagramas dispersión, 128, 224, 225, 226, 227,

232, 233– – prueba no paramétrica, 234-235– – – – – definición, 226– – – – – estadística ji cuadrado, 222, 235-236– – – – – prueba Kruskal-Wallis, 224, 235– – – – – – McNemar, 224, 238– – – – – – U Mann-Whitney, 224, 234-235– – – – – – Wilcoxon, 224, 234– – – paramétrica, coeficiente correlación

Pearson, 225, 226– – – – definición, 224– – – – regresión lineal, 224– – regresión lineal, 137, 227-229– – – – ajuste línea regresión, 231-232– – – – coeficiente determinación, 229– – – – comparación análisis regresión

logística, 245, 246– – – – prueba F, 230– – – – herramienta predicción, 227

Análisis bivariante, regresión lineal simple, 227-229– – – – valores x, 232– – – – – y, 232– covarianza (ANCOVA), 248– función discriminante, 250– grupos, 250, 251– logarítmico lineal, 250– multivariable, 241-252

– – análisis función discriminante, 250– – definición, 241– – diferenciación análisis multivariante, 241– – opción tipo apropiado, 241, 242– multivariante, 241-252

– – diferenciación análisis multivariable, 241– – varianza (MANOVA), 250– regresión, 137-138. Ver también Análisis regresión

lineal; Análisis regresión logística; Análisisregresión múltiple

– – lineal, 137-138– – – ajuste línea regresión, 229-230– – – coeficiente determinación, 227-229– – – diferenciación análisis regresión logística,

245, 246– – – herramienta predicción, 227– – – múltiple, 245– – – prueba F, 230– – – simple, 227-229– – – – valores x, 232– – – – – y, 232– – logística, 137-138– – – coeficiente b, 245, 247– – – diferenciación análisis regresión lineal, 245, 246– – – logaritmo natural (n), 246– – múltiple, 244– – – coeficiente regresión, 244– – requerimiento datos, 243, 244– supervivencia, 253-264

– – definición, 138– – diferenciada de regresión lineal/logística, 138– varianza (ANOVA), 222, 242, 243, 248, 249Analogía, causalidad, 98ANCOVA (análisis covarianza), 248ANOVA (análisis varianza), 220, 240, 241, 246, 247

Los números de página en negrita indican capítulos completos.

Page 273: Epidemiología y bioestadística secretos   nordness1ed

Área bajo curva, distribución normal, 155Armas químicas, 92Artefacto (carácter espurio), 95Artículos revista, en medicina basada evidencia,

118, 119, 123Asignación aleatoria, selección muestra, 191Asociación, análisis bivariante, 223– – multivariable, 241– exposición-desenlace, 98– frente a causalidad, 95– fuerza, 98– metaanálisis, 102– modificación efecto, 99– relación con causalidad, 95– tipos, 95, 96Azar, 95, 96

B

Bacteriemia, neumocócica, 81Baker, George, 17Bases datos, evidencia recurso medicina basadaevidencia, 117, 123Bayes, Thomas, 202Behavioral Risk Factor Surveillance System (BRFSS),

65, 66Beta (β), 175, 176– – definición, 134– – potencia, 134– – relación alfa (α), 176Bioestadística, conceptos básicos, 127-138

– definición, 127– utilidad, 127Bondad ajuste, prueba ji cuadrado, 222Botulismo, agente bioterrorismo, 91– enfermedad declaración obligatoria, 64Broad Street, Londres, 21Brotes, investigación, 89, 90Brown, Mary, 25Brucelosis, agente bioterrorismo, 91– enfermedad declaración obligatoria, 64Budd, William, 24Bureau of Labour Statistics, 67

C

Cadena infección, 81California, letalidad laboral, 70, 72Calostro, 83Cáncer escrotal, 18-19– pulmonar, tabaquismo como factor riesgo, 26-27,

32-33, 98-99Carácter espurio (artefactos), 95Carbunco, agente bioterrorismo, 91– enfermedad declaración obligatoria, 64Causalidad, 95– consistencia, 97– criterios Hill, 97– definición, 95

Causalidad directa, diferenciación causalidadindirecta, 98

– enfermedad, triángulo epidemiológico, 79, 80– especificidad, 97– factor confusión, 98,– indirecta, diferenciación causalidad directa, 98– necesaria pero no suficiente, 98– – y suficiente, 98– ni suficiente ni necesaria, 98– prueba, 95– relación con asociación, 95, 223– suficiente pero no necesaria, 98– temporalidad, 97– tipos, 98Censo, 62, 63, 67– Estados Unidos, 62, 63, 67Censura derecha, 254– – tipos, 255– intervalo, 254– izquierda, 254– relación sesgo, 256– supuesto principal, 254Centers for Disease Control and Prevention (CDC), 81– – – – – – – Behavioral Risk Factor Surveillance

System (BRFSS), 65, 66– – – – – – – fuente información respuesta

bioterrorismo, 91– – – – – – – National Center for Health Statistics

(NCHS), 61-62– – – – – – – – Notifiable Disease Surveillance System

(NNDSS), 62-63– – – – – – – Office of Malaria Control in War

Areas, 15, 26– – – – – – – recomendaciones vigilancia

hepatitis C, 89-90– – Medicare and Medicaid Services (CMS), 66Certificados defunción, 40Chancroide, enfermedad declaración obligatoria, 64Clasificadores prueba, medición acuerdo, 208-209Clergy Orphan’s School, St. John’s Wood, Londres, 24Clinical Laboratory Improvement Amendments

(CLIA), 66Clínicamente significativo, diferenciación

estadísticamente significativo, 179Coccidioidomicosis, enfermedad declaración

obligatoria, 64Cociente crítico, 214– – prueba, datos dos muestras, 215– – relación datos pareados, 215– – tamaño, 216– F, 248– riesgo, 262– verosimilitud, cálculo, 204, 205– – definición, 204– – negativo, 118, 119– – positivo, 118, 119– – uso, 204-205

ÍNDICE ALFABÉTICO282

Page 274: Epidemiología y bioestadística secretos   nordness1ed

Coeficiente b, análisis, regresión logística, 248– correlación Pearson, 137, 225, 226, 227, 232– – – valores r, 225, 226, 227– – población. Ver Coeficiente correlación Pearson– determinación, 229– – ejemplo, 230– logit, 246, 247– regresión b, 245, 247Cogswell, William, 21Coherencia, 98Cólera, 20, 21, 22, 32– enfermedad declaración obligatoria, 64Cólico Devonshire, 17Complemento, probabilidad, 131Comprobación hipótesis, 32-33. Ver tambiénHipótesis cero (H0)– – correlación rangos Spearman, 232– – definición, 173, 176Confusión, análisis multivariable, 241Consistencia, 97Construcción modelo, regresión lineal

múltiple, 244, 245– – – logística, 247, 248Contraste hipótesis, 173-182

Coronavirus asociado síndrome respiratorio agudograve (SARS-CoV), enfermedad declaraciónobligatoria, 64

Corrección Yates, 237Correlación canónica, 250, 251– coeficiente correlación Pearson, 225, 226– entre variables, 137– exigencia datos, 243– producto-momento. Ver Coeficiente correlación

Pearson– rangos Spearman, principios, 233Covariante, tasa riesgo dependiente tiempo, 249-250Creación gráficos, datos discretos, 149– – líneas, 127, 169, 170– – variables, 127Cribado bioestadístico, 135– objetivo, 32– sesgo tiempo inclusión, 101Criptosporidosis, enfermedad declaración

obligatoria, 64Criterio Cochran, 236, 238– Hill, para causalidad, 97Cuantil, distribuciones frecuencia, 142Cuartil, 142Curtosis, 130, 153– definición, 153– relación tendencia/dispersión central, 153-154Curva datos sesgados, 130– distribución frecuencias, sesgada, 152-153– – – cuantiles, 144– – – datos cuantitativos, 141-142– – – definición, 149– – – derivación estándar, 144-145

Curva datos distribución diferenciación distribuciónprobabilidades, 158-159

– – – dispersión, 158– – – distribución gaussiana, 129– – – – – aplicaciones, 154– – – – – curtosis cero, 130– – – – – definición, 154– – – – – normal, 132– – – – – puntuación zeta, 156, 157– – – – – teorema límite central, 157– – – formas, 152-153– – – puntuaciones zeta, 156, 157– – – recorrido, 144– – – simétrica, 144– – – tendencia central, 158– – – usos comunes, 150– eficacia diagnóstica (ROC), 136-137, 205, 206– – – – concentración glucosa, 207– epidémica, 88-89– exponencial, 242-243– forma campana. Ver Distribución gaussiana– geométrica, 242-243– logarítmica, 242-243– supervivencia, análisis covariable, 249– – Kaplan-Meier, 257, 259– – – análisis modelo riesgos proporcionalesCox, 249– – – representación, 261-262– – – prueba orden logarítmico, 262– – peldaños escalera, 259– – pruebas comparación, 262

D

Datos. Ver también Variables, análisis bivariante– categóricos, análisis regresión logística, 238– censurados, 253-256– – estudio supervivencia, 255– – ordenación suceso/tiempo censura, 261– cociente, 149– – distribución frecuencia, 152– – tendencia central, 151– continuos, 223– – análisis bivariante, 223– – cuantitativos, análisis correlación Pearson, 224– – – – – rangos Spearman, 224– – – – diagrama dispersión, 224– – – – prueba Kruskal-Wallis, 224– – – – – U Mann-Whitney, 224– – – – – Wilcoxon, 224– – datos cociente, 150– – – intervalo, 149– – diferenciación datos discretos, 149– – frecuencia distribución, 149– cualitativos, 139-140283– cuantitativos, 139– – frecuencia distribuciones, 141-142– descripción, 139-150

ÍNDICE ALFABÉTICO 283

Page 275: Epidemiología y bioestadística secretos   nordness1ed

Datos discretos, 223– – diferenciación datos continuos, 149– – nominales, 149– duración, 253– fiabilidad, 253– fuentes/vigilancia, 59-78

– historia suceso, 253– intervalo, 150– – distribución frecuencia, 152– – tendencia central, 151– muestrales, distribución, área bajo curva, 155, 156– – – normal, 154– nominales, 149– – tendencia central, 151– ordinales, 149– – tendencia central, 151– pareados, 224– poblacionales, distribución normal, 154– presentación, 163-172

– – diagrama cajas/bigotes, 167-168– – – circular (gráfico quesitos), 128, 169– – – tallo/hojas, 167– – gráfico líneas, 169-170– – histograma (gráfico barras), 88, 128, 164, 165,

166, 167, 169– – mapa distribución geográfica, 166, 167– – pictórica, 171– – polígono frecuencias, 128, 165, 166, 170– resumen, 139-150

– supuesto normalidad, 224– tiempo hasta fracaso, 253– vida sujeto, 223De Morbis Artificum Diatribe (Ramazzini), 16Decameron (Boccacio), 14Defense Medical Surveillance System (DMSS), 67Deficiencia niacina, 25– vitamina C, 16Dendrograma (diagrama arbóreo), 251Denominador, valoración riesgo, 52-53Deriva antigénica, 84Deshollinadores, cáncer escrotal, 19Desigualdad de Chebyshev, 129Desviación estándar, 129, 130, 144, 145, 146,

152, 180– – cálculo, 129, 152– – definición, 152– – diferenciación varianza, 129Determinación probabilidad, 131, 184, 189– – complemento suceso, 131– – diagrama Venn, 131, 187, 189– – intersección sucesos, 131– – ley aditiva, 132, 189, 190– – – multiplicativa, 132– – – – para sucesos independientes, 132-133– – unión sucesos, 131Diagrama árbol (dendrograma), 251– barras, definición, 165

Diagrama cajas, 128– cajas/bigotes, 167-168– – valor externo, 168– – – remoto, 168– – ventaja, 168– dispersión, 225– – debilidad, 225– – sinónimos, 224– tallo/hojas, 167– tarta (gráfico quesitos), 127, 169– – – – definición, 169– – – – desventaja, 169– Venn, 131– – sucesos mutuamente excluyentes, 187– – – no mutuamente excluyentes, 187Dibujos, 171Difteria, enfermedad declaración obligatoria, 64Diseño disperso, correlación, 226, 228– – debilidad, 225– estudio analítico, 102, 111– investigación, definición, 103– modelo investigación, 103-114

– – – ventajas/desventajas, 36Dispersión, 147– efecto valores extremos, 153-154– medidas, 128, 144, 151, 152– relación curtosis, 153-154Distribución bimodal, 152-153– binomial, 160-162– cálculo proporción exacta, 155– frecuencias, 149-162

– – aplicaciones, 150– Gauss, curtosis cero, 130– gaussiana, 129, 132, 154-158– – definición, 154– – puntuación zeta, 156, 157– – regla empírica, 129– – teorema límite central, 156, 157– – usos, 154– nominal. Ver Distribución gaussiana– normal, 211. Ver también Distribución gaussiana– probabilidades, 149-162

– – cálculo distribución binomial, 160-162– – continua, 159, 160– – diferenciación distribución frecuencias, 158-159– – ejes x/y, 159– sesgada, 130, 143, 144, 153– – definición, 153– – derecha, ejemplo, 153– – efectos en media/mediana/moda, 154– t, comparación distribución z, 213– – de Student, 211-222

– – valores porcentaje superior, 271-273

– z, 211– – frente a distribución t, 213– – – – prueba t, 213Divorcio, determinación riesgo, 48

ÍNDICE ALFABÉTICO284

Page 276: Epidemiología y bioestadística secretos   nordness1ed

Dugas, Gaetan, 25, 27Duración datos, 253

E

Ecuación 1-β, 134, 176– regresión lineal, diferenciación ecuación regresiónlogística, 245-246Efecto trabajador sano, 101Ehrlichiosis, enfermedad declaración obligatoria, 64Ejemplo riesgo atribuible, 54, 55– tanque entrenamiento escape submarino,proporción probabilidades, 52Elecciones presidenciales, probabilidad, 188Electroforesis, gel campo pulsado (PFGE), 89Emparejamiento, control factor confusión, 112– desventajas, 113Encefalitis, enfermedad declarable, 64Endemia, diferenciación epidemia/pandemia, 87Enfermedad declaración obligatoria, 62-63– infecciosa, detección, 88, 89– – uso bioterrorismo, 90-91– Lyme, distribución geográfica Estados Unidos, 167– – enfermedad declaración obligatoria, 64– meningocócica, enfermedad declaración

obligatoria, 64– transmisión, 79-94

– – cadena infección, 81– – directa, 80-81, 82– – indirecta, 80-81, 82– – triángulo epidemiológico, 79, 80Enfoque poblacional, determinación recorrido

normal, 195– – uso, 195Enmascaramiento, 112Ensayo clínico aleatorio, 98, 109, 110, 112– – controlado, 109-111, 113– inmunoabsorbente ligado a enzimas (ELISA),

prueba anticuerpos hepatitis C, 90Epidemia, definición, 82, 87, 88– diferenciación endemia/pandemia, 87– propagada, 90– punto arranque, 88-89Epidemiología clínica, padre, 18– definición, 31, 35– descriptiva, 33– perspectiva histórica, 13-29

– principios, 31-44– suposiciones fundamentales, 32– utilidad, 32Epidemiólogo, 31Error aleatorio, 110, 147– estándar, 180– – cálculo única muestra, 213– – diferencia, 215-216– – media, 146, 158– – – muestral, 212– heteroscedástico, 247

Error medición, 146, 147– – sistemático (sesgo), 147– muestreo, 191, 192– – causas, 191– sistemático. Ver Sesgo– tipo I, 134, 175, 176– – II, 134, 175, 176Escala cocientes, 141– – valor cero significativo, 142– intervalos, 141– medida, 140, 141– nominal, 140– ordinal, 140-141Escorbuto, 15, 16, 23Escuela, vigilancia sindrómica, 91Especificidad, 135, 137– cálculo, 199– definición, 135, 198-199– prueba, cálculo, 118-119, 199– – relación tasa falsos positivos, 199-200– poblacional, 158– vital, 40– – definición, 61Estadístico F, 222, 248, 249– – grados libertad, 248– inferencial, interpretación, 158– ji cuadrado, 235-237– – – aplicaciones, 222– – – criterio de Cochran, 236– – – definición, 222– – – tablas contingencia 2 � 2, 236-237– – – – – – – – corrección Yates, 237– – – – – – – – prueba exacta Fisher, 238– – – – – – – – – McNemar, 238– – – valores porcentaje superior, 275-279

– Wald, 248Estados Unidos, letalidad laboral, 70, 72-74Estatura, correlación peso, 226, 228Estimador producto límite Kaplan-Meier, 259Estudio, 59– aleatorio controlado frente a estudio

observacional, 116– – – n = 1, 116– – propósito, 109– analítico, 103– cardíaco Framingham, 20, 26, 60– caso-control, 34, 35, 36– – anidado, 108– – determinación asociación, 96– – evidencia experimental, 96– – factores riesgo, 50, 51– – grupo control, 105– – posibilidad relativa, 51285– – razón relativa, controles pareados, 56– – riesgo relativo, 50– – sesgo, 110, 111, 112– – ventajas/desventajas, 35-36

ÍNDICE ALFABÉTICO 285

Page 277: Epidemiología y bioestadística secretos   nordness1ed

Estudio ciego, 112,– cohortes, 35, 36– – controlados, medición riesgo, 45– – determinación asociación, 96– – limitaciones, 108– – prospectivo, 106– – – diferenciación estudio cohorte

retrospectivo, 106– – prueba experimental, 97– – retrospectivo, 106– – riesgo relativo, 51-52– – sesgo selección, 110– – ventajas, 107,– – ventajas/desventajas, 36– correlación, 104– descriptivo, 33-34, 103, 106, 107– – tipos, 103– diagnóstico, evaluación basada evidencia, 122-123– doble ciego, 112– ecológico, 96– – (correlación), 33, 36, 104– – definición,– – ventajas/desventajas, 35-36– encuesta, debilidades, 59– – definición, 59– experimental, 34– – estrategia básica, 108– intervención, 104, 108-110– longitudinal. Ver Estudio cohortes– múltiple frente a estudio único, 116– National Centre for Health Statistics (NCHS), 65– observacional, 104– – frente a estudio controlado aleatorio, 116– poder bajo, 182– pronóstico, evaluación basada evidencia, 123-124– prospectivo. Ver Estudio cohorte– terapéutico, valoración basada evidencia, 124– transversal, 33-34, 36, 103, 104– – prueba experimental, 98– – sesgo selección, 110– – ventajas/desventajas, 35-36Evidencia experimental, jerarquía, medicina basada

evidencia, 115-116– investigación, 115. Ver también Evidencia

experimental, jerarquía, medicina basadaevidencia

Exactitud combinada con precisión, 82– diferenciación precisión, 196– ejemplos, 196-197, 198Exclusividad mutua, 131, 188, 189Expresión 1-β, 175

F

Fábrica cerveza Guinnes, 211Fabricación vino, 19Factor confusión, 95, 96, 98, 99, 112– – control, 112-113

Factor confusión, estudios correlación, 104– – minimización, 99– riesgo, definición, 95– – diferenciación causa, 95– – estudio caso-control, 50, 51– – formas, 48– – genético, 48– – medioambiental, 48– – relación riesgo enfermedad, 50-51– – relacionado estilo vida, 48– – sinergia, 99Falacia ecológica, 34, 96-97Fallecimientos específicos, causas concretas, método

estandarización, 44Farr, William, 21Fermentación, 19Fiebre amarilla, 20, 23-24– – enfermedad declaración obligatoria, 65– entérica (fiebre tifoidea), 24– hemorrágica vírica, agente bioterrorismo, 91– manchada Montañas Rocosas, enfermedad

declaración obligatoria, 64– puerperal, 18, 22-23– Q, agente bioterrorismo, 91– – enfermedad declaración obligatoria, 64– tifoidea, 24– – enfermedad declaración obligatoria, 65Fisher, John Dix, 21Flagelante, 15Fletcher, Richard, 21Florida, letalidad laboral, 70, 72Frecuencias acumulativas, 149– distribución, 149-162

Fuentes científicas actuales, 117– datos, vigilancia, 59-78

Fuerzas Armadas, reposición datos supervisiónmédica, 67-68

Función riesgo, 256– – definición, 249– – tipos, 257-258– supervivencia, 256, 257

G

Galeno, 13Gammagrafía ventilación-perfusión (V/Q),diagnóstico embolia pulmonar, 120, 121Gata, Masanoro, 15Gauss, Karl Friedrich, 129Georgia, letalidad laboral, 70, 72Giardiasis, enfermedad declaración

obligatoria, 64Goldberger, Joseph, 25-26Gonorrea, enfermedad declaración

obligatoria, 64Gossett, William, 209, 210286Gradiente biológico, 98Grados Celsius, 149-150

ÍNDICE ALFABÉTICO286

Page 278: Epidemiología y bioestadística secretos   nordness1ed

Grados, libertad, 213– – comparación dos muestras independientes,

215-216– Kelvin, 150Graficación, variables, 127Gráfico barras. Ver Histograma– dispersión, 224, 225– distribución conjunta, 224– líneas, 128, 169, 170– – definición, 169-170Graunt, John, 15, 18Gripe, 1918-1919, 84– curva epidémica origen único, 89– epidemia, 84, 85Grupo control, 113– – diferenciación grupo estudio, 56– – estudio caso-control, 105– – – – pareado, 56– estudio, diferenciación grupo control, 56– trabajo, pruebas diagnósticas, acuerdo, 209Guerra biológica, uso enfermedades infecciosas,

90, 91, 92– britanicofrancesa, 92– britanicoindia, 92– hispanoamericana,Guyatt, Gordon, 115

H

Health Insurance Portability and AccountabilityAct of 1996 (HIPAA), 66

Hepatitis A, transmisión indirecta, 80-81– B, inmunoglobulina, 83– C, programa vigilancia médica, 89-90– enfermedad declaración obligatoria, 64Herida, ventana del cuerpo, 13Hipócrates, 13, 15– inglés, 16Hipótesis alternativa, 133, 176– contraste, 173-182

– – cero (H0), 133, 173– – – aceptación, 174– – – aceptación/rechazo, correlación rangos

Spearman, 233– – – – error tipo I, 134, 176– – – – – – – II, 134– – – – estadístico ji cuadrado, 235-236– – – – – F, 251– – – – – valor p, 134– – – rechazo, 174Histograma, 88, 128, 164, 165, 166, 167, 169– comparación diagrama tallo/hojas, 167– debilidad, 164-165, 169– definición, 164– intervalos, 164Huésped, para enfermedad, 79, 80, 81, 82

I

Imágenes, presentación datos, 171Incidencia, 37, 47

Independencia, comprobación, 208– prueba ji cuadrado, 222Índice, diferenciación riesgo, 47– mortalidad específico edad, ajuste

indirecto, 42Infección aparente (sintomática), 82– bacteriana, resistente antibióticos, 81, 82– Chlamydia trachomatis, enfermedad declaración

obligatoria, 64– Escherichia coli 0104:H21, epidemia propagada, 90– estreptocócica, enfermedad declaración obligatoria,

64-65– gripe A, variación estacional, 86– – B, variación estacional, 86– Haemophilus influenzae, enfermedad declaración

obligatoria, 64– inaparente (asintomática), 82– micoplasma, variación estacional, 86– Staphylococcus aureus, variación

estacional, 86– Streptococcus pneumoniae, variación estacional, 86– varicela, enfermedad declaración obligatoria, 64– – virus inmunodeficiencia humana (VIH),

enfermedad declaración obligatoria, 64– teoría miasma, 13, 18Infecciosidad, 81Inferencia científica, 33– estadística, 133Información, presentación, primera etapa, 163– WHOSIS, 77Informe casos, 33, 35, 103, 104– – evidencia experimental, 96– Lalonde, 27– morbilidad, 40Inmunidad activa, 82– adquirida, 83– grupo, 83, 84– pasiva, 82– – adquirida artificialmente, 83– – – naturalmente, 82– tipos, 82Inmunoglobulina varicela zóster (VZIG), 86Intercuartil, 144Intersección, dos sucesos, 131Intervalo confianza, 181– – 95%, 219– – amplitud, 181, 221– – cálculo, prueba t de Student, 212– – definición, 137, 219– – frente a valor p, 181Intoxicación plomo, 17, 25Investigación epidemias, 79-94

– Medicare Current Beneficiary Survey (MCBS), 6687J

Jenner, Edward, 18, 19Joint Nation Comission on Heart Disease, 194-195

ÍNDICE ALFABÉTICO 287

Page 279: Epidemiología y bioestadística secretos   nordness1ed

Journal of the Plague Year (Defoe), 14Juego cartas, probabilidad, 182, 183, 184

K

Kappa, cálculo, 207-208– de Cohen (prueba de kappa), 207Kendall, valor tau, 232Kinyoun, Joseph, 21Kitasato, Shibasaburo, 15Koch, Robert, 20

L

Lancet, 24Lanzamiento moneda, suceso independiente, 185Lavado manos, prevención fiebre puerperal, 18, 22-23Legionelosis, enfermedad declaración obligatoria, 64Lepra (enfermedad de Hansen), enfermedad

declaración obligatoria, 64Lesiones laborales, mortalidad, 67-69, 71Letalidad laboral, 67, 68– – estadística vital trabajador, 70, 75– – por estado, incidencia, 70, 72-74– – – sector industrial, 68, 69, 70, 71Ley aditiva probabilidades, 131-132– multiplicadora probabilidad, para sucesos

independientes, 132-133– multiplicativa probabilidades, 132, 189, 190– Randsell, 21Lind, James, 17Línea regresión, 242Literatura médica, preguntas clave, 117Logaritmo neperiano, 246Louis, P.C.A., 18, 20-21

M

Malaria, enfermedad declaración obligatoria, 64Mallon, Mary, 25MANOVA (análisis multivariado varianza), 250Mapa distribución geográfica, 166-167Matriz similitud, 251Media, 128, 150– como indicador tendencia central, 142– diferenciación mediana, 128– distribución frecuencia simétrica, 144– – sesgada, 154– muestras población, 137– prueba F, 248Mediana, 128, 150– cálculo, 128– – distribución frecuencias, 142– como indicador tendencia central, 128, 141, 150– definición, 128, 142, 150– diferenciación media, 128– distribución frecuencias simétricas, 144– – sesgada, 154Medicaid, 66Medicare, 66

Medicare Current Beneficiary Survey (MCBS), 66Medicina basada evidencia, 115-126

– – – definición, 115– – – jerarquía, 115-116– – – preguntas antecedentes/primer plano, 116– – – puntos clave, 123– – – recursos en línea, 117, 118, 123– – – relación evidencia investigación/pericia

clínica/valores paciente, 115– preventiva, definición, 31Medición, error, 146, 147– escalas, 140, 141Medidas dispersión, 151Medio ambiente, papel en transmisión

enfermedades, 80Meningitis aséptica, variación estacional,

85, 86– enfermedad declaración obligatoria, 64Metaanálisis, 102, 113, 180Método actuarial (análisis tablas vida), 259– ANOVA, 230– enfoque afecciones, 196-197Militar, repositorio datos vigilancia médica, 67Minería datos (data mining), 177Mínimos cuadros ordinarios, 244, 247Moda, 128, 141, 150– definición, 150– diferenciación media, 128– – mediana, 128– distribución sesgada, 154Modalidad, definición, 152-153– distribución frecuencia, 152Modelo Eibull decreciente, 258– investigación, diseño, 111– logit, 246, 247– regresión probit, 247– – proporcionales Cox, 249– – – análisis multivariable, 241, 242, 243– – – – asunción riesgos proporcionalidad, 249– supervivencia exponencial, 257– – logaritmo-normal, 258-259– Weibull creciente, 258Modificación efecto, 98Modo, distribuciones frecuencia simétricas, 144Montana, letalidad laboral, 70, 73Morbidity and Mortality Weekly Report (MMWR),

27, 60Morbilidad, medidas, 38Mortalidad, medidas, 36– proporcional, 39Mosquitos, vectores fiebre amarilla, 23-24Muerte negra, 14– relacionada trabajo. Ver Letalidad laboralMuestra, desviación estándar, 144-145– repetida, diferencia, 157288Muestreo, 190-192– definición, 190

ÍNDICE ALFABÉTICO288

Page 280: Epidemiología y bioestadística secretos   nordness1ed

N

Natick, Massachusetts, 26National Center for Health Statistics (NCHS), 61-62,

63, 65, 66, 67– – – Injury Prevention and Control (NCIPC), 63– Health and Nutrition Examination Survey

(NCHS), 63– – Care Survey (NHCS), 63– – Interview Study (NHS), 64– Immunization Survey (NIS), 64– Institute for Occupational Safety and Health

(NIOSH), 68– Institutes of Health, 21– Notifiable Disease Surveillance System (NNDSS),

62-63– Survey of Family Growth (NSFG), 64Natural and Political Observations (Graunt), 15Neumonía, relacionada Pneumocystis carinii, 27– – Staphylococcus aureus resistente meticilina, 89– vacuna neumocócica, 83– varicela, 86-87New Perspective on the Health of Canadians, 27Nicolle, Charles Jules Henry, 82Nivel Leavell, salud preventiva, 31-32– significación, 172NNT (número necesario para tratar), 121-122Nomograma verosimilitud, 121Número necesario tratar (NNT), 121-122Números enteros, conjunto datos continuos, 149

O

Obtención datos, 174, 175Occupational Safety and Health Administration

(OSHA), 67Office of Malaria Control in War Areas, 15, 26Ohio, letalidad laboral, 70, 73On Airs, Waters and Places (Hipócrates), 13

P

Padre epidemiología clínica moderna, 18Pandemia, diferenciación epidemia/endemia, 87– plaga, 13-14, 15Paperas, enfermedad declaración obligatoria, 64Parábolas, 240-241Parámetro poblacional, 156Pasteur, Louis, 19Pasteurella pestis, 15Patogenicidad, 81Patrón oro (referencia), pruebas diagnósticas, 195Peabody, Oliver, 21Pelagra, 25– tratamiento bacteriemia neumocócica, 81Pennsylvania, letalidad laboral, 70, 73Percentil, 144Período incubación, 86– – agentes bioterrorismo, 90-91– prevalencia, 38

Peso, correlación estatura, 226, 228Peste, 13-15, 23– agente bioterrorismo, 91– bubónica, 13, 14– enfermedad declaración obligatoria, 64Phipps, James, 18Planificación estudio, tamaño muestra, 192Pneumocystis carinii, causa neumonía, 27Población diana, 191– muestra, media, 137– puntual, prevalencia, 38Poder. Ver PotenciaPolígono frecuencias, 128, 165, 166, 169– – definición, 165– – uso, 165Poliomielitis, enfermedad declaración obligatoria, 64Porcentaje riesgo atribuible, 54Posibilidad, diferenciación probabilidad, 184– (odds), 49– posprueba, 118-119– relativa, estimación riesgo relativo, 106– – controles pareados, 56– – ejemplo tanque entrenamiento escape

submarino, 52– – estudios caso-control, 51– – – – controles pareados, 56– – (odds ratio), definición, 49-50– – relación con riesgo relativo, 51-52– – representatividad, 56Potencia, 134, 177, 178– afectación variables, 178– cálculo, 179– hipótesis nula falsa, 175– incremento, 135– relación con α/β, 135– valor estándar, 178– variables, 178Potts, Percival, 18-19Precisión, 35, 147– combinación exactitud, 195– diferenciación exactitud, 194– ejemplos, 194-195, 196Premio Nobel, 82Presentación datos, 163-172

Presión sanguínea sistólica, límites normales,196-197

Prevalencia, 37– determinación tabla 2 � 2, 118-119– influencia sobre valor predictivo, 201-202– período, 38– puntual, 38Prevención, niveles, 31-32– primaria, 31– secundaria, 31– terciaria, 31289Probabilidad, 49, 130, 131, 183-192, 184, 189– análisis multivariable, 241

ÍNDICE ALFABÉTICO 289

Page 281: Epidemiología y bioestadística secretos   nordness1ed

Probabilidad base para cálculo probabilidades, 184– cálculo, 183, 184– – tasa posibilidad, 203– condicionada, 131, 185, 189– – relación riesgo relativo, 186– condicional, 131, 185, 189, 190– conjunta, 184-185– definición, 131, 183, 184, 189– diferenciación posibilidad, 184– distribución, 149-162

– – demográfica enfermedad, 183, 185, 190– dos colas (valores z), 265-269

– ecuación estándar, 189– marginal, 185– más de un suceso, método algorítmico, 190– posprueba, 118-119,– preprueba, 202– prueba, 119– sucesos independientes, 184, 185, 187, 188, 189– – – definición, 185– teorema Bayes, 202Programas vigilancia médica, hepatitis C, 89-90Proporción, 148– atribuible población, 56– – – ejemplo, 55– mortalidad estandarizada, 35, 44– riesgo. Ver Riesgo relativoPrueba bondad de ajuste, modelos regresión, 243– clasificación, 193– cualitativa, 193– definición, 193– diagnóstica, características, 193-210

– – patrón oro, 197– especificidad, 118-119, 120– – cálculo, 119, 120, 201– – valores elevados, 119, 120– especificidad, definición, 135– – relación tasa falsos positivos, 199-200– exacta Fisher, 238– experimental, 98– – jerarquía, relacionada diseño estudio, 98, 113– F, 230– falsa negativa, 136– – positiva, 136– hipótesis, determinación tipo error, 134, 135– – error tipo I, 134, 135– – – – II, 134, 135– – pasos, 175– ji cuadrado, bondad ajuste, 222– – – independencia, 222– kappa (kappa de Cohen), 209– Kruskal-Wallis, 224, 235– McNemar, 224, 238– no paramétrica, 224– – – diferenciación prueba paramétrica, 232– – – indicaciones uso, 232– – – prueba Wilcoxon, 234

Prueba orden logarítmico, 262– – – Mantel-Haenszel, 262– paramétrica, 224– – diferenciación prueba no paramétrica, 232– positiva, 195– probabilidad preprueba, 202– resultado anormal, como indicador enfermedad,

196– – – determinación basada condición, 196– – falso negativo, 136– – – positivo, 136– – verdadero negativo, 198– – – positivo, 198– sangre oculta en heces, 186– semicuantitativa, 194– sensibilidad, 118-119– – cálculo, 198– – curva eficacia diagnóstica (ROC), 206– – definición, 135– – valores elevados, 119, 120– seriada, 206– – diferenciación prueba paralelo, 206– t, 211, 212– – cociente crítico, 214, 215– – de Student, 211-222

– – – – bidireccional, nivel significación, 220– – – – – dos colas (bilateral), 212, 216– – – – dos muestras, 218– – – – frente a distribución z, 213– – – – grados libertad, 213– – – – – una cola (unilateral), 212, 216– – – – – unidireccional, nivel significación, 217– – error estándar media muestral, 212– – – – única muestra, 213– – muestra única, 216– – pareada, 212– – pares pareados, 218– – resultados, 212– U Mann-Whitney, 224, 234-235– una cola, diferenciación prueba dos colas, 174– – – ventajas, 174– valor predictivo, 134-136– – – negativo, 136– – – – cálculo, 118-119, 201, 203– – – – definición, 200– – – positivo, 135-136– – – – cálculo, 118-119, 200, 203– – – – definición, 200– – – relación prueba actuación, 201, 202– Wilcoxon, 224, 232, 234Psitacosis, enfermedad declaración obligatoria, 64Puntuación zeta, 156, 157

R

Rabia, enfermedad declaración obligatoria, 64Ramazzini, Bernardino, 16290Recorrido, 129

ÍNDICE ALFABÉTICO290

Page 282: Epidemiología y bioestadística secretos   nordness1ed

Recorrido, cálculo, 151-152– intercuartiles, 129, 144, 145, 151-152Recursos en línea, para medicina basada evidencia,

117, 118, 123Reed, Walter, 20Registro enfermedades, 66Regla empírica, 129– multiplicadora (producto), 190, 191– multiplicativa (producto), sucesos no

independientes, 189– producto (multiplicativa), 188, 189Regresión logística, 238– – cuantificación riesgo, 239Relación alfa (α)/beta (β), 176– matemática S(t)/h(t), 259Relaciones causa a efecto, 226, 227Reservorios para enfermedades infecciosas, 80Resistencia antibióticos, 82– innata, 81, 82– vancomicina, Staphylococcus aureus, 65Restricción, control factor confusión, 112Resultado cara o cruz, 131– estadísticamente significativo, 173– falso negativo, 198– – positivo, 198– verdadero negativo, 198Riesgo absoluto, cálculo, 45, 46, 96– – definición, 46, 54, 95– – diferenciación riesgo comparativo, 48– – valores, 46– – – altos, 47, 48– – – bajos, 47, 48– atribuible, definición, 54, 96– – diferenciación riesgo relativo, 54-55– – ejemplo, 54– – población, aplicación salud pública, 54, 55– – – definición, 55– comparativo, 48– – definición, 48– – diferenciación riesgo absoluto, 48– – medición, 48– definición, 46– incidencia, 47– – diferenciación tasa incidencia, 47– medición, 45-57, 95, 96– – denominadores, 51-52– – notación, 45– – regresión logística, 239– relativo, 48-49– – cálculo, 45– – definición, 48-49, 96– – diferenciación posibilidad relativa, 52– – – riesgo atribuible, 54-55– – estimación basada proporción

probabilidades, 106– – estudio caso-control, 50– – – cohortes, 52

Riesgo relativo, relación posibilidad relativa, 51-52– – – probabilidad condicionada, 188– – uso engañoso, 49Rodamiento dados, probabilidad, 184Rubéola, enfermedad declaración obligatoria, 64

S

Sackett, David, 115Salmonella typhi, 24Salmonelosis, 89– enfermedad declaración obligatoria, 64Salud, definición, 31– pública, definición, 31Sangría, 18, 20-21Sarampión, enfermedad declaración obligatoria, 64– inmunidad grupal, 84100 secretos principales, 1-11

Secuencia epidemiológica, 32-33SEM (error estándar media), 146Semmelweis, Ignac, 18, 22-23Sensibilidad, 135, 137– cálculo, 118-119, 198, 199– definición, 135, 198– diseño curva eficacia diagnóstica (ROC), 206– relación tasa falsos negativos, 200Serie casos, 33, 35, 103, 104– – ventajas/desventajas, 35-36Sesgo Berkson, 100– censura relacionada, 256– clasificación errónea, 100-101, 111– confusión, 35– definición, 99, 153– entrevistador, 111– estudio caso-control, 110, 111, 112– exclusión, 100, 110, 111– informativo, 35, 100– notificación, 100, 101– observación, 110, 111– – tipos, 111– recuerdo, 100, 101, 111– selección, 35, 100, 110, 111– – error muestreo, 191– – minimización, 191– tiempo inclusión, 100, 101– vigilancia, 100, 101Shattuck, Lemuel, 21Shigelosis, enfermedad declaración obligatoria, 64Sida, paciente cero, 27Sífilis, enfermedad declaración obligatoria, 65– Estudio Tuskegee, 20, 26Significación estadística, 133Significado estadístico, definición, 173– – diferenciación significado clínico, 179Simond, Paul Louis, 15Síndrome hemolítico urémico, enfermedad

declaración obligatoria, 64291– inmunodeficiencia adquirida (sida), 23, 25

ÍNDICE ALFABÉTICO 291

Page 283: Epidemiología y bioestadística secretos   nordness1ed

Síndrome inmunodeficiencia adquirida (sida)caso inicial, 25, 27

– – – – enfermedad declaración obligatoria, 64– – – – tendencias seculares, 61– pulmonar hantavirus, 27-28– – – enfermedad declaración

obligatoria, 64– shock tóxico, 27– – – enfermedad declaración obligatoria, 65Sinergismo, 99Snow, John, 20Sobre los aires, aguas y lugares (Hipócrates), 15Sociedad móvil, agentes bioterrorismo, 90-91S(t), relación h(t), 259Staphylococcus aureus, resistente meticilina(MRSA), 89– – – vancomicina, 65State and Local Area Integrated Telephone Survey

(SLAITS), 64– Children’s Health Insurance Program (SCHIP), 66Story of a Number, The (Maor), 247Streptococcus pneumoniae, resistente penicilina, 85Sucesos independientes, 184, 185, 187, 188, 189– – definición, 185– mutuamente excluyentes, 131, 186, 189, 190Suicidio, 33Suma cuadrados, 222, 248– total cuadrados (STC), 222Supervivencia, análisis, 253-264

– modelo Weibull, creciente, 258– – – decreciente, 258Syndenham, Thomas, 16

T

Tabaquismo, causa cáncer pulmonar, 26-27, 32-33,98-99

Tabla ANOVA, 230– contingencia, 238-239. Ver también Tabla

contingencia 2 � 2– – 2 � 2, 45, 197, 198, 199, 235, 236, 237, 238– – – – – aplicaciones, especificidad, 118-119– – – – – – prevalencia, 118-119– – – – – – probabilidades posprueba, 118-119– – – – – – – preprueba, 118-119– – – – – – proporción posibilidad negativa, 118-119– – – – – – – probabilidad positiva, 118-119– – – – – – – probabilidades, 51– – – – – – sensibilidad, 118-119– – – – – – valor predictivo negativo, 118-119– – – – – – – – positivo, 118-119– – – – – estadístico ji cuadrado, corrección

Yates, 237– – – – – – – – criterio Cochran, 238– – – – – – – – prueba exacta Fisher, 238– – – – – – – – – McNemar, 238– – – – – hallazgos falsos negativos, 197, 198– – – – – – – positivos, 197, 198

Tabla cruce. Ver Tabla contingencia 2 � 2– mortalidad, 16– vida, análisis, 259Tamaño muestra, 192– – factores, 192– – pequeña, 102– – relaciones con potencia, 135Tampones, causa síndrome shock tóxico, 27Tasa ataque, 38– – definición, 86– – primario, 82– – secundario, 87, 88– basal, definición, 60– – utilidad, 61– bruta, definición, 40– – mortalidad, 36– definición, 147– diferenciación riesgo, 47– falsos negativos, 137– – – cálculo, 199-200– – positivos, 137– – – cálculo, 199-200– – – relación con especificidad, 199-200– – – trazado curva eficacia diagnóstica (ROC), 206– fracaso condicional, 256– incidencia, 47– letalidad, 87– mortalidad bruta, 36– – – estandarización directa, 40, 41– – – – indirecta, 40, 42-43– – específica causa, 37– – – edad, 37– – – – ajuste directo, 40, 41– – estandarizada, 44– – infantil, 37– – laboral, 67, 68– – – estadística vital trabajador, 70, 75– – – estado incidencia, 70, 72-74– – – sector industrial, 68, 69, 70, 71– – materna, 39– – medidas, 39– – neonatal, 39– – posneonatal, 39– posibilidad, 118-119, 203, 204, 205, 206– probabilidad, 48– – cálculo, 49– – definición, 49– riesgo dependiente tiempo, 249-250Temporalidad, 97Tendencia central, 141, 142– – datos cociente, 151– – – intervalo, 151– – – nominales, 151– – – ordinales, 151– – mediciones, 128– – relación curtosis, 153-154292– – valores, 150

ÍNDICE ALFABÉTICO292

Page 284: Epidemiología y bioestadística secretos   nordness1ed

Tendencia secular, 61– – sida, 61Teorema Bayes, 202-203– límite central, 157Teoría gérmenes, 19, 20– – pelagra, 25-26– miasma, infección, 13, 18Terrorismo, uso enfermedad infecciosa, 90-91Tétanos, enfermedad declaración obligatoria, 65Texas, letalidad laboral, 70, 73Tiempo supervivencia, efecto múltiples covariantes,

262– – Kaplan-Meier, cálculo, 259Tifus, 82Tos ferina, enfermedad declaración obligatoria, 64Trabajadores sanitarios, varicela, 86Transformación logit, 245, 247Transmisión enfermedades, 79-94

Treatise on the Plague (Browne), 14-15Triángulo epidemiológico, 79, 80Triple ciego, 112Triquinosis, enfermedad declaración obligatoria, 65Tuberculosis, enfermedad declaración obligatoria, 65Tukey, John, 167Tularemia, agente bioterrorista, 91– enfermedad declaración obligatoria, 65Tuskegee Study of Untreated Syphillis in the NegroMale, 20, 26Typhoid Mary, 25, 26

U

Unión dos sucesos, 131United States Armed Forces, datos reposición

vigilancia médica, 67– – Department of Health and Human Services,Centers for Medicare and Medicaid Services

(CMS), 66– – – – Labor, Bureau of Labor Statistics, 67– – – – – Occupational Safety and HealthAdministration (OSHA), 67Universidad McMaster, 115

V

Vacuna neumocócica, 83– poliomielitis, 83– sarampión-paperas-rubéola (MMR), 83– viruela, 18, 19, 92Vacunación, 83Validez, 35, 147Valor cero significativo, 142– p, 173, 176, 177, 178– – definición, 134– – ecuación regresión múltiple, 244– – estadístico F, 247– – frente a intervalo confianza, 181– – problemas, 176-177– – relación valor α, 134

Valor predictivo, 135-136, 200, 201– – negativo, 136, 200– – – cálculo, 118-119, 200, 201, 203– – – – ecuación simplificada, 203– – – – tabla contingencia 2 � 2, 118-119– – – – uso teorema Bayes, 203– – – definición, 200– – – fórmula, 200– – positivo, 135-136, 200– – – cálculo, 118-119, 200, 203– – – – tabla contingencia 2 � 2, 118-119– – – – uso teorema Bayes, 203– – – definición, 200– – – fórmula, 200– – prevalencia, 201-202– – relación prueba actuación, 201– – – z correspondiente, 265-269

– propio (eigenvalue), 251– tau de Kendall, 234– z, 265-269

Variables, análisis bivariante, 223-240

– cociente, 127– confusión, análisis multivariable, 241– continuas, 127, 139– – aleatorias, 137– – análisis regresión lineal, 227-229– – coeficiente correlación Pearson, 225, 226– – exactitud/precisión, 194, 195, 196– – valores, 223– correlación, 137– correlacionadas, 137– definición, 139– dependientes, 140, 141– – análisis regresión, 244, 245– – datos categóricos nominales, 243– – dicotómicas (resultado), 245, 247– – factores temporales, 243, 244– diferenciación, 127– discretas, 127, 139– ficticias, 245– formas gráficos, 128– independientes, 137– – análisis multivariable, 241, 242– – relación con variables dependientes, 140, 141– intervalo, 127– nominales (categóricas), diferenciación variables

ordinales, 127– ordinales, diferenciación variables nominales

(categóricas), 127Variación antigénica, 84– estacional, enfermedades infecciosas, 85, 86– por azar, error muestreo, 191Varianza, 129, 130, 145, 146,– análisis (ANOVA), 222, 242, 243, 248, 249– cálculo, 128– diferenciación desviación estándar, 129Varicela, 86

ÍNDICE ALFABÉTICO 293

Page 285: Epidemiología y bioestadística secretos   nordness1ed

Varicela, tasa ataque secundario, 87293Variolación, 18Vectores, enfermedad, 80, 81, 82Ventana cuerpo, 13Verificación, acuerdo clasificadores, 208-209– independencia, 208Verosimilitud, 97Verruga por hollín, 25Veterans Administration Coronary Artery BypassSurgery Cooperative Study, 259– – reposición datos vigilancia médica, 67Vibrión, organismo causante cólera, 32Victoria, reina Inglaterra, 21Vigilancia, 59– activa, definición, 60– – ejemplos, 60– definición/propósito, 59– pasiva, 60– sindrómica, 91– – niños edad escolar, 91– tipos, 59Vikingos, 17Virginia Occidental, letalidad laboral, 70, 74Viruela, 15,– agente bioterrorismo, 91– bovina, 17– enfermedad declaración obligatoria, 64

Viruela inmunidad grupal contra, 83-84– mantas infectadas, 92Virulencia, 81– diferenciación patogenicidad, 81Virus Cañón Muerto, 27-28– gripe, variaciones antigénicas, 84– inmunodeficiencia humana (VIH), variación

antigénica, 84– sarampión, reservorio, 80– sin nombre, 27-28– variación antigénica/deriva antigénica, 84– varicela, 86-87Votación, probabilidad, 188

W

Walter, Richard, 17World Health Organization (WHO), definición

salud, 31– – – – Library Service (WHOLIS), 70-77– – – – Statistical Information Service(WHOSIS), 77Wyder, Ernst, 26Wyoming, letalidad laboral, 70, 74

Y

Yersin, Alexander, 15

ÍNDICE ALFABÉTICO294