cap. semana 7_pruebas_diagnosticas

15
Lectura Crítica: Estudios sobre pruebas diagnósticas. Sensibilidad, Especificidad, Valores predictivos positivos y negativos. Su utilidad y limitaciones. Dr. C. Guillermo Elizondo Riojas Introducción El análisis crítico de artículos sobre pruebaso estudios diagnósticos permite reconocer su utilidad clínica analizando su validez (descartar posibilidad de sesgo o error sistemático en su metodología), resultados y aplicabilidad. Se han diseñado guías que permiten realizar esta evaluación, y la forma más fácil de aplicarlas al leer un artículo que trate sobre pruebas diagnósticas, para determinar si son válidos sus resultados, es hacernos las siguientes preguntas: 1. ¿Existió una prueba de referencia (gold standard) adecuada? 2. ¿Incluyó la muestra de pacientes un espectro adecuado de la enfermedad? 3. ¿Existe una adecuada descripción de la prueba? 4. ¿Hubo evaluación “ciega” de los resultados? 5. ¿Influyeron los resultados de la prueba objeto de evaluación en la realización del estándar de referencia? 6. ¿Se presentan los cocientes de probabilidad (likelihood ratios) o los datos para calcularlos? 7. ¿Cuál es la precisión de los resultados? 8. ¿Serán satisfactorios en mi ámbito la reproducibilidad de la prueba y su interpretación? 9. ¿Es aceptable la prueba en mi paciente? 10. ¿Modificarán los resultados de la prueba la decisión sobre cómo actuar? La utilidad de una prueba diagnóstica es su capacidad para detectar a una persona con enfermedad o excluir a una persona sin enfermedad, y usualmente se describe en términos de sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo. En este capítulo revisaremos cuáles son las definiciones de estos términos y sus aplicaciones.

Upload: yumeangelic

Post on 11-Jul-2015

642 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Cap. semana 7_pruebas_diagnosticas

Lectura Crítica: Estudios sobre pruebas diagnósticas. Sensibilidad, Especificidad, Valores predictivos positivos y negativos.

Su utilidad y limitaciones. Dr. C. Guillermo Elizondo Riojas

Introducción

El análisis crítico de artículos sobre pruebaso estudios diagnósticos permite reconocer su utilidad clínica analizando su validez (descartar posibilidad de sesgo o error sistemático en su metodología), resultados y aplicabilidad. Se han diseñado guías que permiten realizar esta evaluación, y la forma más fácil de aplicarlas al leer un artículo que trate sobre pruebas diagnósticas, para determinar si son válidos sus resultados, es hacernos las siguientes preguntas:

1. ¿Existió una prueba de referencia (gold standard) adecuada? 2. ¿Incluyó la muestra de pacientes un espectro adecuado de la enfermedad? 3. ¿Existe una adecuada descripción de la prueba? 4. ¿Hubo evaluación “ciega” de los resultados? 5. ¿Influyeron los resultados de la prueba objeto de evaluación en la

realización del estándar de referencia? 6. ¿Se presentan los cocientes de probabilidad (likelihood ratios) o los datos

para calcularlos? 7. ¿Cuál es la precisión de los resultados? 8. ¿Serán satisfactorios en mi ámbito la reproducibilidad de la prueba y su

interpretación? 9. ¿Es aceptable la prueba en mi paciente? 10. ¿Modificarán los resultados de la prueba la decisión sobre cómo actuar?

La utilidad de una prueba diagnóstica es su capacidad para detectar a una persona con enfermedad o excluir a una persona sin enfermedad, y usualmente se describe en términos de sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo. En este capítulo revisaremos cuáles son las definiciones de estos términos y sus aplicaciones.

PC
Resaltado
PC
Resaltado
Page 2: Cap. semana 7_pruebas_diagnosticas

Típicamente, estos conceptos se enseñan basándonos en una tabla de 2 x 2 que muestra los resultados tanto de la prueba diagnóstica en estudio, como de la prueba definitiva (gold standard) que se han realizado en una población predeterminada de personas con la enfermedad y aquellos sin la enfermedad. La definición de sensibilidad, especificidad y los valores predictivos positivos y negativo se expresan generalmente con las letras que se muestran en la Tabla 1.

Tabla 1:

Por otro lado, aunque una tabla de 2 x 2 permite un cálculo de la sensibilidad, especificidad y valores predictivos, en la vida diaria esto podría ser demasiado abstracto y difícil de aplicar, ya que estrictamente hablando, los pacientes no se presentan, “teniendo la enfermedad” ó “no teniendo la enfermedad”. Sin embargo, el uso de las tablas de 2 x 2 para enseñar estos conceptos frecuentemente crea la falsa impresión de que las probabilidades o los valores predictivos calculados en dichas tablas puedan ser generalizados a otras poblaciones, independientemente de la prevalencia de la enfermedad de la que se esté hablando. En este capítulo explicaremos el uso de estas tablas de 2 x 2 y veremos ejemplos para que estos conceptos puedan ser utilizados en la práctica clínica y en el proceso diagnóstico.

PC
Resaltado
PC
Resaltado
Page 3: Cap. semana 7_pruebas_diagnosticas

I. Identificando la población a estudiar.

Para facilitar la comprensión de los conceptos de sensibilidad, especificidad y valores predictivos, imaginemos una población de 100 personas en donde el 10% (o sea 10 personas) tiene una enfermedad crónica (enfermedad A). Asumiremos que a todas las 100 personas de la población se les ha realizado una coronariografía, que es el método definitivo (gold standard) para diagnosticar la enfermedad A, por lo que estamos seguros que la prevalencia verdadera de la enfermedad en esta población es del 10%.

Ahora supongamos que se ha desarrollado una nueva prueba diagnóstica no invasiva para la enfermedad A, la tomografía, para evitar la necesidad de la coronariografía en la gente a la que se le investiga si tiene esta enfermedad.Aplicaremos la tomografía a esta población utilizando el resultado hipotético para explicar los conceptos de sensibilidad, especificidad, valores predictivos negativos y positivos.

II. Sensibilidad

La sensibilidad de la prueba se define como la proporción de personascon la enfermedad que tendrá positiva la prueba. Si nosotros aplicamos la tomografía a nuestra población y 8 de las diez personas con la enfermedad A tienen la prueba positiva, entonces la sensibilidad de la tomografía es de 8/10, ósea de 80%. Esto quiere decir entonces que hay personas con la enfermedad que dieron positiva la prueba (verdaderos positivos) pero también se demuestra que hay personas con enfermedad que fueron negativos en la prueba, ó sea falsos negativos. La sensibilidad se calcula como el número de personas con enfermedad que dieron positivas a la prueba dividido entre el número de todas las personas que tenía la enfermedad. Al definir la sensibilidad, estamos interesados únicamente en la proporción de personas con la enfermedad que fueron positivos. La sensibilidad se calcula únicamente para aquellaspersonas que tienen la enfermedad. Esto significa que la sensibilidad de unaprueba únicamente nos dice que tan buena es la prueba para identificar a la gente con enfermedad cuando se está buscando aquellos con la enfermedad. La sensibilidad no nos dice nada acerca de si alguna persona sin la enfermedad dará positivas o no ala prueba, ni en qué proporción.

PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
Page 4: Cap. semana 7_pruebas_diagnosticas

III. Especificidad

La especificidad de una prueba es la proporción de personas sin la enfermedad que tendrá negativa la prueba. En nuestra población, el 90% de la gente no tiene la enfermedad A. Si aplicamos la prueba a estas 90 personas y 85 % de ellas tienen la prueba negativa, entonces la especificidad de la prueba es de 85/90, es decir 94%. La especificidad se calcula como el número de personassin enfermedad que dieron la prueba negativa dividido entre el número total de toda la gente sin la enfermedad. Al definir la especificidad, únicamente estamos interesados en la proporción de personas sin la enfermedad que dieron negativaa la prueba. La especificidad se puede calcular únicamente para aquellas personas que no tienen la enfermedad. La especificidad no nos dice nada acerca de si algunas personas con la enfermedad también darían negativo el resultado de la prueba y de será sí, en qué proporción.

¿Para qué me sirven las pruebas de sensibilidad y e specificidad?

Utilidades

Una prueba con alta sensibilidad nos sirve para “descartar” una enfermedad en un paciente si la prueba es negativa. Supongamos que existe una prueba diagnóstica rápida para la detección de infecciones respiratorias, y cuya sensibilidad y especificidad son respectivamente de 100% y 68% en niños que se presentan con síntomas sugestivos de infección respiratoria. Imagínese que aplicamos esta prueba a una niña que ha desarrollado síntomas sugestivos de infecciones del tracto respiratorio y la prueba resulta positiva. ¿Esto significaría que ella tiene infección? La respuesta es que podría ser, pero puede ser que no. La sensibilidad del 100% significa que la prueba detectaría virtualmente todas las personas que tienen infección respiratoria, pero su relativamente baja especificidad significa que podría ser falsamente positiva en un número de niños que de hecho no tienen infección. El resultado de esta niña por consiguiente podría ser un falso positivo. Por otro lado, si la prueba enesta niña saliera negativa, ya que el 100% de los niños con esta prueba para infección serían positivos, es muy poco probable que tenga la enfermedad. Una prueba con alta sensibilidad es por consiguiente más útil cuando resulta negativa.

Por otro lado, una prueba con un alto grado de especificidad es útil para decidir si una persona tiene la enfermedad cuando es positiva para la prueba. Por ejemplo,

PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
Page 5: Cap. semana 7_pruebas_diagnosticas

supongamos que existe una prueba diagnóstica para esclerosis múltiple con una sensibilidad del 27% pero una especificidad del 94%. La sensibilidad es muy baja, pero la especificidad es alta. Si una persona se presenta con síntomas sugestivos de esclerosis múltiple y la prueba es negativa, ¿esto implicaría que no tiene la enfermedad? No podemos decir. Este paciente podría tener esclerosis múltiple pero ya que la prueba tiene poca sensibilidad, podría habernos dado un resultado falso negativo. Pero si la prueba sale positiva, ya que mucha gente sin enfermedad sale con una prueba negativa, el 94%, una persona con una prueba positiva muy probablemente tiene la enfermedad.Una prueba altamente especifica, por consiguiente, es más útil para los clínicos cuando resulta positiva.

Limitaciones

La principal limitación, tanto de la sensibilidad como de la especificidad, es que no tienen unaaplicación práctica cuando se trata de ayudarnos a estimar la probabilidad de que la enfermedad esté presente en un paciente en particular. Es decir, cuando vemosun paciente con un resultado positivo para una prueba determinada, la pregunta que queremos respondernos es ¿cuál es la probabilidad de que tenga la enfermedad con esta prueba positiva? Si utilizamos solamente la sensibilidad y la especificidad, no podremos contestarnos esta pregunta, ya que estos parámetros se definen con base a personas con o sin la enfermedad. Sin embargo, los pacientes se nos presentaran con una serie de síntomas más que con un diagnostico, y no sabemos si el paciente tiene la enfermedad o no, y no podemos, por consiguiente, aplicar estos parámetros directamente a él. Lo que necesitamos conocer son los valores predictivos, que en la práctica clínica rutinaria, son más útiles para determinar la certeza diagnostica de una prueba.

¿Qué son los valores predictivos?

El propósito general de las pruebas diagnosticas es utilizar susresultados para hacer un diagnostico, de tal forma que necesitamos conocer la probabilidad de que esa prueba resulte positiva cuando tenemos un diagnostico correcto.Los valores predictivos positivos y negativos describen la probabilidad de tener la enfermedad o no, una vez que se conoce el resultado de la prueba que utilizamos.

PC
Resaltado
PC
Resaltado
PC
Resaltado
Page 6: Cap. semana 7_pruebas_diagnosticas

IV. Valores predictivos positivos

Los valores predictivos positivos de una prueba se definen como la proporción de personas con resultado positivo y que tienen la enfermedad. Supongamos que en una población hipotética de 100 personas, resulta que 8 personas con la enfermedad A tienen un resultado positivo para la prueba A y 5 personas sin la enfermedad también dieron un resultado positivo.Esto significa que un total de 13 personas fueron positivas, pero recordemos que de esas 13 personas, únicamente 8 de ellas de hecho tienen la enfermedad.Elvalor predictivo positivo de la prueba A se calcula como el número de personas con enfermedad que dieron positiva la prueba dividido por el total de personas que dieron positivas, lo cual se representa como 8/13,es decir 0.62 o 62%. Esto significa que en esta población hipotética, el 62% de la gente que dio positiva tendrán la enfermedad A, o puesto de otra manera, una persona que tiene una prueba positiva tiene el 62% de posibilidad de tener la enfermedad A.

V. Valores predictivos negativos

El valor predictivo negativo de una prueba es la proporción de gente con un resultado negativo que no tiene la enfermedad. Supongamos ahora una población hipotética de 100 personas, en donde 85 no tienen la enfermedad A y su prueba fue negativa, pero 2 que tiene la enfermedad A tambiénla dieron negativa, es decir que un total de 87 personas dieron negativa la prueba. El valor predictivo negativo se calcula como el número de personas que no tienen la enfermedad dividido entre el número total de personas que dieron negativa la prueba,es decir 85/ 87 nos da 0.98 o 98%. Esto significa que el 98% de las personas que dieron la prueba negativa no tendrán la enfermedad A, o puesto de otra forma, una persona que tenga una prueba negativa tiene un 98 % de probabilidades de no tener la enfermedad A.

¿Puedo aplicar los valores predictivos de una prueb a a mi paciente?

Como vimos, los valores predictivos de una prueba están determinados por la sensibilidad yla especificidad, pero también por la prevalencia de la enfermedad en la que se está aplicando la prueba, ya que estos valoresvarían con el cambio en la prevalencia de la enfermedad en una población dada.Ahora veremos por qué no sería correcto que un clínico aplicara directamente los valores predictivos

PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
Page 7: Cap. semana 7_pruebas_diagnosticas

publicados para una prueba a un tipo de población, cuando la prevalencia de la enfermedad en su población es diferente de la prevalencia de la enfermedad en la población en la cual se hizo el estudio que se publicó.

Para entender mejor la relación entre los valores predictivos y la prevalencia en la enfermedad,recordemos los valores predictivos positivo ynegativo de la prueba en nuestra población hipotética anterior (suponiendouna prevalencia del 10%para la enfermedad A), que fueron del 62% y 98% respectivamente. Supongamos ahora que aplicamos la prueba a otra población de 100 personas pero en la que la prevalencia de la enfermedad A es del 20%.Si sabemos que la sensibilidad de la prueba es del 80%, significa que 80% de 20 personas con la enfermedad,es decir 16 personas en esta población,tendrán la prueba positiva. Ahora bien, si la especificidad de la prueba es del 94%, significa que el 94% de la gente sin la enfermedad A dará la prueba negativa,o que el 6% de la gente sin la enfermedaddará la prueba positiva.Por consiguiente 6% de las 80 personas sin la enfermedad A, es decir 5 personas, darán positivala prueba, y por lo tanto, un total de 21 personas darán positivo a la prueba, 16 con la enfermedad y 5 sin ella.

El valor predictivo positivo de la prueba A para esta población es por consiguiente de 16/21, es decir 76%. Si seguimos con estos nuevos cálculos, ahora un total de 79 personas darán el resultado negativo, 75 sin la enfermedad y 4 con la enfermedad, y por consiguiente el valor productivo negativo (la proporción de pacientes con una prueba negativa que no tiene la enfermedad) es de 75/79, es decir95%. Cuando repetimos estos cálculos a otra población con diferente prevalenciade la enfermedad A, veremos claramente que el valor predictivo positivo de la prueba aumenta al aumentar la prevalencia de la enfermedad, y el valor predictivo negativo disminuiráal aumentar la prevalencia de la misma.

¿Para qué me sirve esto en la práctica diaria?

Como vimos, a mayor prevalencia de la enfermedad, mayor será el valor predictivo positivo de una prueba, es decir que será más probable que resulte positiva y será máseficazpara predecir la presencia de enfermedad. Cuando la prevalencia en la enfermedad es baja, el valor predictivo positivo también será bajo, aun cuando se utilice una prueba con alta sensibilidad y especificidad. Es decir, que en tales situaciones, una proporción significativa de personas que tienen la prueba positiva pueden no tener la enfermedad. Lo que esto significa para la práctica clínica diaria

PC
Resaltado
PC
Resaltado
PC
Resaltado
Page 8: Cap. semana 7_pruebas_diagnosticas

es que la utilidad del resultado de una prueba para un paciente en particular depende de la prevalencia de la enfermedad en la población en la cual se está utilizando.El valor diagnostico de la prueba mejorará si, basados en la historia y evaluación clínica, lautilizamos en aquellos pacientes que es más probable que tengan la enfermedad que estamos pensando que cuando la prueba es aplicada indiscriminadamente a todos los pacientes. Una prueba diagnóstica debe de ser utilizada como complementoy no como un sustituto del juicio clínico.

VI. Conclusión

Hemos visto como la sensibilidad y la especificidad de una prueba tienen utilidad clínica limitada, ya que no pueden ser utilizadas para estimar la probabilidad de una enfermedad en un paciente en particular. Por otro lado, los valores predictivos pueden ser utilizados para estimar esta probabilidad, pero recordemos que varían de acuerdo con la prevalencia de la enfermedad, y no puede ser aplicados a unapoblación que tenga una prevalencia diferente a la de la poblaciónen la que la prueba fue evaluada.

GUIAS PARA EVALUAR LAS PRUEBAS DIAGNOSTICAS

Como lo encontrarán en los capítulos de estudios terapéuticos y de análisis de revisiones sistemáticas y metanálisis, a continuación se describen las guías primarias y secundarias que nos ayudan en la evaluación e interpretación de los estudios que tratan sobre pruebas diagnósticas, y que están enfocadas a determinar si son válidos los resultados que se presentan en el artículo que estemos leyendo.

Guías Primarias:

1. ¿Hubo una comparación a ciegas e independiente con la prueba que se considera el estándar de oro?

Para determinar si una prueba es válida y precisa, los dos atributos más importantes de una prueba diagnóstica, lo primero es estar seguro que la prueba

PC
Resaltado
Page 9: Cap. semana 7_pruebas_diagnosticas

que se propone, un TAC por ejemplo, es lo suficientemente sensible y específico para diagnosticar apendicitis, pero la forma de saberlo es teniendo una comprobación, un estándar de referencia, en este caso la cirugía y el análisis patológico. Lo importante al momento de comparar las pruebas, es que el investigador que realiza el análisis de la TAC no conozca los resultados de la cirugía, y el patólogo no conozca los resultados de la tomografía. Debemos buscar entonces en cada artículo de pruebas diagnósticas, que éste halla sido cegado, y que los pacientes hayan sido consecutivos y aleatorizados adecuadamente.

2. ¿La muestra de los pacientes incluyó a un grupo apropiado en quienes la prueba diagnóstica se aplicaría en la práctica clínica?

Es importante estar seguros de que la prueba se evaluó lo más apegado a la realidad clínica para la que será utilizada. Por ejemplo en el caso de la TAC para apendicitis, el grupo de pacientes debe ser uno en el que exista sospecha clínica y de laboratorio de esta enfermedad, donde la TAC podría ayudar, y no en un grupo de pacientes con apendicitis perforada, de días de evolución y con franca peritonitis y leucocitosis. En ese caso seguramente la TAC será muy sensible y específica, pero en la realidad nunca la utilizaríamos para un paciente tan grave, sino para los pacientes con enfermedad clínicamente dudosa.

Guías Secundarias:

1. ¿Los resultados de las pruebas evaluadas influyeron para realizar el estándar de referencia?

Esto parecería muy obvio, pues lo que quiere decir es que debemos estar seguros de que las dos pruebas, la que estamos evaluando y el estándar de oro, se realizaron en todos los pacientes. No siempre es así. Imaginen por ejemplo que quieren evaluar la sensibilidad y especificidad de la imagen por resonancia magnética (IRM) para diagnosticar hernia de disco lumbar. El estándar de oro sería la comprobación quirúrgica de la hernia. El problema de un estudio como este, es que sólo se operarían los pacientes en los que la IRM mostró una hernia, y en los que la IRM es normal no se operarían, es decir, nuestra prueba influyó en

PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
PC
Resaltado
Page 10: Cap. semana 7_pruebas_diagnosticas

que no se realizara el estándar de oro. Claro que en estudio como este, la IRM será 100% sensible y específica para hernia de disco.

2. ¿Se describieron los métodos para realizar la prueba con suficiente detalle de tal forma que se permita su reproducción?

Es muy importante que se describa en el artículo en forma detallada todas las características bajo las cuales se realizó la prueba (ayuno, técnica radiológica, temperatura, condiciones de laboratorio, aparatos utilizados, etc.), de tal forma que cualquier otro investigador o cualquier otra persona pueda realizarla en un paciente y obtener resultados similares a los publicados.

En el caso particular de las pruebas diagnósticas, en aquellos casos en los que el resultado dependa de una interpretación subjetiva, por ejemplo que un radiólogo diga o no si el paciente tiene apendicitis o hernia de disco, los resultados deben demostrar el resultado de las pruebas con lecturas intraobservador e interobservador, es decir, que el mismo radiólogo, sin conocer los resultados por supuesto, interprete un estudio en dos o mas ocasiones, y que por otro lado, el mismo estudio sea interpretado por dos o más radiólogos. En este sentido, también podríamos comparar la sensibilidad de una prueba si es leída, por ejemplo, por un radiólogo experto en TAC abdominal comparada con un radiólogo general.

PC
Resaltado
Page 11: Cap. semana 7_pruebas_diagnosticas

EJERCICIO:

I. Elabore una Tabla de 2 x 2 y defina sus componentes.

II. Definir los siguientes términos:

Sensibilidad:

Especificidad:

Valor Predictivo Positivo:

Valor Predictivo Negativo:

Page 12: Cap. semana 7_pruebas_diagnosticas

III. CASO CLÍNICO Caso de nódulos tiroideos con biopsia por aspiración para definir si el nódulo es benigno o maligno. • Estudio retrospectivo de 47 pacientes con nódulos tiroideos sometidos a

cirugía tiroidea. El objetivo del estudio era evaluar la sensibilidad y especificidad de la biopsia por aspiración para definir si el nódulo era benigno o maligno. Estándar de oro: resultado de patología después a la cirugía.

• De 26 pacientes en los que la biopsia por aspiración se reportó como nódulo benigno, en el análisis después de la cirugía el resultado fue maligno en 3 y benigno en 23.

• De 21 pacientes en los que la biopsia se reportó como nódulo maligno, en el análisis después de la cirugía el resultado fue maligno en 19 y benigno 2.

Con la información presentada, llene la tabla y determine:

Sensibilidad:

Especificidad:

VPP:

VPN:

Page 13: Cap. semana 7_pruebas_diagnosticas

IV. Del siguiente artículo, calcule la sensibilidad, especificidad, VPP y VPN de cada tabla.

Page 14: Cap. semana 7_pruebas_diagnosticas

Cuadro 3: Sensibilidad:

Especificidad:

VPP:

VPN:

Estándar de oroEnfermedad

Presente

P

R+

U

E

B-

A

Estándar de oro Enfermedad

Presente Enfermedad

Ausente

Page 15: Cap. semana 7_pruebas_diagnosticas

Cuadro 4: Sensibilidad:

Especificidad:

VPP:

VPN: