confiabilidad, validez, sensibilidad y estandarización

DEFINICIONES CONCEPTUALES

• Gallardo Castillo María Fernanda

• Jiménez Ruiz Iker Santos• López Ramírez Mitzi Anaís

PSICODIAGNÓSTICO¿QUÉ ES EL PSICODIAGNÓSTICO?

Psicodiagnóstico= evaluación psicológica

Psique: mente, alma, espíritu.

Diagnóstico: Acto de conocer la naturaleza de una enfermedad mediante la observación de sus síntomas y signos.

Es aquella disciplina psicológica que se ocupa del estudio científico del comportamiento de un sujeto o un grupo de sujetos determinados, en su interacción recíproca con el ambiente y con el fin de descubrir , clasificar, predecir y, en su caso, explicar su comportamiento”.

¿Dónde surge el término?Surgió del ámbito médico-psiquiátrico en el que el médico asumía el papel del actual psicólogo.

Se empleó por primera vez en Suiza en 1921 por Rorschach.

Su origen etimológico significa “aprender a conocer”.

Las primeras definiciones de psicodiagnóstico provienen de una tradición médica, e identifican las alteraciones psicológicas como signos de enfermedad o trastorno orgánico .

¿PARA QUÉ SIRVE EL PSICODIAGNÓSTICO? Describir características psicológicas de un sujeto.

Predecir para ver si vale la pena hacer un tratamiento (pronóstico).

Explicar

Medir

Valorar Diagnosticar

Clasificar

Evaluar

CONFIABILIDAD

¿Confiable o no confiable?

La confiabilidad es el grado en que una técnica es consistente con lo que pretende medir, es decir, la confianza que esa técnica amerita.

En otras palabras, la confiabilidad de la prueba se refiere a la consistencia de las calificaciones obtenidas

estimación de confiabilidad de un instrumento de medición.

En la práctica se obtienen valores más próximos a uno u otro extremo.

Cuando los valores estén más próximos a 1, más confiable serán los resultados del test.

No existe una medición perfectamente confiable.

TAMAÑO DEL ÍNDICE DE CONFIABILIDAD.

No confiable

Coeficiente de cfb (-1)

Confiabilidad nula

Coeficiente de cfb (0)

Confiabilidad perfecta

Coeficiende de cfb (1)

ESTIMACIÓN EMPÍRICA DE LA CONFIABILIDAD

Hay por lo menos tres métodos para estimar la

confiabilidad:

1. Confiabilidad de formas alternas

2. Confiabilidad test-retest

3. Confiabilidad de consistencia interna

1. CONFIABILIDAD DE FORMAS ALTERNAS

1. Confiabilidad de formas alternasFormas alternas = paralelas = equivalencia.

Los puntajes se obtienen dedos formas diferentes de un instrumento.

Forma 1 Forma 2

• se requiere cuando se espera que una situación (experimental o cotidiana), modifique la variable de interés, en un lapso muy corto, que no permitiría aplicar el mismo instrumento.

• se necesitan dos versiones del instrumento, que midan lo mismo, pero con diferentes reactivos, estímulos o preguntas.

2. CONFIABILIDAD TEST-RETEST

2. Confiabilidad test-retest

Se le conoce como “coeficiente de estabilidad”

Tiempo 1 Tiempo 2

Se calcula un coeficiente test-retest para determinar si un instrumento mide de manera consistente de una ocasión a otra.

toma en consideración los errores de medición que resultan de diferencias en las condiciones (ambientales, personales) asociadas con las dos ocasiones en que se administró la prueba.

Es probable que las diferencias entre las condiciones de la aplicación sean mayores luego de un intervalo largo que de uno corto.

3. CONFIABILIDAD DE CONSISTENCIA INTERNA

3. Confiabilidad de consistencia interna

Requiere que los respondientes completen sólo un instrumento en un sola ocasión.

Es el método más usado para obtener la confiabilidad.

Tres aproximaciones para estimar la confiabilidad:

a) División por mitades

b) Puntajes alfa “crudos”

c) Puntajes alfa “estandarizados”


a) División por mitades

Se deriva desde dentro del instrumento mismo.

Pasos:

1º Crear dos sub-instrumentos (v.gr., pares y nones) y obtener su puntaje compuesto.

2º El coeficiente de consistencia interna se determina en este caso con la fórmula de Spearman-Brown, que sólo se puede aplicar a pruebas homogéneas y sin límite de tiempo para resolverlas


b) Coeficiente alfa bruto (Cronbach)

Creada por Charles Spearman y W. Brown.

Desarrollado por Lee Cronbach

Consistencia interna: estima la confiabilidad de los instrumentos de reactivos múltiples.

Idea básica: Las diferentes “partes” (reactivos o grupos de reactivos) pueden ser tratados como formas diferentes de un instrumento.


c) Coeficiente alfa “estandarizado”

Llamado también “fórmula generalizada Spearman Brown”

Utiliza sólo correlaciones.

Alfa bruto para reactivos binarios

Kuder-Richardson 20

Procedimiento más común para determinar la consistencia interna de instrumentos o pruebas constituidas por respuestas dicotómicas (correcto-incorrecto; de acuerdo en desacuerdo).

Se calcula a partir de una sola administración de una prueba.


Cada uno de los reactivos tienedos posibles respuestas

KR20

VALIDEZ Se define como el grado en que un

instrumento mide lo que realmente dice medir. (Hernández S. et al. 2014).

Se tienen diferentes tipos de evidencia que prueban su existencia en determinado instrumento. Están relacionadas con el contenido, el criterio y el constructo.

1.VALIDEZ DE CONTENIDO

Se refiere al grado de dominio que el instrumento tiene sobre el contenido de la prueba. Es decir ítem por ítem deben corresponder al contenido

Dominio Estrecho Dominio Amplio

Medición

PREGUNTAS APLICABLES

“¿El instrumento mide adecuadamente las principales dimensiones de la variable en cuestión?”

“En un cuestionario ¿Las preguntas que tan bien representan a todas las preguntas que pudieran hacerse?”

(Hernández S. 2014).

2. VALIDEZ DE CRITERIO

Validez concurrente

• Se desarrolla cuando el criterio se establece en el presente.

Validez predictiva

• Se desarrolla cuando el criterio se establece en el futuro

Establece la validez mediante una comparación con un criterio externo que dice medir lo mismo. Dependiendo del tipo de criterio se describirá como concurrente o predictiva

PRINCIPIO Y PREGUNTAS APLICABLES

Para la validez de criterio si diferentes instrumentos o criterios miden el mismo concepto, deben arrojar resultados similares

Preguntas:

¿En que grado el instrumento comparado con otros criterios externos, mide lo mismo?

¿Qué tan cercanamente las puntuaciones del instrumento se relacionan con otro(s) resultado(s) sobre el mismo concepto?

3. VALIDEZ DE CONSTRUCTO

Es la validez principal de todos los tipos. (Moscoso S. 2000). Se refiere a que tan exitosamente está un instrumento representa y mide un concepto teórico. A esta validez le concierne el significado del instrumento, esto es, que está midiendo y como opera para medirlo.

B

C

A

D

W

Teoría(Investigaciones hechas) encontraron que A se relaciona positivamente con B, C y D. Y negativamente con W

Si el instrumento realmente mide A, deberá relacionarse positivamente con B, C, D, y negativamente con W.

PREGUNTAS APLICABLES

¿El concepto teórico está realmente reflejado en el instrumento?

¿Que significan las puntuaciones del instrumento?

¿El instrumento mide el constructo y sus dimensiones?

¿Porqué si o porqué no?

¿Cómo opera el instrumento?

(Hernández S. 2014).

SENSIBILIDAD Y ESTANDARIZACIÓN

En psicología y en medicina, por mencionar 2 áreas donde nos interesa predecir adecuadamente la presencia o ausencia de una enfermedad o bien de una condición psicológica a través del uso de alguna prueba diagnóstica, es importante conocer los conceptos de: SENSIBILIDAD, ESPECIFICIDAD, VERDADERO POSITIVO, FALSO POSITIVO, VERDADERO NEGATIVO, FALSO NEGATIVO Y PRUEBA DE ORO.

Sensibilidad : es la capacidad que tiene una prueba diagnóstica para detectar a los individuos que tienen la condición buscada en una población

Especificidad: es la capacidad que tiene una prueba para detectar a los individuos que no tienen la condición buscada en una población, también se podría decir que es la capacidad del test para detectar individuos sanos.

Durante un proceso diagnostico tenemos 4

posibilidades en cuanto a los tipos de

resultados que podemos obtener

1. VERDADERO POSITIVO: la enfermedad o condición está presente y se diagnosticó al paciente como enfermo (adquiere el nombre según la condición que se esta buscando).

3. VERDADERO NEGATIVO: la enfermedad NO está presente y se diagnostica al paciente como sano.

4. FALSO NEGATIVO: la enfermedad está presente pero no se detecto

2. FALSO POSITIVO: la enfermedad o condición NO está presente pero al paciente se le diagnostica como enfermo.

Sensibilidad y Especificidad: El valor de ambas varia de 0 a 1 (de un 0 a 100%), entre mayor sea el valor de la sensibilidad y la especificidad de una prueba, hay una mejor capacidad para detectar a los VERDADEROS POSITIVOS Y VERDADEROS NEGATIVOS.

Definiendo nuevamente

Las pruebas con un valor de sensibilidad y especificidad arriba del 80% o de 0.80 se consideran buenas. Es decir, aquellas que ofrece verdaderos positivos y verdaderos negativos.

Fórmulas

Verdaderos Positivos / Verdaderos Positivos + Falsos Negativos

O bien

Verdaderos positivos / el total de enfermos.

Verdaderos Negativos/ Verdaderos negativos+ Falsos positivos. O bien, Verdaderos negativos/ el total de Sanos.

PRUEBA DE ORO: prueba o criterio usado para el diagnóstico “inequívoco” (alta especificidad y sensibilidad) de una enfermedad. Esta prueba o criterio se utiliza para examinar la utilidad de diagnostica de cualquier prueba nueva o no evaluada

Sensibilidad

Especificidad

Prueba de Oro

psicópata sano TotalPositivo 45 15 =60

Negativo 21 53 =74Prueba

evaluada

La prueba evaluada tiene sus criterios pre establecidos sobre quien es positivo (psicópata) y quien negativo (sano), pero la prueba de oro se encargara de juzgar eso.

Según la prueba evaluada hay un total de 60 personas que son psicópatas, pero según la prueba de oro, solo 45 de esas personas realmente son psicópatas y las otras 15 son sanas pese a que la prueba evaluada las diagnosticó con el trastorno.

En cuanto a los negativos o sanos, según la prueba evaluada hay un total de 74, pero la prueba de oro al contrastar sus resultados dice que de esos 74 solamente 53 realmente están realmente sanos y los otros 21 faltantes son psicóticos pese a que la prueba evaluada diga que están sanos.

Hay una muestra de 134 individuos. En este caso la prueba evaluada será un test que pretende detectar a individuos con el trastorno psicótico de la personalidad. Y será evaluada en comparación con una «prueba de oro» que mide «lo mismo».

Prueba de oro

Ejemplo

Esto significa que según la prueba de oro hay:

45 Verdadero positivo

15 Falso positivo

53 Verdaderos negativos

21 Falsos negativos

La sensibilidad de la prueba seria 45 / 45+ 21= 0.68 =68%

Verdaderos Positivos / Verdaderos Positivos + Falsos Negativos

La especificidad de la prueba seria 53 / 53+ 15(68)= 0.77= 77% Verdaderos Negativos/ Verdaderos negativos+ Falsos positivos.

ESTO SIGNIFICA QUE LA PROBABILIDAD DE LA PRUEBA DE DETECTAR A psicópatas ES DEL 68% Y LA PROBABILIDAD DE DETECTAR A PERSONAS SANAS (NO psicópatas) ES DEL 77%.Si nos ponemos estrictos es una mala prueba, no es confiable, cabe mencionar que una buena prueba debe tener una sensibilidad y especificidad altas y no solo una de estas.

Valor predictivo positivo (VPP): es la probabilidad cuando la prueba es positiva, que corresponda realmente a un verdadero positivo. Se obtiene: VERDADEROS POSITIVOS / verdaderos positivos+ falsos positivosSi la prueba es positiva la probabilidad de que el sujeto tenga la enfermedad es de: 0.75 o 75%

Valor predictivo negativo (VPN): es la probabilidad cuando la prueba es negativa, que corresponda realmente a un verdadero negativo.

Se obtiene: verdaderos negativos / verdaderos negativos+ falsos negativos: 0.71 o 71%

La estandarización de una prueba se refiere al proceso de selección de materiales, instrucciones estándar y un sistema de calificación explicito, es decir, que la condiciones de aplicación y evaluación de una prueba sean prácticamente las mismas para todos los individuos a los que se les aplique. (Ardila y Ostorsky-2012).

¿Por qué ES IMPORTANTE que una prueba este estandarizada?

-Garantiza que el procedimiento de aplicación sea siempre el mismo. -Los criterios de calificación e interpretación de las puntuaciones tienen los mismos parámetros. -Por lo tanto los resultados deberán ser confiables.

Estandarización

¿CÓMO SE ESTANDARIZA UN TEST?NORMALIZACIÓN

Un test estandarizado es una prueba que ha sido normalizada o normatizada; es decir que ésta ha sido probada en una población con distribución normal para la característica a estudiar. Se compara la ejecución de un grupo que sea representativo e la población con la que estemos trabajando.

En el proceso de estandarización se determinan las normas para su aplicación e interpretación de resultados, es así que para la aplicación de una prueba debe hacerse bajo ciertas condiciones, las cuales deben cumplir, tanto quienes la aplican, como a quienes se les aplica.

REFERENCIAS

Hernández Sampieri, R., Fernández Collado, R., & Baptista, P. (2008). Metodología de la Investigación, 5ta Edicion McGraw-Hill.

John E. Freund. (1994) Estadística Elemental . México: Earson

M. Q. Luca. Sensibilidad y Especificidad, lo básico. [en línea]. México. Septiembre 2009 [fecha de consulta 27 Diciembre 2015] Disponible en: http://es.slideshare.net/latiatuca/enostosis-1954495

Moscoso, S. C., Gil, J. A. P., & Rodríguez, R. M. (2000). Validez de constructo: el uso del análisis factorial exploratorio-confirmatorio para obtener evidencias de validez. Psicothema, 12(2), 442-446.

http://biblio3.url.edu.gt/Libros/tests_p/4.pdf

http://datateca.unad.edu.co/contenidos/401517/1U2LibroEAPAliaga.pdf

confiabilidad, validez, sensibilidad y estandarización

Education