herrera, a. (1998). notas de psicometria 1-2 - historia de psicometria y teoria de la medida

UNIVERSIDAD NACIONAL DE COLOMBIA

FACULTAD DE CIENCIAS HUMANAS DEPARTAMENTO DE PSICOLOGIA

NOTAS SOBRE PSICOMETRIA GUIA PARA EL CURSO DE PSICOMETRIA

Aura Nidia Herrera Rojas

SANTAFE DE BOGOTA FEBRERO 1998

CONTENIDOS

CONTENIDOS

PRESENTACION 1

DATOS HISTORICOS DE LA MEDICION EN PSICOLOGIA 3

INTRODUCCION A LA TEORA DE LA MEDICIN 10

MEDIR, MEDICIN Y MEDIDA 10

Concepto 10

Tipo de medida 12

Escala de medida 12

Unidad de medida 13

Instrumentos 13

Operaciones 13

Resultados 14

SUPUESTOS BSICOS 14

USOS DE LA MEDICIN EN PSICOLOGA 14

ALGUNAS CLASIFICACIONES 15

REPASO DE TEORIA ESTADSTICA 16

Funciones de probabilidad 16

Valor esperado 17

Varianza y desviacin tpica 18

Covarianza y correlacin 20

Distribucin binomial 21

Distribucin normal y normal estandarizada (Z) 22

Aproximacin de la distribucin binomial a la normal 23

Teorema del lmite central 23

PRESENTACION

No es fcil lograr que el ttulo de un documento como este sea el resumen fiel y justo de lo que contiene y la forma de presentacin de los temas, de manera que oriente al lector a cerca de lo que puede esperar de l. Esta introduccin se dedicar entonces, a contarle al lector lo que NO es este documento, lo que NO contiene, lo que NO puede esperar de l y tal vez a persuadirlo de que no lo vale la pena leerlo, a menos que est inscrito en el curso de psicometra del programa de Psicolog-a de la Universidad Nacional y no tenga intencin de cancelar tal inscripcin, en cuyo caso no tendr ms alternativa que revisarlo con cierto detenimiento. Esa revisin, sin embargo puede limi-tarse a hacer un inventario de los temas y subtemas que trata con el fin de estudiarlos utilizando cualquier otro de los textos que aparecen en la bibliografa.

Este no es un texto de psicometra, ni siquiera presenta en forma explcita una propuesta a cerca de lo que es la medicin en psicologa, sus alcances y limitaciones y cmo puede entenderse lo que en la actualidad se conoce como psicometra. Si usted est interesado en este tema puede remitirse a textos como el de Bunge (1983) o Suppes (1984), quienes se ocupan de la discusin filosfica y matemtica de lo que implica medir en ciencia, los problemas que presenta y los retos que debe enfrentar; o al captulo de Pawlik (1992) quien presenta un panorama general de la eva-luacin psicolgica y sus principales usos en la actualidad. Tampoco puede encontrar el lector una revisin de la historia de la psicometra, sus desarrollo actualizados y sus perspectivas futuras, aunque es evidente la carencia de trabajos actualizados en nuestro medio que traten este tema, pueden encontrarse algunas revisiones en los textos de Anastasi (1974), Nunnally (1973), Tyler (1972), Guilford (1986) o Carpintero (1989).

De otra parte, aqu se ignora por completo la discusin sobre las implicaciones ticas de medir en psicologa y algunas de las normas convencionales que deben respetar los psiclogos como con-sumidores y usuarios de instrumentos de medicin psicolgica. Los estndares para la utilizacin y aplicacin de test psicolgicos pueden encontrarse, entre otros, en la publicacin de la A.P.A. (1974) o en el proyecto de la Asociacin Colombiana de Facultades de Psicologa ASCOFAPSI (1991).

El lector tampoco puede esperar una presentacin completa de la teora psicomtrica y la discusin sobre sus principios tericos y filosficos. Si ese es su inters, en trabajos como los de Guiselli (1964), Horst (1968), Lord y Novick (1968), Magnusson(1969) y Jones (1971), entre otros, puede encontrar presentaciones detalladas de los principios bsicos de la teora clsica de medicin, de la confiabilidad y del error de medida en psicologa, y en el libro de Thorndike (1995) puede encon-trar, adems una revisin sobre los mtodos bayesianos en la aplicacin de pruebas. Ahora, si usted tiene intereses un poco ms especficos sobre algunos modelos de anlisis ms contem-porneos puede remitirse a trabajos como el de Rasch (1960), Iroson (1980), Lord (1980), Apodaka y Pez (1992), Licht (1995), Klem (1995) o Hoyle (1995).

NO es sta una gua prctica para quienes se ven enfrentados a la tarea de construir y analizar pruebas, estn interesados en la comprensin intuitiva de las tcnicas psicomtricas, o necesiten hacer uso adecuado de los principales procedimientos conociendo en detalle, o sin hacerlo, el sus-tento matemtico o estadstico de los mismos o las discusiones en torno a ellos. En este sentido resulta til la revisin de trabajos como el de Guilford (1954), Wesman (1971), Krathwohl y Payne (1971), Sherman y Tinkelman (1971), Thorndike R. (1973), Brown (1980) o Thorndike (1995); de manuales como los publicados por la Direccin Nacional de Administracin Judicial (1991) o la Universidad de los Andes (Sabogal, 1989) o de las pginas que dedica Carroll (1988) a los aspec-tos selectos de metodologa psicomtrica.

Tampoco podr encontrar el lector una recopilacin de informacin sobre los principales o ms conocidos instrumentos de medicin psicolgica que oriente a quienes deseen decidir sobre el uso de algunos de ellos con algn objetivo especfico. Aunque no muy actualizados, dos trabajos

NOTAS SOBRE PSICOMETRIA Presentacin

2

podrn ser de gran utilidad si este es su inters: Anastasi (1974) y Bla Szkely (1978); una impor-tantsima fuente de informacin al respecto la constituyen los Mental measurements yearbook o bien, haciendo uso de la tecnologa moderna se puede tener acceso a informacin permanente-mente actualizada a travs de Internet.

Por ltimo, lo que probablemente decepcione ms a los potenciales lectores es el hecho de que este documento NO reemplaza la asistencia a las clases de psicometra, lo cual sera un gran mri-to. Definitivamente sin la participacin activa en las discusiones de clase y la presentacin de expe-riencias en el trabajo prctico que se propone en el curso, jams podr un estudiante alcanzar los objetivos planteados en el programa del mismo.

Sin embargo, para despejar las dudas que en los prrafos anteriores puedan haberse creado sobre la existencia de este documento, puede decirse que se trata de un trabajo en proceso que contiene una recopilacin de algunas notas de un curso de psicometra, recogidas y modificadas cada se-mestre entre 1994 y la fecha; cuya nica pretensin es presentar de manera sinttica los principa-les tpicos de algunos temas de teora psicomtrica clsica y de algunos de los procedimientos ms comunes en la elaboracin y anlisis de pruebas psicolgicas; y cuyo nico mrito tal vez sea el simple hecho de existir.

DATOS HISTORICOS DE LA MEDICION EN PSICOLOGIA

Pueden encontrarse algunos intentos de hacer medicin muy antiguos: el Imperio Chino, los grie-gos, la edad media y hasta la Biblia; tal vez el ejemplo ms reportado sobre estos primeros intentos es la clasificacin del mdico griego Galeno, quien clasifica a los seres humanos segn los humo-res en sanguneo, colrico, flemtico y melanclico en lo que podra verse como una primera pro-puesta de escala nominal para medicin de la personalidad. Aunque la literatura est llena de ejemplos como el anterior, lo que se conoce hoy como psicometra empez a tomar forma slo hasta el siglo XIX.

El famoso episodio del joven auxiliar en el Observatorio Astrolgico de Greenwich, cuyos registros del tiempo de paso de las estrellas a travs de una lnea del campo visual del telescopio, diferan sistemticamente de los de su maestro, se convirti gracias a las elaboraciones de los psicofsicos, en la evidencia de que algunas diferencias humanas podan cuantificarse. Mediante monitoreos de los registros de los astrnomos en dicho observatorio Bessel (1816) observ que haba variaciones en la rapidez con que reaccionaban los individuos a estmulos visuales, dando lugar a lo que se conocera como la ecuacin personal. Quetelet, matemtico belga, fue el primero en plantear que la teora matemtica de la probabilidad poda aplicarse a las mediciones humanas.

Por otra parte, los trabajos de Esquirol (1838), mdico francs que se interes por el estudio del retraso mental, constituyen un avance interesante en la medicin de este trastorno que tendra implicaciones en el futuro desarrollo de tcnicas ms refinadas para la medicin del mismo. Pue-den resumirse en tres los aportes de Esquirol: Por una parte hace distincin entre los alienados, con profundos trastornos emocionales y los retrasados mentales con deficiencias de tipo intelec-tual; de otra parte intenta algunas clasificaciones de los diversos grados de retraso mental y final-mente, identifica el lenguaje como el criterio ms fiable para evaluar y clasificar los trastornos mentales. En esta misma lnea se encuentran las contribuciones de su compatriota y colega Se-gun (1866) quien, con su rechazo a la nocin de incurable del retraso mental, crea la primera es-cuela para retrasados y disea algunos procedimientos de adiestramiento bsicamente sensorio-motor, algunos de los cuales forman parte de los llamados test no verbales de inteligencia.

Desde una perspectiva muy diferente, ya que estaban ms interesados por plantear generalizacio-nes que por analizar diferencias, se encuentran los primeros psiclogos experimentales del labora-torio de Wuntd, (1879) en Leipzig. Estos personajes, a quienes la historia reconoce como los fun-dadores de la psicologa experimental, tuvieron gran importancia en los desarrollos de la medicin en psicologa: Por una parte disearon algunas pruebas de sensibilidad y tiempos de reaccin a estmulos visuales, auditivos y de otros sentidos, marcando la pauta para la mayora de trabajos que en la misma lnea se desarrollaron a finales de siglo XIX y por otra, con su rigor cientfico, pu-sieron de manifiesto la necesidad de controlar las condiciones de prueba y tipificar procedimientos.

Sin duda uno de los personajes que ha merecido el mayor reconocimiento por sus interesantes aportes no slo en la medicin en psicologa sino en otros campos como la biologa, es Sir Francis Galton. Este polifactico ingls interesado por el estudio de la herencia, sinti rpidamente la nece-sidad de medir las caractersticas humanas as que creo un laboratorio antropomtrico en Londres (1884) para el cual dise varias pruebas de agudeza y discriminacin sensorial con la conviccin de que stos le permitan medir el intelecto. Algunos de tales instrumentos como la barra de Galton y el silbato de Galton se han utilizado para medicin de la discriminacin visual de longitud y del grado de sensibilidad a tonos altos, respectivamente, hasta hace muy poco tiempo. Adems del diseo de instrumentos de medicin sensorial, Galton fue el primero en utilizar las escalas de esti-macin, los cuestionarios y la asociacin libre; pero tal vez el aporte que no ha sido suficientemen-te reconocido fue el haber seleccionado y adaptado algunas tcnicas matemticas para el anlisis de los resultados de sus pruebas y la medicin de las diferencias individuales y el haber introducido

NOTAS SOBRE PSICOMETRA Datos histricos

4

la idea de variacin concomitante entre dos medidas1, constituyndose en el precursor de lo que

hoy se conoce como coeficientes de correlacin, anlisis de regresin y otros procedimientos de anlisis cuantitativos en investigacin con humanos.

De acuerdo con las ideas de Galton sobre la medicin de la inteligencia y convencido de que era casi imposible medir objetivamente funciones complejas, el psiclogo norteamericano James McKeen Catell, discpulo de Wundt en el laboratorio de Leipzig, dise y aplic un sinnmero de test de discriminacin sensorial, tiempo de reaccin, memoria y otras. A Catell se le debe adems, la rpida difusin de aplicacin de pruebas en Norte Amrica y los primeros intentos por validarlas con criterios externos; sin embargo, el hecho que con mayor frecuencia se reporta en torno a sus aportes es haber introducido en la literatura psicolgica el trmino de test mental (1890). Aunque, por este hecho, a Catell se le reconoce como el padre de los test mentales, las dos ltimas dca-das del siglo pasado fueron testigos de una gran cantidad de trabajos que pretendan desarrollar medidas de funciones psicolgicas complejas. Entre ellos se encuentran los trabajos de los alema-nes Oehrn (1889), Kraepelin (1895) y Ebbinghaus (1897), los norteamericanos Jastrow (1891), Mnsterberg (1891), Bolton (1892), J. A. Gilbert (1897), los italianos Guicciardi y Ferrari (1896) y muchos otros, algunos de los cuales empezaban a cuestionar el hecho de que los resultados de los test mentales no guardaran correspondencia con el xito acadmico.

Dos de estos trabajos merecen captulo aparte: Por un lado, los intentos de medicin de procesos psicolgicos complejos en el campo de la psicopatologa presentado por Kraepelin (1895), quien construy una cantidad de test que pretendan medir diversos rasgos que permitieran caracterizar a los individuos, se constituyeron en los precursores de las mediciones objetivas de la personali-dad. Por otra parte, los tests de completacin de frases de Ebbinghaus (1897) fueron los nicos de los desarrollados en esa poca, que permitieron una prediccin adecuada del rendimiento acad-mico y an hoy forman parte de la mayora de pruebas de inteligencia.

Sin embargo, el honor de la publicacin de la primera escala de medida de inteligencia le corres-pondi al francs Alfred Binet, quien en compaa de Henri haba publicado en 1895, un artculo que criticaba los tests existentes hasta el momento por dedicarse a mediciones muy precisas de funciones muy elementales; y propona otros que abarcaban funciones ms complejas aunque medidas menos precisas. En este contexto, la primera escala de medida de inteligencia, que reuni las experiencias anteriores e introdujo adems preguntas sobre juicio, comprensin y razonamien-to, fue desarrollada por Binet y Simon y se public en 1905. En la segunda revisin de esta escala se propone un procedimiento sistemtico para obtener los puntajes de prueba y se introduce el concepto de Edad mental (1908), y en la revisin de Terman (1916), conocida como Stanford-Binet, aparece la idea de Cociente Intelectual.

La edad mental de Binet y Simon se obtena gracias al ordenamiento de los elementos de la esca-la en orden creciente de dificultad y su agrupacin por niveles de edad. Tal agrupacin obedeca a criterios empricos, reuniendo los elementos que podan ser contestados correctamente por nios normales de cada edad cronolgica desde 3 a 13 aos; la edad mental era el nivel al que llegaba cada examinado, esto es, el nivel que alcanzaba dentro de esta graduacin. Tratndose de un ndice tan sencillo tuvo gran aceptacin por ser la primera propuesta de una unidad de medida que aunque no alcanzaba el nivel de precisin de las utilizadas hasta el momento dentro de los medi-ciones sensoriales, tena el gran mrito de ser propia de la psicologa. La principal limitacin de esta unidad era sin embargo, que su interpretacin dependa de lo que se esperara de la ejecu-cin del examinado dada su edad cronolgica; es decir, saber que un nio tena una edad mental de 4 aos no reportaba mayor informacin a cerca de si su nivel estaba dentro de lo normal o por el contrario estaba por encima o por debajo de lo que se esperara de l. La propuesta de Terman supera tal limitacin construyendo una unidad cuyo resultado es interpretable: el famoso C.I. no era

1 En sus Notas sobre la historia de la correlacin Karl Pearson (1920), refirindose al trabajo de Galton titu-lado Typical laws of heredity in man (1877), escribe: Aqu aparece por primera vez una medida numrica

r de lo que se conoce como reversin, que ms tarde Galton llam regresin . Esta r es la fuente de nuestro smbolo para el coeficiente de correlacin. Maxwell (1979).


5

otra cosa que la razn edad mental de Binet sobre la edad cronolgica multiplicado por 100, de manera que los puntajes al rededor de 100 (edad mental = edad cronolgica) indicaban normali-dad, para cualquier nivel de edad del examinado. Esta unidad de medida de inteligencia, con todas sus limitaciones, tiene una gran importancia en la psicometra ya que con ella, los test psicolgicos lograron un reconocimiento nunca antes alcanzado hasta el punto de que el C.I. se convirti casi en un mito.

Terminada la segunda dcada del presente siglo los tests psicolgicos gozaban de gran populari-dad, el concepto de C.I. era ya ampliamente conocido y la Americana Psychological Association (A.P.A.) mostraba gran inters en el desarrollo de pruebas psicolgicas. La decisin de Estados Unidos de participar en la Primera Guerra Mundial y de la APA en colaborar en dicha empresa, puso de manifiesto algunas limitaciones de los tests psicolgicos conocidos hasta el momento. Por una parte, se trataba de instrumentos que deban ser aplicados de manera individual y por psiclo-gos experimentados lo cual no resultaba conveniente si se trataba de seleccionar grandes nmeros de personas para el ejrcito norte americano. Robert Yerkes (1917) y su equipo designado preci-samente por la APA, recolect todos los tests disponibles y algunos no publicados y conformaron una primera prueba de aplicacin colectiva conocida como Test Army Alfa, basada en los trabajos an no publicados de Arthur Otis. Por otra parte, las pruebas conocidas hasta el momento no per-mitan la evaluacin de personas analfabetas, con deficiencias de lenguaje o que no conocieran el idioma, nuevamente los trabajos de Otis sirvieron como base para el desarrollo del primer test de inteligencia no verbal conocido como el Test Army Beta. Finalmente, el concepto de C.I., a partir de edad mental y edad cronolgica no resultaba muy adecuado cuando se trataba de evaluar adultos, as que nacieron las primeras formas de puntuacin de los tests a partir de normas de grupo; ba-sadas en la comparacin de la ejecucin de un individuo en la prueba, con el desempeo promedio del grupo (poblacin) al que pertenece segn algunas variables de inters como sexo, edad o es-colaridad. Este tipo de unidad de medida sigue siendo utilizado hoy.

As la tercera dcada del presente siglo fue testigo de una inusitada popularizacin del uso de los tests psicolgicos hasta el punto de que la psicologa se asociaba con trminos como test o C.I.. Segn Anastasi (1974) ... el florecimiento de los test, ocurrido en los aos veinte, basado en el uso indiscriminado de los mismos, puede haber causado tanto retraso como progreso en los test psi-colgicos.. Sin embargo, mientras en Norte Amrica estaba en pleno auge el desarrollo y uso de test psicolgicos para muchsimos fines, otros autores se preocupaban ms por los anlisis ma-temticos que brindaran mayor soporte a sus resultados y por el desarrollo de modelos tericos y de anlisis sobre todo en el campo de la medicin de la inteligencia. Se destacan en esta lnea los trabajos de los ingleses Spearman, Thompson y Burt, que fueron continuados y perfeccionados por los norte americanos Kelley y Thurstone.

Charles Spearman, basado en las ideas de Galton y en los posteriores trabajos de Karl Pearson sobre su medida de correlacin, haba iniciado desde 1904 una serie de trabajos sobre las funcio-nes cognoscitivas. Apoyado en la observacin de que las matrices de correlaciones entre tests cognoscitivos eran positivas y jerrquicas

2, plantea su famosa teora de dos factores y sustenta

matemticamente sus conclusiones (1927). Segn esta teora las puntuaciones en los tests cog-noscitivos pueden explicarse a travs de dos factores: uno general, conocido como el factor g, que

es comn a todas las funciones medidas en los tests y uno especfico, s, que sera exclusivo de cada una. El principal contradictor de las ideas de Spearman es su compatriota Thompson quien, basado en las mismas evidencia demuestra con el mismo rigor matemtico que las correlaciones observadas por Spearman pueden explicarse por las leyes del azar operando sobre un conjunto complejo de elementos independientes que constituyen la inteligencia. Por su parte, otro ingls Burt (1941) vena sosteniendo que las correlaciones entre los tests podan ser satisfactoriamente explicadas a travs de: a) un factor general, varios factores comunes de mayor o menor nivel de

2 Una matriz de correlaciones es una tabla que presenta los valores de todas las correlaciones entre un gru-po de variables, dos a dos. Es entonces simtrica, los elementos de la diagonal principal son iguales a 1 y se dice que es jerrquica cuando sus columnas son proporcionales.


6

generalidad y c) tantos factores especficos como tareas o tests. Sin embargo, el desarrollo y refi-namiento de lo que hoy se conoce como anlisis factorial o multifactorial en psicometra, se le debe al norteamericano Thurstone.

El psiclogo estadounidense L. L. Thurstone (1935, 1947) inicia lo que Bla Szkely (1978) ha denominado la segunda etapa del anlisis factorial, al introducir los principios del lgebra matricial en el anlisis de las tablas de correlacin logrando as representaciones n dimensionales de las relaciones entre test, la extraccin de los posibles factores explicativos para resumir de manera ms o menos fiel la misma informacin de la matriz original, y el desarrollo de mtodos de rotacin de tales ejes buscando la estructura simple que facilitara la interpretacin de los resultados. Es evidente que el diseo de estos procedimientos abra las puertas para la medicin de aptitudes ms especficas y para dar respuestas ms satisfactorias a los cuestionamientos que venan plan-tendose desde la dcada anterior a cerca de las diferencias intraindividuales observadas en el desempeo frente a pruebas de inteligencia general. En lo que a desarrollo de instrumentos se refiere, el resultado directo de las investigaciones de Thurstone sobre el anlisis factorial y la identi-ficacin de aptitudes primarias, fue la batera conocida como test de Chicago de Aptitudes Menta-les Primarias (PMA), publicada por primera vez en 1941. La versin de esta batera en 1962, con algunas adaptaciones y modificaciones sigue utilizndose hoy en el contexto educativo y laboral; y las tcnicas de anlisis factorial propuestas por Thurstone son an muy utilizadas para el anlisis de diversas pruebas psicolgicas.

Mientras esto ocurra se haban desarrollado una serie de pruebas de uso en diversas reas de aplicacin de la psicologa. Por una parte, en 1939 se publicaba la escala de Inteligencia de Wechsler-Bellevue con la intencin de proponer un instrumento de medida adecuado para adultos, que presentara elementos y sistemas de puntuacin ms adaptados para este tipo de poblacin. Esta escala fue la primera versin de la que hoy se conoce como Escala de inteligencia para adul-tos de Wechsler (WAIS), muy utilizada en diferentes contextos. Por otra parte se adelantaban los trabajos del neurlogo alemn Kurt Goldstein y el psiclogo Gelb, quienes una vez terminada la primera guerra mundial haban iniciado el desarrollo de algunos instrumentos de medicin neurop-sicolgica, con base en la observacin de jvenes soldados que haban sufrido lesiones cerebra-les. Como resultado de este trabajo se disearon los test de formacin de conceptos que pretend-an evaluar el deterioro de la actitud abstracta como consecuencia de la lesin cerebral, y que si-guen utilizndose hoy en evaluacin neuropsicolgica. Sin embargo Goldstein slo logr el diseo definitivo de su prueba, compuesta por 5 test, despus de haber emigrado a Estados Unidos y en compaa de Scheerer, trabajo que fue publicado en 1941. En esta misma lnea se desarroll el test de formacin de conceptos de Hanfman y Kasanin (1942), con base en un instrumento de cla-sificacin de objetos que haba sido elaborado por Vigotsky. En mediciones de personalidad tam-bin se haban hecho avances interesantes en lo que a desarrollo de pruebas se refiere: Una de ellas es la hoja de datos personales de Woodworth, considerada el precursor de los hoy llamados inventarios de personalidad, que se haba desarrollado durante la primera guerra mundial pero slo se conoci y emple fuera del contexto militar despus de que sta terminara. Por otra parte Hartshorne y May (1928-1930) haban desarrollado algunos test de ejecucin con la intensin de medir aspectos como mentira, robo y espritu de cooperacin en nios escolares. Con una pers-pectiva diferentes E. K. Strong publicaba en 1943 sus cuestionarios de intereses vocacionales para hombres y mujeres. Pero tal vez el trabajo de mayor trascendencia en esta lnea es el registro mul-tifsico de la personalidad de Hathaway y Mckinley (1940), primera versin del Inventario Multifas-tico de Personalidad de Minnesota MMPI que tiene varias traducciones, adaptaciones y estandari-zaciones y sigue siendo utilizado hoy. Tal vez hasta el momento ningn instrumento de medicin de la personalidad ha sido objeto de tantos estudios, aplicaciones e investigaciones en diferentes reas de la psicologa (clnica, laboral, educativa), como el MMPI.

En este contexto: la popularizacin del uso de los tests psicolgicos, el reconocimiento de diferen-cias intraindividuales en el desempeo en test de funciones intelectuales, los fuertes avances en el desarrollo de mtodos matemticos y estadsticos para el anlisis de los resultados de los mismos y el diseo de algunas pruebas psicolgicas de utilidad en psicologa clnica, educativa, laboral y


7

en neuropsicologa; Estado Unidos decide intervenir en la segunda guerra mundial y nuevamente los psiclogos norteamericanos se ven enfrentados a algunas demandas por parte del ejrcito. Esta vez la respuesta fue la creacin de las bateras de aptitud mltiple o pruebas diferenciales de la lnea del PMA, que permitan la evaluacin de funciones mucho ms especficas y la clasifi-cacin de personal para tareas especializadas como pilotos, bombarderos, operadores de radio y otras. Ejemplos de estos instrumentos son la Aircrew Classification Battery, el Army General Clas-sification Test (AGCT) y el Armed Forced Qualification Test (AFQT)

3. Con las dos ltimas se levan-

taron escalas de calificacin estandarizadas conocidas como Army Standard Scores.

Sin embargo, la mayora de bateras o pruebas diferenciales se conocieron despus de terminada la guerra cuando el ejercito las cedi para uso civil y en los aos subsiguientes se observ un in-cremento significativo en el nmero de trabajos que buscaban el diseo de esta clase de instru-mentos, la mayora de ellos construidos con base en el procedimiento recientemente conocido de anlisis factorial. Algunos de los instrumentos ms conocidos de esta generacin son el Test de clasificacin de aptitudes de Flanagan (FACT), la batera de test de aptitud general (GATB) y el test de aptitudes diferenciales (DAT). El primero de ellos, cuyos progresos empezaron a conocerse en 1947, fue el resultado de algunos trabajos iniciados durante la segunda guerra mundial con el obje-to de disear instrumentos de clasificacin de personal de las fuerzas areas y se orienta haca el consejo profesional y la seleccin de personal. La GATB fue diseada por el State Employment Service estadounidense (1956) con base en resultados de anlisis factorial de bateras prelimina-res y con el objeto de contar con un instrumento til para consejo profesional y laboral. Finalmente, el DAT, que fue publicado originalmente en 1947, fue construida como instrumento para orientacin vocacional en el campo educativo, ha sido objeto de muchos estudios en esa rea y en conse-cuencia han aparecido varias revisiones algunas de las cuales se siguen utilizando hoy.

En este mismo perodo la evaluacin educativa, que haba venido reemplazando sus formas con-vencionales por los famosos test, desde la aparicin de la primera versin del Stanford Achiement Test haca ya un par de dcadas; entra definitivamente en la honda de las mediciones objetivas y estandarizadas. Vale destacar aqu los trabajos de E. L. Thorndike y otros educadores y psiclogos dedicados a aplicar y refinar las tcnicas de construccin, utilizacin y calificacin de pruebas de rendimiento escolar; y la creacin, en 1947, del Educational Testing Service (ETS) encargado de la construccin y evaluacin de pruebas en el rea educativa y laboral. Tal vez el instrumento ms conocido en esta lnea es el Graduate Record Examination (GRE), que se haba originado en 1936, pas a manos del ETS en 1948 y sigue utilizndose como instrumento de seleccin de estudiantes universitarios en Estados Unidos. En este contexto lleg formalmente la psicologa a Colombia y lo hizo precisamente como psicometra en el campo Educativo. En 1940? se crea la seccin de psico-tecnia en la Facultad de Medicina de la Universidad Nacional de Colombia con el fin de seleccionar los aspirantes a ingresar a esta institucin y en 1948 se inicia la enseanza de la psicologa en la carrera de medicina de la Universidad Nacional de Colombia en lo que Meja (1993) llama la poca dorada de la psicometra en Colombia (1939-19??).

Durante las dos dcadas siguientes se desarrollaron nuevos instrumentos de medicin en muchas reas y se revisaron y publicaron nuevas versiones y adaptaciones de los ya existentes; sin em-bargo, lo que parece caracterizar este periodo es la aparicin de trabajos sobre teora de la medi-cin, los principios y fundamentos de la medicin en psicologa, los problemas de validez y confia-bilidad y en sntesis, la construccin de una teora psicomtrica. En lo que tiene que ver con desa-rrollo y revisin de pruebas se pueden mencionar, entre muchos otros: el cuestionario de 16 facto-res de la personalidad de Catell (16PF) desarrollado mediante anlisis factorial y publicado en 1951; el cuestionario de personalidad de Eysenck, resultado de las investigaciones que sobre es-tructura de personalidad haba venido adelantando desde 1947; el inventario de temperamento de Guilford-Zimmerman (1956), las escalas Wechsler de inteligencia

4; la tercera revisin de la escala

3 Una presentacin detallada de las caractersticas de estos instrumentos y otros desarrollados en el mismo contexto, se encuentra en Anastasi (1974)

4 Son tres instrumentos conocidos como escala Wechsler de inteligencia para nios (WISC) publicada en 1950; la escala Wechsler de inteligencia para adultos (WAIS) publicada en 1955 y la escala Wechsler de


8

de inteligencia de Stanford-Binet (Terman y Merrill, 1960) y los inventarios de intereses vocaciona-les (1966) e intereses generales de Kuder (1964), revisiones de la hoja de intereses vocacionales de Kuder que haba sido publicada en 1948. De otra parte, una ligera revisin de la bibliografa existente permite verificar que en este periodo se produjeron las grandes obras sobre teora y pro-cedimientos psicomtricos que son de uso corriente an. Corriendo el riesgo de omitir algunos de mucha importancia, se pueden citar trabajos como la publicacin de Gulliksen, H. (1950) titulado teora de los test mentales; los trabajos de Cronbach y colaboradores sobre validez y confiabilidad en las pruebas psicolgicas, publicados entre 1951 y 1957; las publicaciones de Guilford (1954) sobre mtodos psicomtricos, de Rasch (1960) sobre modelos probabilsticos para pruebas de logro e inteligencia y de Guiselli (1964) sobre teora de la medicin psicolgica; la teora de Guil-ford sobre la estructura de la inteligencia humana, cuya primera edicin apareci en 1967; la gran cantidad de artculos publicados por Paul Horst entre 1949 y 1960 y su libro sobre medicin y pre-diccin psicolgica en 1968; la teora estadstica de los puntajes de test mentales de Lord y Novick (1968), los trabajos de Eysenck sobre estructura de la personalidad, publicados a partir de los 50s y el muy conocido texto de Magnusson sobre teora de los test (1969).

A pesar de la gran produccin de trabajos sobre teora psicomtrica y el empeo de algunos psic-logos por brindar sustento terico y tcnico al uso de los mismos en una gran diversidad de cam-pos; a partir de la dcada de los sesenta se puede identificar lo que Anastasi (1974) denomina la revuelta anti-test. Esta poca, si as puede llamarse, se caracteriz no slo por un evidente escep-ticismo por parte de acadmicos y pblico en general a cerca de la utilidad de las pruebas psicol-gicas, sino por algunas posiciones abiertamente en contra de los mismos. Algunas de las publica-ciones que tal vez tuvieron ms impacto en este sentido fueron las de Gross en 1962, Hoffman en el mismo ao y Black en 1963 (Citados por Anastasi, 1974); con ttulos tan sugestivos como The brain watchers, The tyranny of testing y They shall not pass, respectivamente; en las que no slo se pona en duda la utilidad de los tests sino que se hacan serias crticas a su uso. Algunas de tales crticas de tipo tcnico: cuestionaban la capacidad de las pruebas para brindar informacin confiable sobre las aptitudes, la inteligencia o la personalidad del examinado y por tanto la utilidad de los resultados con fines predictivos tiles en el campo educativo, laboral o clnico. Otras eran de tipo tico y filosfico con afirmaciones a cerca de la violacin de la intimidad del examinado; la indebida divulgacin y utilizacin de los resultados de las pruebas; la falta de responsabilidad en el manejo de las implicaciones emocionales de la aplicacin y conocimiento de resultados de las pruebas; la visin limitada y reduccionista del individuo a partir de los resultados de las pruebas y en fin, la pretensin de cuantificar lo no cuantificable: el ser humano. Finalmente, haba objeciones de tipo poltico: las pruebas pretendan medir conformismo social o, en todo caso favorecan a quienes mostraban determinadas preferencias polticas o filosficas; las pruebas desfavorecan a determinados grupos tnicos o con diferencias culturales; y en nuestro medio el uso de pruebas lleg a identificarse con imperialismo norteamericano. Probablemente algunas de las crticas eran razonables y se deban al abuso de los instrumentos de medicin por parte de profesionales ines-crupulosos o no capacitados, otras podran atribuirse a desconocimiento de las limitaciones de las pruebas y otras, podran verse como reaccin al fenmeno aceleradsimo de implementacin y uso de pruebas. En fin, dejemos que algn historiador se interese por analizar estos hechos desde una ptica mucho ms completa que la que podemos tener desde aqu.

Como era de esperarse, la revuelta anti-test ha dejado sentir sus efectos. Probablemente uno de ellos sea el hecho de que los modelos de anlisis de instrumentos psicolgicos que se generaron entre las dcadas de los 70 y 80 son an hoy muy poco conocidos, al menos en nuestro medio, y apenas se estn empezando a valorar y a utilizar sobretodo en el campo educativo. Uno de ellos es el modelo bayesiano. A pesar de que Thomas Bayes haba expuesto los fundamentos de lo que hoy se conoce como teora estadstica bayesiana en 1763, se necesitaron casi dos siglos

5 para

inteligencia para niveles preescolar y primario (WPPSI) publicada en 1967. Todas han sido traducidas al espaol y estandarizadas en varios pases y son de uso muy comn en diversas reas como educacin, psicologa clnica y neuropsicologa.

5 El artculo de Bayes apareci publicado nuevamente en 1958 en la revista Biometrika, despertando el in-ters de algunos acadmicos (Martz y Waller, 1982)


9

que algunos estadsticos vieran en l una alternativa de anlisis de algn inters y slo hasta hace un par de dcadas empezaron a verse sus aplicaciones y utilidad en el anlisis de pruebas psi-colgicas. De manera muy sinttica puede expresarse el sentido del teorema de Bayes como el enunciado formal de las relaciones entre la conocida probabilidad a priori, la informacin que se tenga sobre el fenmeno de inters y la probabilidad a posteriori; lo cual permite hacer estimacio-nes teniendo en cuenta la informacin adicional que se tenga proveniente de p.e. experiencias previas. Este principio general ha tenido implicaciones en la interpretacin de resultados de prue-bas psicolgicas y en el diseo y construccin de las mismas. Por una parte, permite estimar la posicin de un sujeto en un nivel del atributo que pretende medir la prueba teniendo en cuenta tanto su desempeo actual como la informacin previa que se tenga sobre l. Por otra parte, si lo que se desea con la construccin y aplicacin de una prueba es estimar con precisin el nivel del examinado en el atributo, el anlisis bayesiano permite identificar el punto ms adecuado para obtener informacin que permita el posicionamiento rpido y preciso del sujeto. Estas aplicaciones y el uso de nuevas tecnologas como los cumputadores, han permitido el desarrollo de los instru-mentos conocidos como pruebas hechas a la medida en las cuales cada elemento de la prueba es seleccionado con base en la informacin que se tenga sobre el sujeto y en la respuesta que d al elemento anterior.

Otro inters de los psiclogos en las ltimas dcadas ha sido el sesgo de las pruebas y los elemen-tos que las componen. Tal sesgo puede verse de manera muy sencilla, a travs de las discrepan-cias de dificultad y discriminacin de los elementos de la prueba o de puntaje promedio y confiabili-dad de la prueba total, en grupos diferentes. Rasch haba propuesto en 1960 un procedimiento, que no depende de la poblacin a la que se aplic la prueba, para posicionar sus elementos en un nivel del atributo. Sin embargo, ha sido Wright en compaa de Panchapakesan (1969) y de Stone (1979), quienes han mostrado la utilidad de este tipo de anlisis en algunas de sus publicaciones sobre anlisis de tems y diseo de pruebas.

Finalmente, dos modelos de anlisis multivariados que han sido objeto de estudio de algunos psiclogos y socilogos en los ltimos aos han sido el Patn Analysis y los Structural equation modeling. Estos modelos han mostrado utilidad en la comprobacin de hiptesis de relaciones entre grupos de variables, el primero de ellos como una extensin de los anlisis de regresin don-de se puede analizar ms de una variable dependiente (Klem, L, 1995) y el segundo como proce-dimiento para poner a prueba modelos que incluyen tanto variables observadas como variables latentes y diferentes tipos de relaciones entre ellas. Algunas publicaciones sobre este ltimo tema son Bollen, K. A. (1989); Apodaka y Pez (1992) y Hoyle, R. (1995).

Aunque en la actualidad no se ha iniciado en Colombia un estudio cuidadoso de los ltimos avan-ces en modelos cuantitativos de aplicacin en psicologa, lo cual se evidencia por la ausencia de estos temas dentro de los programas de los cursos de psicometra o de mtodos cuantitativos en las Facultades de Psicologa en nuestro pas; algunos hechos parecen indicar un cambio de actitud frente a la medicin psicolgica. El fortalecimiento del Servicio Nacional de Pruebas, pese a todos sus contradictores; la implementacin cada vez ms generalizada de procedimientos de seleccin en las grandes universidades; la exigencia explcita de la Constitucin Nacional de Colombia (1991) en cuanto al ingreso a las entidades del Estado, por sistemas de mritos; y los subsecuen-tes desarrollos legales en las diferentes ramas del Poder Pblico, que prevn la utilizacin de me-didas objetivas dentro de los concursos de ingreso; se estn convirtiendo en demandas apremian-tes que exigen de los psiclogos volcar su atencin sobre los mtodos cuantitativos. Desde esa perspectiva, probablemente quien escriba la historia de la Psicologa en Colombia dentro de unas dcadas, podr afirmar que el principio del segundo milenio fue la poca del resurgimiento de la psicometra.

INTRODUCCION A LA TEORA DE LA MEDICIN

MEDIR, MEDICIN Y MEDIDA

Jones, L. (1971) encontr cuarenta (40) significados diferentes asociados a los trminos medicin y medida, entre los cuales estn: un procedimiento, una operacin, una relacin, una tcnica o con-junto de tcnicas, una unidad o parmetro y un resultado especfico. Considerada como un proce-dimiento, la medicin puede implicar desde una serie de pasos organizados que incluye la asigna-cin precisa de valores o nmeros (calificaciones) a objetos o sujetos segn un atributo hasta un proceso de estimacin subjetiva de un evento particular. Pero adems la medicin ha sido conside-rada como una tcnica o conjunto de tcnicas para disear y utilizar instrumentos que permitan obtener informacin sobre algn atributo. Se ha denominado tambin "medicin" o "medida" a las unidades o parmetros de comparacin utilizados para estimar la magnitud de una propiedad e inclusive, a los resultados obtenidos como consecuencia de la comparacin entre el atributo y di-chos parmetros. Todos estos significados parecen hacer nfasis en uno o unos pocos aspectos o elementos de la medicin sin lograr una visin amplia y completa de la misma (Herrera, 1993a).

Por otra parte, Gutirrez (1989) define la medicin como una relacin en la cual los objetos o suje-tos conforman el conjunto dominio y, el conjunto de valores o nmeros conforman el rango, a cada elemento del primer conjunto se asigna uno del segundo (nmero) segn algunas normas previa-mente establecidas. Al considerar la medicin como una relacin se est haciendo nfasis en la asignacin de nmeros o valores a objetos o sujetos segn el atributo medido. Esta visin hace equivaler "medicin" a cuantificacin, entendida sta, segn Bunge (1983), como el procedimiento por el cual se asocian algunos conceptos con variables numricas.

Otra posicin frecuente es definir medicin como la operacin de comparar un atributo de un objeto o sujeto con una unidad de medicin previamente definida, la cual termina con la expresin del nmero de veces de la unidad de medicin que representa la magnitud del atributo. Esta definicin, similar a la de Gutirrez, incluye tambin las nociones ya mencionadas: la medicin como relacin y como cuantificacin; pero haciendo nfasis en la operacin misma.

Como ha podido verse las definiciones expuestas hacen nfasis en uno u otro aspecto de la medi-cin sin lograr una descripcin completa de lo que implica medir, que englobe sin perder precisin, los diferentes aspectos o elementos que le son propios. Una definicin que cumpla con estos re-quisitos deber tener en cuenta que la medicin incluye la definicin precisa (previa) del atributo que ser medido, el establecimiento de la unidad de medicin que se utilizar, la operacin concre-ta de comparacin del primero con la segunda y la asignacin de valores cuantitativos segn el resultado de dicha comparacin y obedeciendo algunas reglas, generalmente convencionales.

Teniendo en cuenta estas consideraciones y en pocas palabras, la medicin puede verse como observacin cuantitativa de manera que ... siempre que se atribuyen nmero a ciertos rasgos sobre la base de la observacin se estn practicando mediciones. (Bunge, 1983). Desde una perspectiva bien amplia, puede entenderse la medicin como el procedimiento necesario para la adquisicin de informacin sobre un atributo de un objeto, sujeto o evento en un momento determi-nado; tal adquisicin de informacin obedece a un objetivo especfico e implica la estimacin, con ayuda de un instrumento de medicin, de la magnitud de dicho atributo en trminos de la unidad de medida; el resultado de dicho procedimiento es expresado mediante nmeros (Jones, 1971). Dicho procedimiento puede sintetizarse como aparece en la figura 1.

Concepto

Hace referencia a la especificacin de lo que pretende medirse. Responder esta pregunta en psico-loga implica bsicamente dos aspectos: a) recurrir a constructos tericos y asumir una posicin

11

frente a los mismos, la cual fundamente y d cuerpo al procedimiento subsiguiente y b) identificar el tipo de concepto de que se trata. Puede distinguirse cuatro (4) clases de conceptos:

Los conceptos individuales, claramente no cuantitativos, tienen como referente individuos y en consecuencia el uso de nmeros, no pasar de ser puramente nominal.

Los conceptos de clase tienen como referente grupos de individuos que comparten alguna propie-dad de manera que adems de asignacin numrica puramente nominal el uso de nmeros puede tener uno de dos sentidos: a) presencia o ausencia de dicha propiedad para lo cual se emplean generalmente los nmero 0 y 1 o, b) cardinalidad o nmero de individuos que confor-man la clase, en este caso se tratar de nmeros enteros.

Los conceptos relacionales pueden ser comparativos o no comparativos. Los primeros sern aque-llos que permiten establecer jerarquas entre individuos de un conjunto de manera que el nme-ro puede denotar el puesto u orden de un individuo en dicha jerarqua. Los conceptos no com-parativos hacen referencia a relaciones del tipo ser alumno de o ser vecino de y en conse-cuencia el uso de nmeros no pasa de ser convencional para denotar si dicha relacin es o no vlida para cualquier par de individuos.

CONCEPTO

Qu se mide? (Constructo)

Revisin terica, adopcin de un posicin

Identificacin del tipo de concepto

ESCALA DE MEDIDA

Nominal

Ordinal

De intervalo (uniforme)

De razn (mtrica)

TIPO DE MEDIDA Directa o indirecta?

Manifestacin observable

UNIDAD DE MEDIDA

Dimensin?

Unidad fundamental o derivada?

Precisin, constancia y fcil reproduccin

INSTRUMENTO

Precisin, fidelidad

No reactivo

Relacin propiedad-observable

OPERACIONES

Aplicacin

Conteo

Cuantificacin

Transformaciones

RESULTADOS Error de medida

Figura 1: Representacin de los elementos de un procedimiento de medi-

cin

12

Finalmente, los conceptos cuantitativos tienen como referente magnitudes de una propiedad, las cuales pueden representarse por un nmero cuyo uso deja de ser puramente nominal o con-vencional. En algunos casos a la definicin de un concepto relacional subyace uno cuantitativo. La Tabla 1 muestra un ejemplo de ello.

Tabla 1

Ejemplo de tipos de conceptos

Tipo de concepto

Concepto

Operacin

Asignacin numrica

De clase Largo Definicin de una clase:

A: { x | x es largo}

Si x es largo 1 . Si x no es largo 0

o bien A contiene 30 individuos

Relacional (Comparativo)

Ms largo Definicin de una jerarqua:

x > y > z . . .

x es el ms largo puesto 1

y es el segundo ms largo puesto 2

z es el tercer ms largo puesto 3

Cuantitativo Longitud Estimacin de una magnitud:

x mide 20 cm.

y mide 10 cm.

Si x mide 20 cm. x = 20

Si y mide 10 cm. y = 10

adems x = 2y

Tipo de medida

Se pueden identificar tantos tipos de medida como clases de propiedades y tcnicas de medicin. Sin embargo, la primera dicotoma de inters en este momento es: mediciones directas e indirec-tas.

Las primeras suponen un contacto inmediato entre la propiedad medida y el instrumento o escala. Se realiza entonces, mediante la comparacin de la magnitud de inters con una escala mate-rial y el conteo de unidades de la escala.

La medicin indirecta supone medicin directa de algo que no es lo medido y algn tipo de clculo o cmputo. La medicin indirecta supone necesariamente la eleccin de lo observable (efecto o manifestacin medible directamente) y un trabajo arduo en la construccin de los instrumentos de medicin.

Escala de medida

Una escala de medida es una representacin de los grados de una propiedad mediante nmeros. Para todo par magnitud-instrumento se pueden distinguir dos tipos de escala: conceptual y mate-rial. La primera es el intervalo sobre el cual se representan los valores numricos de una magnitud y la material es el conjunto de seales en el instrumento cuya lectura permite atribuir valores num-ricos a la magnitud.

Bunge (1983) distingue magnitudes: a) incondicionalmente extensivas, b) condicionalmente exten-sivas, c) cuasiextensivas y d) intensivas; dependiendo de si existe o no para ellas una propiedad fsica de adicin respecto de la variable del objeto (Esto es, F x y F x F y( ) ( ) ( ) ). Las magnitu-

des intensivas no cumplen ste requisito, lo cual no significa que no puedan someterse a ningn clculo y que no entren en la composicin de las teoras cientficas cuantitativas.

Se identifican varias escala de medida dependiendo de las leyes que cumplan en cuanto a orde-namiento y espaciamiento de los grados (nmeros):

13

La escala nominal no cumple ninguna de stas propiedades y la asignacin numrica, completa-mente arbitraria, puede ser reemplazada por cualquier otro tipo de rtulo.

La escala ordinal permite establecer un ordenamiento que represente la magnitud de la propiedad y no cumple ley alguna respecto del espaciamiento entre intervalos de la escala.

La escala de intervalo (uniforme) tiene distanciamientos iguales y permite percibir diferencias igua-les de magnitud a partir de un punto cero que es completamente convencional o arbitrario.

Finalmente la escala de razn (mtrica) adems de cumplir las leyes anteriores sobre ordenamien-to y distanciamiento, parte de un cero absoluto el cual depende de condiciones o leyes que per-tenecen a alguna teora y generalmente coincide con la desaparicin de la propiedad.

Unidad de medida

Una unidad es un intervalo dentro de la escala de medida. La adopcin de una escala implica la eleccin del concepto de unidad para la escala conceptual y de un objeto fsico patrn para la es-cala material. La eleccin de una unidad de medida supone dos pasos previos: a) identificar la dimensin de la magnitud y b) responder si se trata de una magnitud fundamental o derivada. Con-vencionalmente las magnitudes de la misma dimensin se miden con la misma unidad. Una magni-tud es fundamental cuando es irreductible a otras ms bsicas y no requiere el anlisis de dimen-sin ya que la eleccin de las unidades es convencional. Una magnitud es derivada cuando se compone de varias magnitudes fundamentales relacionadas de alguna forma, se expresan median-te frmulas que son la base para el anlisis dimensional. El anlisis dimensional es un anlisis de frmulas que pertenecen a una teora o la presuponen.

Una vez realizado el anlisis anterior, la eleccin de la unidad material o patrn es convencional pero debe cumplir con los requisitos de precisin, constancia y de fcil reproduccin para que hagan posibles comparaciones objetivas. Teniendo la unidad conceptual y su materializacin se pueden derivar mltiplos y submltiplos de las mismas y se tendr un sistema de unidades que permite, entre otras cosas, las conversiones de una escala a otra. Sin embargo, es importante re-cordar que esto no puede ocurrir en el vaco terico. De hecho se sustenta en una teora.

Instrumentos

Un instrumento de medida es la tcnica o conjunto de tcnicas que permiten la asignacin numri-ca a las magnitudes de la propiedad o atributo ya sea por comparacin con las unidades de medida o para provocar y cuantificar las manifestaciones del atributo cuando ste es medible slo de ma-nera indirecta. Un instrumento debe satisfacer tres exigencias bsicas:

1. Detectar la seal sin interferencia y, en especial, sin intervencin del operador. La operacin de medida es la interaccin objeto de medida-instrumento, por tanto el inters no es ya el ob-jeto de medida sino el complejo objeto-instrumento.

2. No provocar reaccin en el objeto de medida o, de ser as, tal reaccin debe ser calculable.

3. Basarse en supuestos determinados sobre la relacin entre la propiedad y el efecto observa-do.

El cumplimiento de estos requisitos exige apoyo terico sobre la propiedad que se mide.

Operaciones

Llamaremos aqu operaciones a las acciones necesarias para relacionar magnitud e instrumento de manera que el segundo recoja las seales del primero, y para obtener un resultado interpreta-ble. Se incluyen entonces, operar el instrumento (aplicar la prueba), leer la seal del mismo (obte-

14

ner puntajes brutos o conteo de respuestas) y, en algunos casos hacer transformaciones numri-cas.

La operacin bsica de la medicin es el conteo (de objetos perceptibles, de unidades de la escala en la magnitud de la propiedad, etc.). El conteo es directo cuando se trata de objetos perceptibles (nmeros fcilmente accesibles) e indirecto cuando se debe recurrir a una muestra o cuando se trata de asignaciones tericas (parmetros). Los nmeros directamente accesibles : a) pertenecen a rasgos bsicos de la realidad y b) cambian dentro de ciertos rangos sin que la realidad se trans-forme cualitativamente.

Resultados

La medicin arroja nmeros o conjunto de nmeros que deben ser procesados con el fin de darles una interpretacin. Tericamente puede establecerse una diferencia entre el valor real (verdadero) de la magnitud de la propiedad y el valor observado mediante la medicin. Tal diferencia sera el error de medida tan desconocido como el valor real (En la prxima unidad se trabajar este con-cepto). A partir de los datos puede hacerse una estimacin del error lo cual permitir a su vez, es-timar el valor real. Se asume que la media de los valores observados es la mejor estimacin del valor real, luego la obtencin de un resultado implica algunas operaciones:

Tipificacin: identificacin y descripcin detallada de las condiciones de la medicin

Presentacin o resumen de los datos que permitan llegar a alguna generalizacin sobre su com-portamiento (forma de su distribucin, funcin de distribucin).

Estimacin del error de medida y del valor real.

As, el resultado de la medicin es, ms que un conjunto de datos brutos o la determinacin de un punto o valor exacto, la construccin de un intervalo que, con alguna probabilidad contenga el valor

real. Esto es, P x ke X x ke pi i v i i , donde xi es un valor observado en el i-simo sujeto, Xv es el valor real de magnitud de atributo para el i-simo sujeto, ei es el error de medida para esa observacin particular y k depende de la distribucin de probabilidad y del nivel de preci-sin que se desee para el intervalo.

Finalmente, cualquier resultado de una medicin debe interpretarse a la luz de la misma teora y a su vez aportar nuevos elementos que la confirmen o generen nuevas preguntas de investigacin.

SUPUESTOS BSICOS

De acuerdo con lo anteriormente expuesto, todo proceso de medicin parte de algunos supuestos que pueden resumirse como sigue:

1. Se miden propiedades de los objetos o sujetos y no al objeto como tal. En otras palabras, el objeto de medida ser una propiedad de un objeto.

2. Las propiedades de los objetos o sistemas existen y existen el alguna medida, independien-temente de la medicin.

3. El resultado de la medicin es slo un valor observado de la magnitud de la propiedad pero no es su valor real, en consecuencia, se mide con error pero tal error no debe ocultar el valor re-al.

USOS DE LA MEDICIN EN PSICOLOGA

Identificar los usos de la medicin en psicologa implica contestar a la pregunta para qu se mi-de?. Algunos autores presentan esta respuesta revisando la utilidad de la medicin en las diferen-

15

Parmetro de calificacin segn un nivel de desempeo previa-mente establecido

Patrn de calificacin relati-vo al desempeo de un

grupo de referencia

REFERENCIA A CRITERIO

REFERENCIA A NORMA

Vs

tes reas de aplicacin de la psicologa (educativa, social, laboral, etc.) y aadiendo a su categori-zacin una clase denominada psicologa experimental o bsica. Sin entrar a discutir los problemas que estas categorizaciones presentan sobre todo cuando se trata de definir fronteras entre unas y otras clases; aqu se distinguen tres categoras: descripcin, modelamiento e intervencin.

En el primer grupo se encuentran los procedimientos cuyo objetivo ltimo es hallar algunos valores de la magnitud de algunas propiedades psicolgicas para una muestra o poblacin.

El modelamiento implica la construccin o identificacin de un modelo terico que relacione algu-nas variables con la propiedad objeto de la medida. Tal modelo puede permitir a) prediccin o pronstico de un comportamiento futuro o en otras condiciones (seleccin de personal o educa-tiva) o b) explicacin de un comportamiento actual a partir de variables pasadas o presentes (clnica, laboratorio).

La intervencin hace referencia a la manipulacin de algunas variables para producir cambios en un comportamiento (intervencin clnica, investigacin bsica).

Las anteriores categoras no son mutuamente excluyentes ni implican un orden determinado; con mucha frecuencia se combinan dentro de un mismo estudio alternndolas segn el objetivo busca-do (En aplicaciones clnicas con frecuencia se empieza y termina con una descripcin)

ALGUNAS CLASIFICACIONES

La literatura especializada reporta tantas clasificaciones de medicin en psicologa, como criterios de los autores. Todas ellas resultan igualmente convencionales y su utilidad se limita con frecuen-cia, a fines puramente didcticos. La Figura 2 muestra las clasificaciones ms comunes.

Vs

Muestreo de un universo hipottico de posibles respuestas que seran manifestacin de la propiedad de inters

MUESTRA REPRESENTATIVA }

Anlisis detallado de (todas, en lo posible) las situacio-nes o respuestas que son manifestacin de la propiedad

INVENTARIO DE COMPORTAMIENTO }

Vs Vs

Conjunto de conductas relacio-nadas que aparecen y desapa-recen juntas de manera consis-tente en diferentes situaciones

R A S G O

Comportamientos o res-puestas que se presentan en determinada situacin pero no en condiciones diferentes

E S T A D O

Cambios comportamentales dependiendo de las condi-ciones o despus de algn tratamiento o modificacin de alguna variable relevan-te. Estudio longitudinal

P R O C E S O

16

REPASO DE TEORIA ESTADSTICA

Antes de introducir en temas como teora clsica del error de medida, algunos procedimientos para estimacin de la confiabilidad y validez de instrumentos de medicin en psicologa, formas de es-tandarizacin de pruebas psicolgicas y anlisis de pruebas; es necesario repasar algunos elemen-tos bsicos de estadstica. No se presentan explicaciones detalladas de cada tema que se supone conocido por el estudiante, ms bien se tratar de explicitar los elementos necesarios para la com-prensin de los temas subsiguientes, de uniformizar un lenguaje y de presentar una notacin.

Funciones de probabilidad

Si X es una variable aleatoria con valores xi donde i va de 1 a n, (n un nmero finito), la funcin

de probabilidad es la regla o frmula que asocia a cada valor xi , su probabilidad. As, la funcin de

probabilidad g(xi) se define como

g(xi) = P[X=xi] (1a)

y la funcin de probabilidad acumulada G(xj) es la regla o frmula que asigna a cada valor xj la

probabilidad de que X asuma un valor igual o inferior a xj. La funcin de probabilidad acumulada se define entonces, como:

G x P X x g x P X xj j ii j

i

i j

( ) [ ] ( ) [ ]

(1b)

Si g(xi) es una funcin de probabilidad, siempre se cumple que:

(i) 0 g ( xi ) 1. Esto es, P[ X = xi ] estar entre 0 y1 para todos los valores xi .

Vs

Capacidad o desempeo tope mximo del sujeto. Medidas de inteligencia,

aptitudes, habilidades, etc.

EJECUCION MAXIMA

Comportamiento habitual o tpico del

sujeto. Medidas de personalidad, intereses, actitudes,...

EJECUCION TIPICA

Vs

Tareas o conjunto de instrucciones cuya respues-ta es de ejecucin. Habilidades motoras.

EJECUCION {

Presentacin de preguntas o tareas escritas y respues-tas tambin escritas. Cerradas o ensayos.

LAPIZ Y PAPEL {

Figura 2: Representacin de algunas clasificaciones de la medicin en psicologa

17

(ii) g x P X xii

n

ii

n

( ) [ ]

1 1

1. Esto es, la suma de las probabilidades para todos los valo-

res xi siempre es igual a 1. En otras palabras, la probabilidad del evento que contiene todos

los valores posibles de X es 1.

De otra parte, si X es una variable aleatoria continua, con valores xi donde i va de 1 a , la pro-babilidad de que X tome un valor particular xi, ( P[ X = xi ]) tiende a 0. Se define entonces, la

funcin que asocia a cada par de valores xi , xj , la probabilidad de que la variable asuma valores

entre xi y xj. Esta es la funcin de densidad g(xi , xj) definida como

g(xi , xj ) = P[xi X xj] (1c)

y la funcin de densidad acumulada, G(xj), es la que asocia a cada valor xj la probabilidad de que

X tome valores iguales o inferiores a xj. La funcin de densidad acumulada se define entonces, como:

G( xj ) = P[X xj] (1d)

Si g(xi , xj ) es una funcin de densidad, entonces se cumple que:

(i) 0 g ( xi , xj ) 0

(ii) g( xi , xj ) = P xi X xj = rea bajo la curva entre xi y xj

(iii) g(- , ) = P[- X ] = 1 . Es decir, el rea total bajo la curva que forma la funcin

de densidad es 1

Valor esperado

El valor esperado denota el valor promedio, conocido como media aritmtica. As, Si X es una va-

riable aleatoria con valores xi , donde i puede variar de 1 hasta n, y con funcin de probabilidad

g(xi)=PX=xi, entonces el valor esperado de X se define como:

E X x g x x P X xi ii

n

i i xi

n

( ) ( ) [ ]

1 1

(2a)

Si se trata de eventos igualmente probables esto es, todos los xi tiene la misma probabilidad 1/n, el valor esperado de X puede expresarse como:

E X x nx

ni

i

ni

xi

n

( ) ( / ) 1

1 1

, (2b)

expresin generalmente conocida como frmula para la media de datos no agrupados.

Ahora, si cada xi es el valor medio (punto medio) de un grupo de fi valores igualmente probables (intervalo de clase) de manera que la probabilidad de cada xi es fi /n, entonces el valor esperado de X puede expresarse como:

18

E X x f nf x

ni i

i

ni i

xi

n

( ) ( / )

1 1

(2c)

expresin generalmente conocida como frmula para la media de datos agrupados

Las principales propiedades del valor esperado o media son: Si X es una variable aleatoria y a, b, y c son constantes reales, entonces se cumple que:

(i) E(a) = a, es decir, el valor esperado de una constante es la misma constante

(ii) E(X + a) = E(X) + a = x + a

(iii) E(bX) = bE(X) = bx

(iv) E(a+bX) = a+bE(X) = a + bx

(v) E(a+bX+cX2 ) = a + bE(X) + cE(x2 )

(vi) E(X-x) = E(X) - x = x -x =0

Varianza y desviacin tpica

La varianza es la medida que dispersin que denota el promedio (valor esperado) de distancias

cuadrticas respecto a la media. En consecuencia, si X es una variable aleatoria, la varianza de X se define como:

Var X E X x x( ) ( ) 2 2

, (3a)

De acuerdo con la definicin de valor esperado, si cada valor (xi - x)2 tiene la misma probabilidad

1/n, entonces la varianza puede expresarse como:

Var X x n

x

ni

i

n

x

i xi

n

x( ) ( ) /

( )

1

2

2

1 21

, (3b)

expresin generalmente conocida como frmula para la varianza de datos no agrupados.

Ahora, si cada xi es el valor medio de un grupo de fi valores igualmente probables de manera que

la probabilidad de cada valor (xi - x)2 es fi /n, entonces la varianza de X puede expresarse co-

mo:

Var X x f n

f x

ni

i

n

x i

i i xi

n

x( ) ( ) /

( )

1

2

2

1 2

, (3c)

expresin generalmente conocida como frmula para la varianza de datos agrupados.

19

Otra expresin comnmente usada debido a que facilita el clculo de la varianza es

2

2

1 2 x

n

ii

n

(3d)

y se obtiene del desarrollo algebraico y la aplicacin de algunas propiedades del valor esperado a partir de la definicin de varianza (expresin 2a), as:

Las propiedades de la varianza pueden resumirse como sigue: Si X es una variable aleatoria y b y c son constantes reales, entonces se cumple que:

(i) Var(b) = 0

(ii) Var(X) 0

(iii) Var(X +b) = Var(X) =2

(iv) Var(bX ) = b2Var(X) = b22

(v) Var(b + cX) = c2 Var(X) = c22

Sin embargo, dado que la varianza son distancias cuadrticas se tendrn siempre unidades al cua-drado, lo cual puede dificultar la interpretacin. Una medida de dispersin ms comnmente usada es la desviacin estndar o desviacin tpica, definida como la raz cuadrada positiva de la varian-za, as:

Ds X Var X x( ) ( ) , (4a)

de manera que la frmula para la desviacin tpica de datos no agrupados es:

Ds Xx

n

i x

i

n

x( )( )

2

1

, (4b)

y para datos agrupados:

Ds Xf x

n

i i x

i

n

x( )( )

2

1

(4c)

Var X( )

E X X

E X E X E

E X

E X

x

n

x x

x x

x x

x

i

i

n

x

( )

( ) ( ) ( )

( )

( )

2 2

2 2

2 2 2

2 2

2

1

2

2

2

2

20

Covarianza y correlacin

La covarianza es una medida de asociacin (covariancin, variacin conjunta) lineal entre dos va-riables y se define como el valor esperado del producto cruzado de las distancias de cada variable

con respecto a su media. As, si X y Y son variables aleatorias con medias x y y respectivamen-te, entonces la covarianza entre X y Y se define como:

Cov X Y E X Yx y( , ) ( )( ) , (5a)

si cada producto cruzado ( )( )x yi x i y tiene probabilidad 1/n, desarrollando expresin 4a

se obtiene la comnmente llamada frmula para la covarianza:

Cov X Y

x y

n

i xi

n

i y

( , )

( )( )

1 (5b)

Puede mostrarse, adems que si X y Y son variables aleatorias y se define una tercera variable W tal que W=X+Y, entonces:

Var W Var X Var Y Cov X Y( ) ( ) ( ) ( , ) 2 (5c)

Sin embargo la covarianza puede tomar valores muy grandes o pequeos dependiendo de las unidades de las variables, lo cual dificulta la interpretacin de los resultado observados. Una medi-da de asociacin que no presenta dicha dificultad es el ndice de correlacin definido como la cova-rianza estandarizada, esto es, dividida por el producto de las desviaciones tpicas de las variables.

As, si X y Y son variables aleatorias con medias x y y y con desviaciones tpicas x y y res-pectivamente, entonces la correlacin entre X y Y se define como:

Corr X YCov X Y

x y

( , )( , )

, (6a)

y utilizando la expresin 3b se obtiene la expresin comnmente conocida como coeficiente de correlacin producto-momento de Pearson:

Corr X Y

x y

n

i xi

n

i y

x y

xy( , )

( )( )

1 (6b)

Este coeficiente de correlacin tiene algunas caractersticas de inters:

(i) es una medida de asociacin lineal entre variables, de manera que no resulta adecuado cuando

se trata de estimar asociaciones no lineales.

(ii) -1 x y 1, para cualquier par de variables X y Y, asumiendo los valores -1 y 1 cuando las

variables estn lineal y perfectamente correlacionadas en sentido inverso o directo, respectiva-

mente.

Si adems X y Y son linealmente independientes se cumple que:

21

(iii) Cov (X ,Y)=0, por tanto

(iv) Corr (X ,Y) =0 y puede demostrarse que

(v) Var (X +Y)=Var(X-Y)=Var(X)+Var(Y)

Distribucin binomial

Se denomina ensayo de Bernoulli a cada repeticin de un experimento, en el cual:

(i) Slo se tienen dos resultados posibles denominados convencionalmente xito (E) y fracaso

(F).

(ii) La probabilidad de xito, PE = p permanece constante y q =PF =1-p

(iii) Los ensayos son independientes esto es, el resultado de un ensayo no afecta el resultado de

otro, o en trminos de probabilidad condicional, la probabilidad de xito en un ensayo i dado

que se obtuvo xito en el ensayo j, es igual a la probabilidad de xito p, para cualquier par

de ensayos i y j. Esto es PEi |Ej = PE = p

Si se define una variable aleatoria X , como el nmero de xitos obtenidos en n ensayos de Ber-noulli, entonces:

(i) X tiene distribucin binomial con parmetros n, nmero de ensayos y p, probabilidad de

xito en cada ensayo. Ntese X b(n,p)

(ii) La funcin de probabilidad g(xi) es

g(xi) = P[X = x ] = p qi xn xi n - xii (7a)

donde xni es la combinatoria de xi en n. Esto es, el nmero de muestras de tamao xi que se pueden formar teniendo n elementos en total.

(iii) La funcin de probabilidad acumulada G(xj) es

G(xj) =P X xj = P X x p qii

j

xn x n x

i

j

i

i i

1 1

(7b)

(iv) Si se tiene un slo ensayo de Bernoulli (n=1),E(X) = 0q+1p = p. (7c)

De manera que en n ensayos (n>1):

E(X) = nE(X) = np. (7d)

22

(v) En un slo ensayo de Bernoulli (n=1),

Var(X) = E(X) -(E(X))2 = p - p2 = p(1-p) = pq. (7e)

De manera que en n ensayos (n>1) independientes

Var(X) = p qi ii

n

1

(7f)

pero pi es constante a travs de los n ensayos, de manera que

Var(X) =npq (7g)

y en consecuencia Ds(X)= npq

Distribucin normal y normal estandarizada ( Z )

Supngase una variable aleatoria continua X con funcin de densidad g(xi , xj) y con media y varianza 2 . Si X tiene distribucin normal (Ntese XN( , 2)), entonces:

(i) =e=o donde e es la mediana o percentil 50 y o es la moda. En consecuencia,

(ii) A =0 donde A es la medida de asimetra.

(iii) P - X + = .683

(iv) P -1.96 X +1.96 = .95 (8a)

(v) P -2 X +2 = .954

(vi) P -3 X +3 = .997

Ahora si X es una variable aleatoria distribuida normalmente con media y varianza 2, esto es

XN(, 2) y se define una nueva variable Z tal que ZX

, entonces:

(i) E(Z) =0 y Var(Z)=1; en consecuencia

(ii) X

N(0,1) conocida como distribucin normal estandarizada o distribucin Z. As,

X

Z de manera que

(iii) P x X x Px

Zx

i ji j

(8b)

23

Aproximacin de la distribucin binomial a la normal

Si X b (n, p) con p .5 y con n grande (n), puede demostrarse que X tiene distribucin aproximadamente normal con media E(X)=np y con varianza Var(X)=npq. Expresado de otra

forma Xaprox. N (np , npq). De manera que:

(i) x np

npq

aprox N( 0 , 1) y en consecuencia,

(ii) Pxi X xj P x np

npq

i Z x np

npq

j (8c)

Teorema del lmite central

Si X1 ,X2 , ... Xn son variables aleatorias independientes distribuidas con media y varianza 2 y

se toman muestran de tamao n , entonces

(i) E( X ) = 1/n E(X1 + X2 + ...+ Xn )

= 1/n E(X1 ) + E( X2 ) + ...+E( Xn )

= 1/n ( + + ...+ )

= n / n

E( X )= (9a)

(ii) Var( X ) = 1/n2 Var(X1 + X2 + ...+ Xn )

= 1/n2 Var(X1 ) +Var( X2 ) + ...+Var( Xn )

= 1/n2 (2 + 2 + ...+ 2 )

= n2 /n2

Var( X ) =2 /n (9b)

y en consecuencia,

(iii) Sd( X ) = n

(9c)

conocida como error estndar de la media.

Si, adems X tiene distribucin normal con media y varianza 2 y se toman muestras in-

dependientes de tamao n, entonces

X N( ,2 /n). (10a)

Y ms an si X tiene cualquier distribucin y n es grande, entonces

24

(iv) X aprox. N( ,2 /n). y, en consecuencia

(v) ZX

n

/ aprox. N(0,1) (10b)

de manera que

(vi) P xi X xj P xn

i

/ Z

x

n

j

/ (10c)

As, si X aprox b (np , npq) y se toman muestras independientes de tamao n con n grande,

(i) La proporcin muestral de xitos en los n ensayos, p aprox N(p , pq/n), en consecuen-

cia,

(ii) Z = p p

pqn

aprox. N (0,1) (10c)

y por tanto

(iii) P pi p pj P[p

Z p

] ij

p

pqn

p

pqn

(10d)

herrera, a. (1998). notas de psicometria 1-2 - historia de psicometria y teoria de la medida

Documents