educ 6390 conf 2

Upload: julio-e-rodriguez

Post on 07-Apr-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/3/2019 EDUC 6390 Conf 2

    1/7

    EDUC 6390: Estadstica aplicada en la educacinProf. Julio E. Rodrguez TorresConferencia 2Variables y datosBosquejo

    I. Variables .......................................................................................................................1Definicin ................................................................................................................1

    II. Datos ............................................................................................................................2A. Definicin de datos ..................................................................................................2B. Mtodos para obtener los datos en una investigacin .............................................2

    1. Datos publicados ................................................................................................22. Datos obtenidos en la experimentacin ..............................................................23. Datos obtenidos a travs de cuestionarios .........................................................24. Datos obtenidos de la observacin .....................................................................3

    III. Clasificacin de datos y variables ...............................................................................3A. Datos o variables categricas / cualitativas .............................................................3B. Datos o variables numricas / cuantitativas ............................................................3

    Discretas .................................................................................................................4Continuas ...............................................................................................................4

    IV. Escalas de medicin ...................................................................................................4A. Escala nominal........................................................................................................5B. Escala ordinal.........................................................................................................5C. Escala intervalar .....................................................................................................6D. Escala de razn ......................................................................................................6

    V. Codificacin y entrada de datos a la computadora ......................................................6

    I. Variables

    En un proceso de observacin o en un cuestionario se observan o se hacen preguntas sobreciertas caractersticas de los sujetos o sobre ciertos fenmenos. Estas caractersticas que setratan de medir en la investigacin se llaman variables. Cuando en una investigacin cuantitativa

    se pasa de la pregunta o preguntas de investigacin a las hiptesis es necesario expresar lashiptesis en trminos de variables. Una hiptesis de investigacin, por lo general, se expresacomo una relacin entre dos variables, la variable independiente y la variable dependiente. stasse pueden visualizar a veces como la causa y el efecto en la relacin. (Aunque pocas veces lasrelaciones que se establecen en las investigaciones educacionales corresponden a causas yefectos).

    Definicin

    Una variable es una caracterstica de los sujetos que puede asumir ms de un valor. Los valoresque asumen las variables en cada uno de los sujetos son los datos.Ejemplo:En un estudio en que se trata de determinar el aprovechamiento de los estudiantes en una

    escuela, una de las variables puede ser la nota obtenida en el curso de estadsticas. Los datosson, en este caso, las notas obtenidas en estadsticas por cada uno de los estudiantes que hantomado el curso.

    II. Datos

    A. Definicin de datos

    Los datos pueden definirse como la informacin recogida, organizada y analizada por losestadsticos.

    1

    http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499194%23_Toc5499194http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499194%23_Toc5499194http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499195%23_Toc5499195http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499195%23_Toc5499195http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499196%23_Toc5499196http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499196%23_Toc5499196http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499197%23_Toc5499197http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499197%23_Toc5499197http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499198%23_Toc5499198http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499198%23_Toc5499198http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499199%23_Toc5499199http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499199%23_Toc5499199http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499200%23_Toc5499200http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499200%23_Toc5499200http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499201%23_Toc5499201http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499201%23_Toc5499201http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499202%23_Toc5499202http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499202%23_Toc5499202http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499203%23_Toc5499203http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499203%23_Toc5499203http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499204%23_Toc5499204http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499204%23_Toc5499204http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499205%23_Toc5499205http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499205%23_Toc5499205http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499206%23_Toc5499206http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499206%23_Toc5499206http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499207%23_Toc5499207http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499207%23_Toc5499207http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499208%23_Toc5499208http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499208%23_Toc5499208http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499209%23_Toc5499209http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499209%23_Toc5499209http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499209%23_Toc5499209http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499210%23_Toc5499210http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499210%23_Toc5499210http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499210%23_Toc5499210http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499211%23_Toc5499211http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499211%23_Toc5499211http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499212%23_Toc5499212http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499212%23_Toc5499212http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499213%23_Toc5499213http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499213%23_Toc5499213http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499194%23_Toc5499194http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499195%23_Toc5499195http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499196%23_Toc5499196http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499197%23_Toc5499197http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499198%23_Toc5499198http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499199%23_Toc5499199http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499200%23_Toc5499200http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499201%23_Toc5499201http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499202%23_Toc5499202http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499203%23_Toc5499203http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499204%23_Toc5499204http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499205%23_Toc5499205http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499206%23_Toc5499206http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499207%23_Toc5499207http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499208%23_Toc5499208http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499209%23_Toc5499209http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499210%23_Toc5499210http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499211%23_Toc5499211http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499212%23_Toc5499212http://rrpac.upr.clu.edu:9090/~amenend/conf26390.htm#_Toc5499213%23_Toc5499213
  • 8/3/2019 EDUC 6390 Conf 2

    2/7

    B. Mtodos para obtener los datos en una investigacin

    1. Datos publicados

    Se pueden utilizar datos publicados previamente que el investigador no tiene que recoger.Estamos en la poca de la tecnologa y la informacin. Las bibliotecas estn equipadas concomputadoras y a travs de stas se pueden localizar bancos de datos que otras personas oinstituciones han recogido y almacenado. Estas fuentes de datos para las investigacionespueden ser:

    Fuentes primarias. Estas son las personas u organizaciones que recogen los datos directamente.Fuentes secundarias. Son las personas u organizaciones que han compilado los datos en tablasy grficas. Por lo general, tanto el gobierno como las universidades son fuentes primarias ysecundarias.

    2. Datos obtenidos en la experimentacin

    En la investigacin a menudo se utilizan datos obtenidos a travs de la experimentacin.Esto ocurre principalmente en las investigaciones de medicina y de ciencias naturales. Lainvestigacin consiste en el montaje de un experimento en que se controlan todas las variablesque pueden influir en los resultados y entonces se maneja la variable independiente y seobservan los cambios en la variable dependiente. Cuando esto ocurre se puede hablar de unarelacin de "causa y efecto". La investigacin es un verdadero experimento.En las ciencias sociales es ms difcil puesto que se dificulta imponer controles sobre el mediosocial.En el momento de la recoleccin de datos debe haber control sobre todas las variables quepueden afectar variaciones en el experimento.Para hablar de un "experimento" y de una relacin de causa y efecto es necesario que se dentres condiciones:a. la variable dependiente es el objetivo de la investigacin. Se trata de determinar cmo semodifica esta variable dependiente cuando se ha modificado la variable independiente.b. la modificacin en la variable independiente ocurre antes que la modificacin en la variabledependientec. la variable independiente ejerce una influencia directa o indirecta en la variable dependiente.

    3. Datos obtenidos a travs de cuestionarios

    La forma ms comn de llevar a cabo una investigacin en las ciencias sociales es utilizandodatos obtenidos a travs de cuestionarios.En estos casos no se ejerce control sobre el comportamiento de las personas. Slo se hacenpreguntas y se observan las dos variables (independiente y dependiente) al mismo tiempo.En los cuestionarios no se busca una relacin de causa y efecto, sino de correlacin entre dosvariables. Se busca determinar si la magnitud una variable se relaciona con la magnitud de laotra. Por lo general no se habla de variables independientes y dependientes, sino de predictoresy criterios. El cambio en el predictor no es la causa del cambio en el criterio aunque un cambioimplique el otro.Ejemplos:Causa y efecto: vacuna y prevencin de la enfermedad. La vacuna es la causa de que laenfermedad no tenga lugar.Correlacin: Se observa en la relacin entre preparacin acadmica y salario. Por lo general,mientras mayor es la preparacin acadmica mayor es el salario. Pero esto no siempre ocurre yla causa del mayor salario puede muy bien ser otra diferente de la preparacin acadmica.Una correlacin que hace obvia esta situacin es la alta relacin que hay entre tamao de pie ydestrezas de lectura. Nadie en su sano juicio puede asegurar que el tamao del pie es la causade las destrezas, sin embargo mientras mayor es el tamao de pie, mayor es la habilidad en lalectura. Hay una variable escondida que es la causa de ambas (el crecimiento).

    2

  • 8/3/2019 EDUC 6390 Conf 2

    3/7

    4. Datos obtenidos de la observacin

    Se utilizan mucho en antropologa y en investigaciones sobre animales.Este mtodo de recoger datos tiene problemas debido a la subjetividad del observador y alhecho de que la presencia del observador puede modificar la situacin.

    III. Clasificacin de datos y variables

    Datos o variables Preguntas Respuestas

    Categricas o cualitativas Tienes pasaporte si / no (dictoma)

    Numricas o cuantitativas discretas Cuntas camisas tienes? Nmero natural

    continuas Cunto pesas? Nmero real

    Esta clasificacin se puede aplicar tanto a las variables como a los datos.

    A. Datos o variables categricas / cualitativas

    Son caractersticas que se refieren a categoras como sexo, afiliacin poltica, color de los ojos.Por lo general, estas caractersticas no se pueden describir por medio de nmeros.En los cuestionarios, por lo general, las preguntas sobre estas variables se pueden respondercon "si" o "no".Ejemplos:Posees un carro? Vives en una casa? Tienes los ojos azules?

    B. Datos o variables numricas / cuantitativas

    Las preguntas que se hacen sobre estas variables se pueden responder con un nmero.

    Cunto pesas? Cunto mides? Cunto dinero ganas? Cuntos hijos tienes?Las variables numricas pueden ser :

    Discretas

    Una variable es discreta si sus valores se pueden contar; si existe una relacin biunvoca con elconjunto de los nmeros naturales. Existe una unidad mnima que no puede subdividirse.Ejemplo: cantidad de carros, de hijos, ingreso anual, etc. No se puede tener medio hijo o uncuarto de carro.

    Continuas

    Los valores de estas variables no se pueden contar puesto que siempre existe un nmero entredos de ellos. Generalmente se encuentran en los procesos de medicin, como peso, altura,

    temperatura. Adems en la realidad no hay dos sujetos con la misma medida. No existe unaunidad indivisible para los datos continuos como ocurre con los datos discretos.Sin embargo, debido a que los instrumentos de medicin generalmente no son muy sofisticadosy precisos, en las investigaciones se encuentran sujetos con la misma medida (debido alredondeo)

    Por extensin las variables reciben el mismo nombre de los datos. Pueden ser categricas ynumricas. Si son numricas pueden clasificarse en discretas y continuas. Cuando una variablenumrica o categrica puede tener solamente dos valores se llama dictoma.

    3

  • 8/3/2019 EDUC 6390 Conf 2

    4/7

    IV. Escalas de medicin

    Variables categricas

    Variable categrica Categoras Escala

    partido poltico PPD; PNP; PIP nominalgnero mujer, hombre nominalcolores negro, rojo,..... nominal

    satisfaccin mucha, mediana, poca ordinalnota A, B, C, D, F ordinal

    Variables numricas

    Variable numrica Escalatemperatura intervalarIQ intervalarpeso raznaltura raznedad razn

    Uno de los puntos ms importantes de una investigacin es determinar el tipo de anlisisestadstico de los datos que se va a llevar a cabo. En estadsticas el tipo de anlisis depende delnivel o escala de medicin de las variables de la investigacin. Los cursos de estadsticas en lasciencias de la educacin y en las ciencias sociales estn diseados para que los estudiantesaprendan diversos mtodos de anlisis estadstico. Pero antes de aplicar cualquiera de ellos, elestudiante debe haber determinado el nivel de medicin de sus variables de investigacin. Cadanivel requiere un anlisis diferente. La importancia de esta clasificacin por niveles reside en elhecho de que mientras ms complejo o alto es el nivel de medicin, ms efectivos son losmtodos estadsticos que se pueden utilizar. Para hablar de niveles o escalas de medicin esimprescindible primeramente clarificar que es "medir" en las ciencias sociales. Medir no essolamente determinar las dimensiones de un objeto. En las ciencias sociales la idea de medicinse aplica en muchas otras ocasiones.

    Ejemplos:Se mide cuando determina:la religin de una personael color de peloel ingreso anualel gneroel pesoel tamaola puntuacin en un examenla nota

    El tipo de medida que se obtiene en la investigacin puede caer en una de las siguiente cuatroescalas o niveles de medicin: Si los datos son categricos o cualitativos, entonces dependiendodel grado de precisin posible en la medicin, se utilizan las siguientes dos escalas:

    A. Escala nominal

    La escala nominal se utiliza cuando los datos estn clasificados en categoras en las que no hayninguna idea de ordenamiento. No se puede decir que una categora es mejor que otra. Elpropsito en este nivel es solamente clasificar, nombrar los datos. Se refiere a atributos de lossujetos, no a cantidades. En ningn momento se habla de nmeros, aunque a la hora de entrar

    4

  • 8/3/2019 EDUC 6390 Conf 2

    5/7

    los datos a la computadora se puede asignar un nmero para hacer la entrada de datos mssimple. A veces se ve asignar el #1 al gnero femenino y el #2 al masculino. En College Boardse utilizan el #7 y el #8 para los dos gneros. Pero esta asignacin de valores es arbitraria.Ejemplos:colores, religiones, partidos polticos, etc.

    B. Escala ordinal

    Hay orden en este nivel de medicin. Se sugiere un rango en las categora de forma que unacategora es mejor, ms importante o mayor que otra. Sin embargo, no hay un sentido numricopara este orden. La diferencia entre dos rangos no es una cantidad exacta.Ejemplo:En una escala Likert los rangos pueden ser: Acuerdo total, acuerdo parcial, desacuerdo parcial ydesacuerdo total.En este caso es posible que la diferencia entre acuerdo total y acuerdo parcial se puedainterpretar de formas diferentes por personas diferentes. Se hace imposible medirnumricamente la diferencia entre acuerdo total y acuerdo parcial, aunque es obvio que uno esmayor o mejor que otro.NO existen "unidades de acuerdo" que permitan decir que entre acuerdo parcial y acuerdo totalhay " 5 unidades de acuerdo".

    En muchas ocasiones se usan nmeros para codificar estas respuestas como:acuerdo total (5),acuerdo parcial (4),indeciso(3),desacuerdo parcial (2),desacuerdo total (1).Estos nmeros slo representan orden. En ningn momento se implica que la diferencia entreacuerdo total y acuerdo parcial es de una unidad.

    C. Escala intervalar

    La escala intervalar se utiliza con datos numricos. Cada sujeto recibe un nmero.

    Ejemplos:Puntuaciones en la Prueba de Razonamiento Verbal del College Board; IQ; temperatura del aguaEstos datos se pueden sumar y restar. Es posible decir cunto mejor sali un estudiante en laprueba que otro, o cuanto supera un sujeto a otro en IQ. La diferencia entre dos medidas essignificativaEjemplo:79 grados es 2 ms que 77 grados de temperatura. La diferencia entre 79 y 77 grados es lamisma que entre 55 y 53 grados.Sin embargo no hay un cero verdadero. El cero en temperatura Fahrenheit es una temperaturaseleccionada al azar. El cero en centgrados corresponde a otra temperatura muy diferente. Elresultado es que, a pesar que 100 es el doble de 50, en una temperatura de 100 no hace eldoble de calor que en una de 50. No se siente el doble de calor.

    Ejemplo:Un nio con un IQ de 150 no tiene el doble de inteligencia de uno con un IQ de 75. Esta es unade las razones por las que cuando se mide un atributo psicolgico por medio de un instrumento,el cero no tiene sentido y en muchos de los instrumentos simplemente no existe.

    D. Escala de razn

    5

  • 8/3/2019 EDUC 6390 Conf 2

    6/7

    Tiene un cero real. Tanto a - b (a menos b) como a/b (a dividido entre b) tienen significado.Ejemplo:peso, altura.Tiene sentido hablar de que una persona pesa el doble de otra. O que alguien tiene el doble deaos que otro.

    Esta clasificacin de las escalas para medir las variables es sumamente importante, puesdependiendo de la escala se van a seleccionar lo mtodos estadsticos que se pueden emplear.

    Los mtodos ms precisos en trminos de prediccin son los mtodos paramtricos, que son losque se estudian en este curso. Para poder usarlos, las variables tienen que medirse en escalasintervalares o de razn. Cuando las escalas son nominales u ordinales, no queda ms remedioque utilizar mtodos estadsticos no paramtricos, que no son tan precisos en su medicin.Es siempre posible pasar de una escala a otra menos exigente.Ejemplo:Los estudiantes pueden medirse en pulgadas (razn) o simplemente se pueden ordenar demayor a menor (ordinal).

    V. Codificacin y entrada de datos a la computadora

    Para codificar datos se crea un libro de cdigo (codebook) donde:

    1. Se identifican las variables y se asignan las columnas requeridas para cada una de lasvariables2. Se asignan cdigos para cada valor de las variables no numricas.3. Se construye un archivo de datos (data file) en la computadora donde cada fila corresponde aun sujeto diferente.4. Esta entrada de datos se puede hacer directamente usando un procesador de palabrascualquiera, pero se dificulta el proceso.5. Generalmente se utiliza una hoja electrnica de datos (spreadsheet) de un programaestadstico como Excel o SPSS en los cuales se identifican mejor las columnas y es ms fcil laentrada de datos.Ejemplo de un libro de cdigo:

    6

  • 8/3/2019 EDUC 6390 Conf 2

    7/7

    Actividades y/o asignaciones:Tomadas de Pyrczak, F. (1996). Success at statistics. A worktext with humor. Los Angeles, CA: PyrczakPublishing.1.Actividad: Scales of Measurement. Section 2. Pyrzack, pp.5-82.Discusin del libro de cdigo y hojas de datos en Word y SPSS3.Hinkle pp.19-20 ej. 8

    Lecturas recomendadas:Hinkle, unidad 1, p.13-17.Hinkle, unidad 2, p.2

    7