taller spss

9
Taller SPSS El 90% de un exitoso análisis en SPSS es preparar bien la información y las variables, y por ello en ocasiones es necesario recodificar las variables 90%: Análisis descriptivos (Pese a que son infravalorados) Sintaxis: Superar el nivel de usuario de SPSS, garantiza trabajo. La estadística es una herramienta (ciencia auxiliar), no es verdad en sí misma. El error que cometemos es pensar que por numerizar algo es real, dos niveles de este error: Para usar estadística necesito observar la realidad de cierta manera, como unidades de medición equivalentes (En ciencias sociales se basa en contar a los individuos; La estadística no puede observar relaciones sociales, solo individuos). Individualismo metodológico como recurso, pese a que se debe tener en cuenta que la sociedad está en las relaciones sociales. Solo aspiramos a una aproximación a las relaciones sociales. Al tratarse de unidades de medición equivalentes solo pueden inferirse resultados para las unidades como grupo, y no como individuos. La estadística no tiene NADA que ver con los números, se expresa en los números. Son un conjunto de reglas que unos tipos se dieron cuenta de que existía cuando habían muchas cosas dando vuelta. Vista de datos Filas: Casos, cosas (que puedo contar) Columnas: Variables, características de los sujetos Vista de variables Fila: Variable Columna: Condiciones o características de la variable - La clave de la estadística es definir bien la variable de análisis, qué es lo que se va a medir de cada persona

Upload: cristian-sandoval-araya

Post on 22-Oct-2015

16 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Taller SPSS

Taller SPSS

El 90% de un exitoso análisis en SPSS es preparar bien la información y las variables, y por ello en ocasiones es necesario recodificar las variables

90%: Análisis descriptivos (Pese a que son infravalorados)

Sintaxis: Superar el nivel de usuario de SPSS, garantiza trabajo.

La estadística es una herramienta (ciencia auxiliar), no es verdad en sí misma. El error que cometemos es pensar que por numerizar algo es real, dos niveles de este error: Para usar estadística necesito observar la realidad de cierta manera, como unidades de medición equivalentes (En ciencias sociales se basa en contar a los individuos; La estadística no puede observar relaciones sociales, solo individuos).

Individualismo metodológico como recurso, pese a que se debe tener en cuenta que la sociedad está en las relaciones sociales. Solo aspiramos a una aproximación a las relaciones sociales.

Al tratarse de unidades de medición equivalentes solo pueden inferirse resultados para las unidades como grupo, y no como individuos.

La estadística no tiene NADA que ver con los números, se expresa en los números. Son un conjunto de reglas que unos tipos se dieron cuenta de que existía cuando habían muchas cosas dando vuelta.

Vista de datos

Filas: Casos, cosas (que puedo contar)

Columnas: Variables, características de los sujetos

Vista de variables

Fila: Variable

Columna: Condiciones o características de la variable

- La clave de la estadística es definir bien la variable de análisis, qué es lo que se va a medir de cada persona

Variables que se pueden cuantificar y variables que no: Por ejemplo el nombre de las personas (no se puede cuantificar), las escalares u ordinales son las que se pueden numerizar.

No obstante, en SPSS siempre a la variable le pongo un número (sea escalar o nominal).

- Etiquetas de valor: Para transformar los datos en números

Las variables tienen diversas características que se deben definir:

Page 2: Taller SPSS

1) Es cuantificable o no (nominal u ordinal/escalar): La frontera entre lo que se puede medir o no es teórica. Se debe ser consecuente con esta determinación, porque una variable nominal se mide distinto de una ordinal/escalar.

2) Tipo: Casi siempre se pone “numérico”, porque es más fácil de medir3) Etiqueta: Nombre completo4) Valores: Los números asignados a las categorías. Las variables “escala” no tienen

valores, porque el número en sí es el valor (categoría)5) Decimales: Si quiero usar decimales en las categorías6) Casos perdidos: Por defecto SPSS no da casos perdidos, deben definirse.7) Medida: Escalar, nominal (unidades cualitativamente distintas) u ordinal.

Archivo Nuevo Sintaxis

Sintaxis: Conjunto de instrucciones al programa. Permite guardar, replicar y personalizar un análisis, permitiendo ahorrar tiempo en los análisis.

Programar un conjunto de instrucciones al computador para que haga análisis estadísticos

- Un comando es una instrucción al SPSS. Siempre un comando termina en un punto.- Control + R o “play”: Para activar

Trampas:

- Lo clave en una investigación es que se haga una muy buena preparación de los datos: No solo significa ser ordenado en SPSS, también está la imaginación del analista.

- La teoría es lo que permite medir algo bien, no los números

Como trabajar en SPSS:

- Primero trabajas todas las tablas descriptivas y cruzas todas las variables- Luego ese descriptivo se lee, y en virtud de eso se hacen otras pruebas.- Al final en el informe va una tabla o dos tablas, nada más.

No se construyen interpretaciones a partir de una sola prueba.

No solo hay que producir análisis, también hay que producir variables.

Tarea: Revisar la CASEN

- Variables de identificación: Permiten identificar a los casos. Folio es la identificación del hogar. Hay que sacar la mayor cantidad de variables de identificación que se puedan.

- Variables de expansión: Toda encuesta probabilística es siempre un ejercicio lleno de errores (producir aleatoriedad no es fácil), para resolver esto y hacer equiparable a la población se hacen variables de expansión, que son números por los que multiplico la muestra para que dé la población total. Se inventa un número para multiplicar cada caso de la muestra.

Page 3: Taller SPSS

Ponderar es solo ajustar datos, Expansor es para expandir (aunque es al mismo tiempo ponderador).

- Variables del hogar: Tipo de vivienda, número de vivienda, etc. Identificación de la vivienda

- Variables sociodemográficas: Sexo, edad, estado civil, pareja, etc.- Variables de CASEN

CASEN se organiza en Módulos, parte con preguntas de educación (e), ocupación (o), ingresos (y), salud (s), trayectoria y movilidad (r), vivienda (v).

- Variables que a partir de las anteriores genera CASEN, como por ejemplo pobreza, nivel educacional, variable corte (pobreza, por la que todos se pelean), indicadores varios, etc.

Preparar una base de datos.-

- Hay que foliar siempre las encuestas (número único con la información de a quién se le aplicó y quién lo hizo).

- Los datos se pueden ingresar directamente o importarlos (copiando de Excel)- Variables nombre son de tipo cadena (variables con letra, además es nominal)- En sintaxis se puede atribuir el tipo de una variable, el nivel, etc. En estudios con

cientos de variables es complejo ir haciendo eso con el mouse, por lo que se usa sintaxis

- Primera línea antecedida de asterisco hace que no valga para el spss, son solo líneas comentadas, así puedes explicarte a ti mismo lo que estás haciendo

VARIABLE LEVEL: nivel de medición de las variables (nominal, ordinal

Variable labels: etiquetado de variables, se usa la apóstrofe para la etiqueta (‘’)

Value labels: Etiquetas de valor de las variables

- Definir códigos para los valores perdidos: en general se usa 99. No siempre la ausencia de datos es por perdidos, a veces es porque corresponde (por ejemplo saltos, donde se usa el “66”)

Formats: Anchura de decimales; no sirve.

Ahora con CASEN:

Comandos:

- RECODE: Recodificar

*Uno nunca usa las variables tal y como las tiene

EDAD

Page 4: Taller SPSS

- DESCRIPTIVOS DE LA VARIABLE EDAD

DESCRIPTIVES EDAD. (Si quiero sacar descriptivos de más variables solo debo poner espacio y el nombre de la variable, todo seguido).

*RECODIFICAR LA VARIABLE EDAD EN TRAMOS (nunca recodificar en la misma variable)

WEIGHT OFF. Apagar el ponderador (porque cuando estas recodificando quieres saber los datos reales que tienes, luego se vuelve a prender para el análisis)

RECODE –> Recodificación

INTO: RECODIFICAR EN OTRA

Cada vez que a SPSS le doy una orden que modifica la base de datos (no análisis, ni etiquetas, etc.) debo dar la orden de EJECTUTAR (EXECUTE)

- DO IF: Es un condicionante, funciona como un operador lógico. SPSS solo operara en los casos que solo cumplen esa condición

- END IF: Termina LA CONDICIÓN

ELSE= Todos los demás

SYSMIS= Datos perdidos (SI USO LA CONDICIÓN NO ES NECESARIO)

WEIGHT BY EXPR_R2 (ESE ES EL NOMBRE DEL PONDERADOR EN LA CASEN)

Establecer un principio jerárquico

El comando DO IF no es lo mismo que el filtro, ya que ese último espera el análisis de las variables

Las medidas de tendencia central son la base para analizar cualquier cosa. Luego, las técnicas descriptivas (tablas de contingencia) y univariadas son el 90% de lo que hacemos

Tablas personalizadas: Se toma una variable independiente, que es nuestra variable de estratificación. La variable se pone en las filas o las columnas (se pone el tipo de variable, nominal en este caso).

Reemplazar total por “promedio general”

En las columnas ponemos una gran cantidad de indicadores (se ponen como escalares).

Esta tabla no se incluye en informes.

Page 5: Taller SPSS

Sexo Edad (años cumplidos) Años de escolaridad Indicador de Hacinamiento

Medi

a

Median

a

Mod

a

Desviació

n típica

Medi

a

Median

a

Mod

a

Desviació

n típica

Medi

a

Median

a

Mod

a

Desviació

n típica

Medi

a

Median

a

Mod

a

Desviació

n típica

Estratificació

n social 3

categorías

= 'Clase

baja'

1,54 2,00 2,00 ,50 30,68 26,00 17,0

0

21,91 8,86 9,00 12,0

0

4,00 1,30 1,00 1,00 ,53

= 'Clase

media'

1,52 2,00 2,00 ,50 35,37 33,00 21,0

0

22,46 9,68 11,00 12,0

0

4,04 1,15 1,00 1,00 ,39

= 'Clase

alta'

1,49 1,00 1,00 ,50 37,50 37,00 50,0

0

20,59 13,02 13,00 12,0

0

3,79 1,03 1,00 1,00 ,18

Promedi

o

general

1,52 2,00 2,00 ,50 34,64 32,00 18,0

0

22,18 10,06 11,00 12,0

0

4,21 1,17 1,00 1,00 ,41

Page 6: Taller SPSS

Análisis bivariado.-

La distribución normal permite comprobar que se trata de un fenómeno aleatorio.

En la estadística hay variables nominales y escalares; por lo tanto las posibles

combinaciones son1) Nominal-nominal= Chi cuadrado2) Nominal-escalar= R de pearson3) Escalar-Escalar=

Analizar estadísticos descriptivos tabla de contingencia

Chi cuadrado – casillas, tipificados, corregidos

Con los residuos se puede ver el sentido de la asociación

Chi cuadrado trabaja con las tablas de contingencia y la diferencia entre lo observado y lo esperado.

Por otra parte, R de Pearson (Regresión lineal) trabaja con la nube de puntos, entre mayor es la pendiente, mayor asociación.

Elaboración de índices y escalas.-

UN índice es una variable escalar u ordinal que se construye desde distintas variables. La idea es que tenemos un concepto que da lugar a “X” dimensiones, que dan lugar a “x” variables. El concepto debe descomponerse en dimensiones, y estas en variables, reconstruyéndolas en una fórmula matemática.

Para el índice se necesita que al menos la dimensiones que dan lugar a “x” sub-índices estén en la misma unidad de medida, por lo cual muchas veces hay que recodificar las variables.

Índice de incorporación al sistema financiero: A partir de esto se hacen diversas dimensiones (Débito, crédito bancario, crédito casa comercial, chequera, línea de crédito) – En este caso haremos coincidir dimensiones con variables (aunque podríamos hacer una diferencia entre instrumentos de pago y de crédito)

Índice Sub índices Variablesincorporación al sistema financiero:

Instrumentos de pago - Y28a- Y28d

Instrumentos de crédito bancario

- Y28b- Y28e

Instrumentos de crédito casa comercial

- Y28c

Page 7: Taller SPSS

Primero hay que elaborar subíndices que tienen que estar en la misma unidad de medida.

Algunos estadísticos dicen que las variables tienen que estar asociadas para poder hacer un índice, aunque eso no siempre es así, la asociación entre las variables es teórica, no estadística (debe argumentarse).

- Hay que recodificar las variables para que funcionen.- Nosotros podemos decidir el peso de cada subíndice o variable

COMPUTE: Permite calcular una variable a partir de operaciones lógicas (matemáticas) entre otras.

- Con los casos perdidos pueden descartarse al principio o al final, en este caso lo haremos al final. Otra opción es imputar datos.

- Los decimales se ponen con punto en la sintaxis- Luego, para explicar los índices se hacen tramos.

~