contenido 1 estadística 1 análisis de datos con · pdf fileanálisis de...
TRANSCRIPT
1
Análisis de datos con SPSS
ESTADÍSTICA 1
Máster en Salud Respiratoria 2007-2008
Introducción al SPSS
Organización del SPSSl Ventanasl Barra de herramientasl Cuadros diálogo
Lectura de ficheros en SPSSl ¿Qué es un fichero/matriz de datos?l Creación de un fichero de datosl Lectura de un fichero de datos
CONTENIDO 1
INTRODUCCIÓN AL SPSS
SPSS: Statistical Package for the Social Sciences
Programa (software) estadístico :l Gestionar bases de datosl Describir y resumir los datos
l Medidas de tendencia central, dispersión, localización,...
l Representaciones gráficas
l Análisis estadístico
Existen otros:l SAS, S-Plus, Stata, Epi-info, Minitab,...
INTRODUCCIÓN AL SPSS
l Dispone de:l Tutoriall Página web : www.spss.coml Manual de sintaxis.....
INTRODUCCIÓN AL SPSS
l TUTORIAL
ORGANIZACIÓN DEL SPSS
Ventanasl Ventana de datos (variables y casos) (*.sav)l Ventana de resultados (*.spo)l Ventana de sintaxis (programación) (*.sps)
Barra de herramientas
Cuadros de diálogo
2
VENTANA DE DATOS: nombre.SAV
Nombre fichero
Variables
Casos
Datos
VENTANA DE DATOS: nombre.SAV
Informaciónsobre lasvariables
Nombre Valores
Etiqueta Identificadoresde valores
missing
VENTANA DE RESULTADOS: nombre.SPO
Navegador
Objetos
Se edita fácilmente
con muchas
opciones:
• gráficas
• estilo
• impresión
• etc...
Memoriza los últimos análisis
realizados
VENTANA DE RESULTADOS: nombre.SPO
• Es aconsejable, una vez se ha comprobado que el análisis es correcto, crear la
sintaxis de los análisis realizados,
• Permite más análisis no disponibles entre las ventanas de Windows visibles
• Permite realizar fácilmente análisis parecidos, o modificar rápidamente una
sintaxis ya programada anteriormente
EJECUTAR !!!!!EJECUTAR !!!!!
VENTANA DE COMANDOS: nombre.SPS
Añadir comentarios con *
Programar anàlisis:
las sentencias se finalizan con .
BARRA DE HERRAMIENTAS
Existe una barra en cada ventanaDatos
Resultados
Sintaxis
3
BARRA DE HERRAMIENTAS
Ventana de datos
Abrir, salvar,
imprimir datos,
resultados y gráficos
ModifIcar, cortar, copiar,
pegar, encontrar texto
y datos
Menus y botones de
estado, tamaño, fuentes, vista
general
Análisis estadístico: descriptivos, modelos…
Creargráficos
Información sobre la base
de datos
Administrador de ventanas
Ayuda (F1),
tutorialDefinir, ordenar,
seleccionar datos. juntar
archivos
Archivo Edición Ver Datos Transformar Analizar Graficos Util. Ventanas ?
Transformar, calcular,
crear variables y
valores usando
expresiones y funciones
CUADROS DIÁLOGO
l Para la selección de variables y especificaciones opcionales
Contiene la información recogida para todos los casos
l Filas: unidad de análisis (casos) l encuesta de satisfacción de un hospital: pacientesl encuesta de gasto hospitalario: hospital
l Columnas: características que quiero medir (variables)l sexo, edad, tiempo de espera, calidad de la comidal número de camas, número de médicos, gasto de luz
¿QUÉ ES UN FICHERO DE DATOS?
El sujeto 1007 tenía 16 años en el momento de la entrevista
¿QUÉ ES UN FICHERO DE DATOS?
NUMID SEXO EDAD CLASE REGION SALUD FUMAR1001 1 67 3 6 2 11002 1 53 3 2 1 11003 1 28 2 1 3 11004 2 74 2 1 4 11005 1 24 3 1 4 11006 2 78 2 1 4 11007 1 16 3 1 3 11008 1 16 2 1 3 11009 1 82 2 1 4 11010 1 44 3 1 1 1
¿QUÉ ES UN FICHERO DE DATOS? Fichero de datos en SPSS: tabaco.sav
Nombrefichero
Datos
Variables
Casos(sujetos)
CREACIÓN DE UN FICHERO DE DATOS Creación de un fichero de datos en SPSS: entrada manual de datos
Teclear directamenteel valor en la casilla
Entrada de datos
Definición de las variables
Click 2 veces e insertar el nombre de la variable
4
CREACIÓN DE UN FICHERO DE DATOS Definición de variables
Informaciónsobre lasvariables
Nombre Valores
Medida dela variable
Etiqueta identificadoresde valores‘missing’
Tipo
CREACIÓN DE UN FICHERO DE DATOS
SPSS no ha sido creado con este
propósito y no tiene ni las ventajas ni la flexibilidad de un programa específico para
la creación y manejo de bases de datos
Ficheros de datos ya creados:
l SPSS (*.sav)l ASCII (*.dat, *.txt)l Excel (*. xls)l Lotus (*.wk*)l dBase (*.dbf)
LECTURA DE UN FICHERO DE DATOS
Ficheros de datos ya creados
LECTURA DE UN FICHERO DE DATOS
Ficheros de datos ya creados
LECTURA DE UN FICHERO DE DATOS
Seleccionartipo de fichero
Excel
Si en la 1ª fila del fichero Excelse encuentra el nombre de lasvariables marcar la opción
LECTURA DE UN FICHERO DE DATOS
5
Lectura de datos texto (ASCII)
LECTURA DE UN FICHERO DE DATOS
Lectura de datos texto (ASCII) Lectura de datos de texto (ASCII)
Marcar sólo siexiste un formato
Visualización previade los datos
LECTURA DE UN FICHERO DE DATOS
Datos de texto
Si en la 1ª fila del ficherose encuentra el nombre de lasvariables marcar la opción
Organizaciónde las variables
LECTURA DE UN FICHERO DE DATOS
Datos de texto
Número de casosque se desea leer
Qué representacada línea
En qué línea sesitúa el 1r caso
LECTURA DE UN FICHERO DE DATOS
Datos de texto
Separador de variables en el fichero de texto original
LECTURA DE UN FICHERO DE DATOS
Datos de texto
Especificacionesde variables
LECTURA DE UN FICHERO DE DATOS
6
Datos de texto
Copiar sintaxis en fichero *.sps
Marcar finalizar
LECTURA DE UN FICHERO DE DATOS
Datos de texto (opción alternativa)
LECTURA DE UN FICHERO DE DATOS
Abrir el fichero ‘tabaco.xls’ y guardarlo como ‘smoke_xls.sav’
Abrir el fichero ‘tabaco.dat’ y guardarlo como ‘smoke_dat.sav’
Abrir el fichero ‘smoke.sav’
EJERCICIO
Definición de variables en SPSSl Etiquetas de variables y valoresl Tipo de variablesl Datos faltantes (missing)
Creación y Transformación de variables en SPSS
CONTENIDO 2
DEFINICIÓN DE VARIABLES EN SPSS
Informaci ónsobre lasvariables
NombreEtiquetas paralos valores
Medida dela variable
Etiqueta de la variable
Identificadoresde valores
missing
Scale: cuantitativaNominal: cual. nominalOrdinal: cual. ordinal
DEFINICIÓN DE VARIABLES EN SPSSEs buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador.Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos.l Sexo (Cualit: Códigos arbitrarios)
l 1 = Hombrel 2 = Mujer
l Raza (Cualit: Códigos arbitrarios)l 1 = Blancal 2 = Negra,...
l Felicidad Ordinal: Respetar un orden al codificar.l 1 = Muy felizl 2 = Bastante felizl 3 = No demasiado feliz
Se pueden asignar códigos a respuestas especiales como
l 0 = No sabel 99 = No contesta...
Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’)
7
Identificar qué variables tienen valores missing y listarlos.
Definir el valor 9 de la variable ‘sexo’ como missing
Cambiar el nombre de la variable ‘numid’por ‘identificador’, ¿qué ocurre y porqué?
Sustituir la etiqueta del valor 1 de la variable ‘región’ por ‘Lerida’
EJERCICIOS con fichero tabaco.sav
Utilizando el manual de codificación:
Definir las etiquetas de los valores de las variables ‘sexo’ y ‘fumfin’.
Definir la etiqueta de la variable ‘sexo’
EJERCICIOS con fichero tabaco.sav
Calcular una nueva variable:imc=peso(kg)/altura2 (m)
Recodificar los valores de una variable l Recodificar en la misma variable
Cambiar los valores existentes por otrosSexo: 1=hombre, 2=mujer ⇒ Sexo: 1= mujer, 2= hombrePeso: continua ⇒ Peso: 1= ‘<60kg’, 2=’60-70kg’, 3=‘>70kg’
l Recodificar en una nueva variableCrear una variable nueva usando los valores de otraSexo: 1=hombre, 2=mujer ⇒ Sexo2: 1= mujer, 2= hombrePeso:continua ⇒ Weight: 1=‘<60kg’, 2=’60-70kg’, 3=‘>70kg’
TRANSFORMACIÓN /CREACIÓN DE VARIABLES
Categorizar una variable continua segúnnúmero de categorías:
l Crear una variable nueva con un número específico de categorías.
l Las categorías tienen un porcentage de casos igual o similar (percentiles)
Contar las apariciones del mismo valor, o valores, en una lista de variables
TRANSFORMACIÓN /CREACIÓN DE VARIABLES
TRANSFORMACIÓN /CREACIÓN DE VARIABLES CALCULAR VARIABLES
Transformar → Calcular
IMC PESO/(ALTURA**2)
8
RECODIFICAR VARIABLES
• Es aconsejable recodificar en nuevas variables para no perder los valores
originales de las variables
• Todos los valores de la variable original deben ir a parar a una categoría de la
nueva variable, es importante conocer la distribución de los valores variable
original
Transformar → Recodificar
RECODIFICAR VARIABLES
Recodificar en la misma variable
Transformar → Recodificar
RECODIFICAR VARIABLES
Recodificar en una nueva variable
Transformar → Recodificar
CATEGORIZAR VARIABLES
Categorización de una variable contínua
Indicar el número de categoriasestas se construyen según percentiles
ej: 4 categorias → <Q1, Q1-Q2, Q2-Q3 y > Q3
Transformar → Categorizar
CATEGORIZAR VARIABLES
Nueva variable que representa el orden de una variable continua
Asigna el orden de la variable continua
Variableoriginal
Variablenueva
CATEGORIZAR VARIABLES
Categorización automática
Convierte los valores de una variable númericao alfanumérica en números enteros consecutivos
9
CONTAR APARICIONES
Transformar → Contar
EJERCICIO
1) Recodificación de la variable edad en las siguientes categorías:
l (30 , 50] añosl (50 , 60] añosl (60 , 70] añosl (70 , 75] añosl Más de 75 años
2) Definir la variable creada
EJERCICIO
3) Cálculo de nuevas variables:
l Exposición a tabaco (tiempo que hace que fuma en años):fumafin – fumaini
l Definir la variable ‘exposición a tabaco en años’
l Transformación el tiempo en años a días: (fumafin – fumaini) * 365,25
Tratamiento de DATOSl Ordenar casos
l Selección de casos
l Ponderar casosl Segmentar/estratificar archivo
Manipulación de ARCHIVOSl Fusión de archivos
l por variables
l por casos
l Reestructuración de datos
CONTENIDO 3
ORDENAR ARCHIVO
Datos → Ordenar casos
SELECCIÓN DE CASOS
Datos → Seleccionar casos
Selecci ón temporal
Selecci ónpermanente
10
FUSIÓN DE FICHEROS
Existen dos tipos de fusiones:
l Añadir variables
l Añadir casos
Var 1 ..Var 10 Var 11 ..Var 20
+
+
Ind 1...Ind 5
Ind 6...Ind 10
FUSIÓN DE FICHEROS - VARIABLES
Se quiere evaluar el estado de salud según
el sexo.
l Las variables estan en ficheros distintos
l Tabaco_demo.sav: datos demográficos
l Tabaco_salud.sav: datos de salud
Fusión añadiendo variables
FUSIÓN DE FICHEROS - VARIABLES
Es necesario que ambos ficheros contengan
la misma variable identificadora del caso
l La variable identificadora debe reconocer
inequivocamente un caso, no pueden existir
repeticiones
Previamente ambos ficheros se deben
ordenar de forma ascendente según la variable identificadora
FUSIÓN DE FICHEROS - VARIABLESDatos → Ordenar casos → Ordenar por variable
identificadora
Salvar el fichero!!
FUSIÓN DE FICHEROS - VARIABLESDatos → Fusionar → Añadir variables →
Seleccionar fichero 2
FUSIÓN DE FICHEROS - VARIABLES
Opción:-los dos ficheros pueden aportar casos-sólo usará los casos del fichero 1-sólo usará los casos del fichero 2
Variables que contendráel fichero resultante
Variables excluidasla var id siempre está
Variable identificadora
11
FUSIÓN DE FICHEROS - CASOS
Se quiere evaluar el estado de salud de
toda la muestra.
l La región sanitaria ‘Lleida’ está en un fichero
aparte del resto
l Tabaco_lleida.sav: datos de Lleida
l Tabaco_region7.sav: datos del resto de 8 regiones sanitarias
Fusión añadiendo casos
FUSIÓN DE FICHEROS - CASOS
Si ambos ficheros contienen las mismas
variables → OK
Si aportan alguna/s variable/s distintas,
estas seran missing para los casos que
provienen del fichero donde no estan las variables
FUSIÓN DE FICHEROS - CASOS Datos → Fusionar → Añadir casos → Seleccionar
fichero 2
FUSIÓN DE FICHEROS - CASOS
Variables que contendráel fichero resultante
Variables desapareadas
Variable que identificael fichero origen. Opcional
1) Crear un fichero de datos global (tabaco_hombres.sav + tabaco_mujeres.sav)
2) Crear un fichero de datos global(tabaco_sexo.sav + tabaco_nosexo.sav)
EJERCICIO REESTRUCCTURACION DE DATOS
REGISTROS A VARIABLES
13031
15512
12021
14011
sbptimeid
VARIABLES A REGISTROS
120
sbp2
155
140
sbp1
2
1301
sbp3id