spss - sc448b732ab1c070a.jimcontent.com · spss puede adquirir datos de prácticamente cualquier...
TRANSCRIPT
Republica bolivariana de Venezuela Ministerio de la defensa para el poder popular
Universidad gran mariscal de Ayacucho Núcleo El Tigre, edo. Anzoátegui.
SPSS
INTEGRANTES: Andrea Almeida C.I. 20.548.202
Katerin Carbonell C.I.18.981.524
El Tigre, Abril 2010.
INTRODUCCION
En el mundo moderno, la necesidad de tomar decisiones más
acertadas nos obliga a conocer mejor los factores que influyen en cada
suceso; es por este motivo que el análisis de datos aparece como una
herramienta fundamental para comprender las causas y consecuencias del
comportamiento de nuestro entorno, brindándonos las bases para optimizar
los esfuerzos y recursos y así orientarlos a mejores resultados.
Con el desarrollo de nuevas tecnologías, los cálculos estadísticos
dejaron de ser una ardua tarea digna de un genio y se han convertido en una
labor relativamente sencilla que cualquier persona puede realizar. En la
actualidad existen en el mercado diversos software para el análisis de datos,
destacándose entre ellos el paquete estadístico SPSS principalmente por su
gran capacidad, la facilidad de uso y su adaptabilidad a la mayoría de las
ramas de la ciencia y los negocios.
A pesar de la utilidad del SPSS, en Latinoamérica su uso ha
permanecido reservado a sólo algunos sectores, fundamentalmente por la
aparente complejidad de manejo, así como la dificultad para acceder a los
diferentes manuales, cursos o tutoriales.
El SPSS (Statistical Package for Social Science) también es un programa
u herramienta muy bien utilizada para el dominio y análisis de información,
proveniente por ejemplo de encuestas. Es un completo sistema de análisis de
datos. SPSS puede adquirir datos de prácticamente cualquier tipo de archivo
y de bases de datos externas y utilizarlos para generar informes tabulares,
gráficos y diagramas de las distribuciones y de las tendencias, estadísticos
descriptivos y complejos análisis estadísticos.
El editor de datos le ofrece una herramienta simple y eficaz con un
diseño del tipo hoja de cálculo, que le permitirá introducir datos y examinar
el archivo de datos de trabajo.
Los gráficos, de alta resolución y con calidad de presentación, son una
parte esencial e integrada del sistema Base. La mayoría de los datos del
sistema SPSS Base y de la opción SPSS Tablas toman la forma de tablas
pivote, que resultan sumamente flexibles y que pueden modificarse
rápidamente para después copiarlas directamente en otras aplicaciones.
El SPSS posee una estructura de tipo modular que incluye un módulo
Base, además de una serie de módulos opcionales como son: Estadísticas
Profesionales; Estadísticas Avanzadas; Tablas; Tendencias; Categorías; Lisrel,
etc... El módulo Base forma el núcleo del sistema y como tal debe
permanecer residente en memoria. En él se encuentran los comandos de
lectura y transformación de datos y ficheros, los cuales nos permiten acceder
a una gran variedad de fuentes de datos como son dBase, Lotus, Excel y a
través de ODBC, Access Paradox, SQL Server, Oracle y otros muchos. También
dispone de las herramientas encargadas de realizar procedimientos
estadísticos básicos como análisis exploratorio de datos, tablas de
contingencia, comparación de medias, análisis de la varianza, pruebas no
paramétricas, correlación y regresión lineal múltiple, así como técnicas de
análisis factorial, discriminante, de conglomerados y cálculo de proximidades.
Este curso se centrará sobre todo en estos procedimientos que contiene el
módulo Base, ya que los restantes módulos están destinados a otros
procedimientos estadísticos más avanzados.
VERSIONES DEL SPSS
SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del
que han aparecido las siguientes versiones:
SPSS-X (para grandes servidores tipo UNIX)
SPSS/PC (1984, en DOS. Primera versión para computador portátil)
SPSS/PC+ (1986 (en DOS)
SPSS for Windows 6 (1992) / 6.1 para Macintosh
SPSS for Windows 7
SPSS for Windows 8
SPSS for Windows 9
SPSS for Windows 10 / for Macintosh 10 (2000)
SPSS for Windows 11 (2001) / for Mac OS X 11(2002)
SPSS for Windows 11.5 (2002)
SPSS for Windows 12 (2003)
SPSS for Windows 13 (2004): Permite por primera vez trabajar con
múltiples bases de datos al mismo tiempo.
SPSS for Windows 14 (2005)
SPSS for Macintosh 13 (2006)
SPSS for Windows 15 (2006)
SPSS for Windows 16 (Octubre de 2007): En la lista de usuarios de SPSS
"SPSSX (r) Discussion [SPSSX-L@LISTSERV. UGA. EDU]" varios
funcionarios de la empresa anunciaron previamente la salida de la
versión 16 de este software. En ella se incorporó una interfaz basada
en Java que permite realizar algunas mejoras en las facilidades de uso
del sistema.
SPSS for Macintosh 16
SPSS for Linux 16
SPSS for Windows 17 (2008): Incorpora aportes importantes como el
ser multilenguaje, pudiendo cambiar de idioma en las opciones
siempre que queramos. También incluye modificaciones en el editor de
sintaxis de forma tal que resalta las palabras claves y comandos,
haciendo sugerencias mientras se escribe. En este sentido se aproxima
a los sistemas IDE que se utilizan en programación.
MÓDULOS DEL SPSS
El sistema de módulos de SPSS, como los de otros programas (similar al de
algunos lenguajes de programación) provee toda una serie de capacidades
adicionales a las existentes en el sistema base. Algunos de los módulos
disponibles son:
Modelos de Regresión
Modelos Avanzados
o Reducción de datos: Permite crear variables sintéticas a partir
de variables colineales por medio del Análisis Factorial.
o Clasificación: Permite realizar agrupaciones de observaciones o
de variables (cluster analysis) mediante tres algoritmos distintos.
o Pruebas no paramétricas: Permite realizar distintas pruebas
estadísticas especializadas en distribuciones no normales.
Tablas: Permite al usuario dar un formato especial a las salidas de los
datos para su uso posterior. Existe una cierta tendencia dentro de los
usuarios y de los desarrolladores del software por dejar de lado el
sistema original de TABLES para hacer uso más extensivo de las
llamadas CUSTOM TABLES.
Tendencias
Categorías: Permite realizar análisis multivariados de variables
normalmente categorías. También se pueden usar variables métricas
siempre que se realice el proceso de recodificación adecuado de las
mismas.
Análisis Conjunto: Permite realizar el análisis de datos recogidos para
este tipo especifico de pruebas estadísticas.
Mapas: Permite la representación geográfica de la información
contenida en un fichero (descontinuado para SPSS 16).
Pruebas Exactas: permite realizar pruebas estadísticas en muestras
pequeñas.
Análisis de Valores Perdidos: Regresión simple basada en
imputaciones sobre los valores ausentes.
Muestras Complejas: permite trabajar para la creación de muestras
estratificadas, por conglomerados u otros tipos de muestras.
SamplePower (cálculo de tamaños muestrales)
Árboles de Clasificación: Permite formular árboles de clasificación y/o
decisión con lo cual se puede identificar la conformación de grupos y
predecir la conducta de sus miembros.
Validación de Datos: Permite al usuario realizar revisiones lógicas de la
información contenida en un fichero.sav. y obtener reportes de los
valores considerados extraños. Es similar al uso de sintaxis o scripts
para realizar revisiones de los ficheros. De la misma forma que estos
mecanismos es posterior a la digitalización de los datos.
SPSS Programmability Extension (SPSS 14 en adelante). Permite
utilizar el lenguaje de programación Python para un mejor control de
diversos procesos dentro del programa que hasta ahora eran
realizados principalmente mediante scripts (con el lenguaje SAX Basic).
Existe también la posibilidad de usar las tecnologías .NET de Microsoft
para hacer uso de las librerías del SPSS. Aunque algunos usuarios han
cuestionado sobre la necesidad de incluir otros lenguajes, la empresa
no tiene esto entre sus objetivos inmediatos.
Desde el SPSS/PC hay una versión adjunta denomina SPSS Student que es
un programa completo de la versión correspondiente pero limitada en su
capacidad en cuanto al número de registros y variables que puede procesar.
Esta versión es para fines de enseñanza del manejo del programa.
MANEJO
SPSS tiene un sistema de ficheros en el cual el principal son los archivos de
datos (extensión. SAV). Aparte de este tipo existen otros dos tipos de uso
frecuente:
Archivos de salida (output, extensión. SPO): en estos se despliega toda
la información de manipulación de los datos que realizan los usuarios
mediante las ventanas de comandos. Son susceptibles de ser
exportados con varios formatos (originalmente HTML, RTF o TXT,
actualmente la versión 15 incorpora la exportación a PDF junto a los
formatos XLS y DOC que ya se encontraban en la versión 12).
Archivos de sintaxis (extensión. SPS): Casi todas las ventanas de SPSS
cuentan con un botón que permite hacer el pegado del proceso que el
usuario desea realizar. Lo anterior genera un archivo de sintaxis donde
se van guardando todas las instrucciones que llevan a cabo los
comandos del SPSS. Este archivo es susceptible de ser modificado por
el usuario. Muchos de los primeros usuarios del SPSS suelen escribir
estos archivos en vez de utilizar el sistema de pegado del programa.
Existe un tercer tipo de fichero: el fichero de scripts (extensión. SBS). Este
fichero es utilizado por los usuarios más avanzados del software para generar
rutinas que permiten automatizar procesos muy largos y/o complejos.
Muchos de estos procesos suelen no ser parte de las salidas estándar de los
comandos del SPSS, aunque parten de estas salidas. Buena parte de la
funcionalidad de los archivos de scripts ha sido ahora asumida por la
inserción del lenguaje de programación Python en las rutinas de sintax del
SPSS. Procedimientos que antes solo se podían realizar mediante scripts
ahora se pueden hacer desde el sintax mismo.
El programa cuando se instala trae un determinado número de ejemplos o
utilidades de casi todos los ficheros en cuestión. Estos son usados para
ilustrar algunos de los ejemplos de uso del programa.
FICHERO DE DATOS DE SPSS
Los ficheros de datos en formato SPSS tienen en Windows la extensión.
SAV. Al abrir un fichero de datos con el SPSS, vemos la vista de datos, una
tabla en la que las filas indican los casos y las columnas las variables. Cada
celda corresponde al valor que una determinada variable adopta en un cierto
caso.
Además de esta vista de datos, en las últimas versiones del programa
existe una vista de variables en la que se describen las características de cada
una. En esta vista las filas corresponden a cada variable y las columnas nos
permiten acceder a sus características:
Nombre, limitado a 8 caracteres.
Tipo de variable (compárese este listado de opciones con los tipos de
variables estadísticas existentes)
o Numérico, número en formato estándar)
o Coma decimal, número con comas cada tres posiciones y con un
punto como delimitador de los decimales
o Punto decimal, número con puntos cada tres posiciones y con
una coma como límite delimitador de los decimales.
o Notación científica, número que se expresa con un formato tal
que se sigue de una E y un número que expresa la potencia de
10 a la que se multiplica la parte numérica previa
o Fecha
o Moneda dólar, formato numérico con el que se expresan
cantidades en dólares
o Moneda del usuario, formato numérico con el que se expresan
cantidades en la moneda definida en la pestaña de monedas del
cuadro de diálogo "Opciones"
o Cadena de caracteres o variable alfanumérica
Tamaño total
Tamaño de la parte decimal
Etiqueta de la variable
Etiquetas para los valores
Valores perdidos
Espacio que ocupa en la vista de datos
Alineación de la variable en la vista de datos
Escala de medición.
Algunos usuarios pasan por alto las características de las variables cuando
se trabaja en la base de datos. Sin embargo, cuando se utilizan scripts o
Python las características de las variables pueden tomar gran relevancia en la
construcción de procedimientos ad-hoc.
FICHERO DE SINTAXIS DE SPSS
Se pueden generar estos archivos de sintax con la ayuda del programa
mismo, pues en casi todas las ventanas donde se realizan tareas en el SPSS
existe un botón "Paste". Este botón cierra la ventana en cuestión y guarda la
sintaxis de las acciones seleccionadas en dicha ventana. Una vez salvado este
archivo es susceptible de modificación.
La sintaxis tal cual se presenta a continuación fue producida
directamente con el SPSS. Este programa le da un formato legible a la
sintaxis, formato que el software en algunos casos no requiere para su
correcto uso.
Otra peculiaridad de las sintaxis del SPSS es que no son "case
sensitive". Ante lo cual es común ver sintaxis escritas en solo mayúsculas,
solo minúsculas o bien una combinación propia de cada usuario. Esta
situación se modifica para aquellas personas que hacen uso de Python dentro
de sus sintaxis, pues este es un lenguaje sensitivo a las variaciones entre
mayúsculas y minúsculas. Esto obliga a estos usuarios a escribir sintaxis con
mayor cuidado.
Una de las ventajas de este paquete es su facilidad en el manejo ya que
mediante el despliegue de un menú interactivo permite realizar todo tipo de
operaciones sobre los datos como así también aplicar distintas técnicas
estadísticas.
Los pasos básicos en el análisis de datos utilizando este paquete son:
Creación de la base de datos desde SPSS o bien la captura de los
datos desde otro archivo.
Selección de los procedimientos de análisis a emplear.
Selección de las variables para los distintos análisis.
Análisis de los resultados.
En este documento se desarrollan estos cuatro pasos poniendo
especial énfasis en el primero de ellos, la manipulación de datos y el análisis
descriptivo de los mismos. A continuación algunas características generales
del programa, la forma en que se inicia una sesión y se cargan los datos, de
que manera se pueden transformar los datos, como re codificar variables,
ordenar los datos, particionar y unir bases de datos. Por último se presentan
algunos procedimientos estadísticos que ofrece el programa y que se
consideran de utilidad para el trabajo particular.
Pantallas básicas:
Durante el transcurso de una sesión en SPSS se activan básicamente dos pantallas: la que corresponde al editor de datos y el visor de resultados.
La primera de ellas se activa automáticamente cuando se inicia la
sesión, mientras que la otra se habilita al efectuar algún procedimiento. Esta
última se encuentra subdividida en dos partes: a la izquierda de la pantalla
aparece una estructura de árbol que muestra los procedimientos realizados y
en que orden se efectuaron. A la derecha aparecen los resultados
propiamente dichos, tales como tablas de frecuencias, gráficos, los
resultados del cálculo de medidas descriptivas, etc.
Por supuesto, para obtener resultados de cualquier tipo es preciso
tener cargado un conjunto de datos, ya sea mediante el ingreso directo de
los mismos o mediante la captura de la información a partir de otro archivo.
Otra característica del programa que facilita su utilización es el uso de
ventanas de diálogo que permiten elegir las variables a utilizar y especificar
las opciones del procedimiento. Al respecto, todas estas ventanas funcionan
de la misma manera: en general, a la izquierda aparece un cuadro donde se
muestra la lista de variables del archivo disponibles para el procedimiento
que se desea realizar.
Simplemente se marcan haciendo un click con el botón izquierdo del
mouse arriba del nombre de la variable que corresponde quedando marcada
con lo cual se habilita el botón “flecha” que permite pasar de cuadro esa
variable, o directamente con un doble click del mouse. De la misma manera,
cuando las especificaciones mínimas del procedimiento ya están completas
se habilita el botón ACEPTAR (OK). Si esto no ocurre, significa que hay alguna
especificación incorrecta o incompleta por lo cual hay que revisar las
opciones y variables ingresadas.
Inicio de una sesión:
Para comenzar una sesión en SPSS se hace simplemente un doble click
sobre el ícono correspondiente al programa y automáticamente se activa la
ventana de edición de datos cuyo aspecto es semejante al de una planilla de
cálculo.
Como se dijo anteriormente, el primer paso en cualquier análisis
consta o bien en la carga de los datos directamente o si éstos están grabados
en otro archivo (supongamos en una planilla de cálculo EXCEL), en la captura
de los mismos.
SPSS organiza la información de la siguiente manera: cada una de las
filas constituye un caso o individuo y cada columna representa una variable
o atributo observado en el individuo. De esta manera, al final de la carga de
datos se obtiene una matriz de datos con n filas y p columnas (n = cantidad
de individuos, p = cantidad de variables).
Teniendo en cuenta este formato que utiliza el programa, se comienza
la carga en la primera fila y primera columna de la planilla y no es aconsejable
dejar filas en blanco intercaladas con filas completas ya que el programa
asume que para esos individuos no se tiene información (valores perdidos del
sistema). Más aún, si durante la carga de los datos quedan celdas sin ningún
dato, el programa asigna un punto ‘.’ indicando que es un valor perdido para
ese individuo y variable en cuestión.
Otra característica del programa es que mantiene activo sólo un
archivo de datos a diferencia de una planilla de datos en el que se pueden
tener múltiples hojas activas.
Carga directa de los datos:
Para comenzar a cargar información en un archivo SPSS es preciso
tener en cuenta las características de variable que aparecen en el sistema
definidas por omisión. El formato es de tipo numérico, con ocho caracteres
de extensión para la parte entera y dos posiciones para la parte decimal,
escala de medida numérica (escala de razón) y alineación a la derecha de las
celdas.
Si el formato mencionado no se corresponde con el de la información
que se desea ingresar, es posible cambiar alguno/s de estos atributos
utilizando la opción DEFINIR VARIABLE (en inglés, “define variable”)
disponible en el menú desplegable DATOS (data) de la barra de menúes o
posicionado con el mouse sobre el encabezado de la columna (variable) en
cuestión utilizando el botón derecho del mouse.
La ventana de diálogo que se despliega es la siguiente:
Como se ve, es posible cambiar el nombre de la variable que el sistema
asigna por default (VAR00001) por el que el usuario desee, teniendo en
cuenta que éste no puede superar los 8 caracteres de extensión, no se hace
distinción entre minúsculas y mayúsculas y que no es posible nombrar de la
misma manera dos o más variables en la misma base.
Además en esta ventana aparecen cuatro botones: TIPO, ETIQUETAS,
VALORES PERDIDOS y FORMATO DE COLUMNA. El primero de ellos se utiliza
para elegir el tipo de variable que se desea definir, a saber: numérico,
fechas, moneda, notación científica, alfanumérico, entre otros.
El segundo botón muestra la siguiente ventana y permite ingresar una
etiqueta de variable cuya extensión puede alcanzar los 256 caracteres de
extensión y a su vez, también es posible definir etiquetas de valor para cada
valor distinto que tome la variable si es preciso, por ejemplo:
Por último los botones VALORES PERDIDOS y FORMATO DE COLUMNA
ofrecen distintas opciones para la definición de valores faltantes y algunas
características con respecto al ancho de la columna y tipo de alineación
respectivamente.
Un aspecto interesante cuando se cargan estos datos es que si se
utiliza el modo “ETIQUETAS” (disponible en el menú VISTA ETIQUETAS DE
VALOR o en inglés VIEW VALUE LABELS) es posible ver en el visor de datos
el rótulo que se corresponde con los valores ingresados. Además como
opción de carga de datos es posible en lugar de tipear el valor de la variable,
elegir del conjunto de rótulos definidos cual es el valor que se desea ingresar.
Para ello, con el cursor en la celda en cuestión y el modo etiquetas activado,
con el botón derecho del mouse se despliega un menú con la opción “Elegir
valores desde las etiquetas” (en inglés, pick values from labels).
Suponiendo que la variable a ingresar sea el sexo, cuyos valores y
rótulos sean “1= femenino” y “2= masculino” respectivamente, se pueden
cargar los valores 1 o 2 directamente, o bien eligiendo del conjunto de
rótulos los valores “femenino” o “masculino”. De esta manera, siempre se
cargarán valores válidos para la variable lo cual resulta muy importante para
no cometer errores que afecten la consistencia de los datos codificados.
Por último, éstas etiquetas serán utilizadas como rótulos en las salidas
de los distintos procedimientos que se apliquen como ser tablas de
frecuencias o gráficos.
Importación de datos a partir de una planilla de cálculo:
Si la planilla a importar está grabada en formato Excel 5 o superior
pero los datos están contenidos en una sola hoja de cálculo, primero hay que
grabarla en versión Excel 4 y luego proceder a su captura. Para ello, se utiliza
la opción ARCHIVO ABRIR (FILE OPEN) de la barra de menúes y
seleccionar la extensión .xls (archivo excel) como así también especificar en
que subdirectorio está guardada la planilla. Una vez marcada la hoja que se
desea abrir, el programa muestra una ventana de diálogo como la que
aparece a continuación:
Como es común que en la primera fila de la planilla Excel aparezcan los
encabezados con los nombres de las variables, cuando se capturan los datos
es necesario aclararlo haciendo click en el cuadradito “leer nombres de
variables” que aparece a la izquierda de la ventana de diálogo si es que
efectivamente en la primera fila de la planilla se encuentran los nombres de
las columnas. Por otra parte, si la información que se desea recuperar está
grabada en un rango de la hoja, puede especificarse el rango en cuestión en
el renglón que aparece en la misma ventana, por ejemplo, A1:W290.
Por otra parte, si los datos que se necesitan están grabados en un
archivo EXCEL 5.0 o superior y además están ordenados en dos o más hojas
de cálculo, o bien solo se desea importar un subgrupo de registros que
cumplan ciertas condiciones, la forma de recuperar estos datos es creando
una consulta.
Para ello, seleccionando del menú ARCHIVO la opción CAPTURA DE
BASES DE DATOS NUEVA CONSULTA (DATABASE CAPTURE NEW
QUERY).
En este momento se despliega un asistente que permite ir armando
paso a paso la consulta deseada, siguiendo la secuencia utilizando los
botones “siguientes” y “atrás” que aparecen al pie de la ventana de diálogo.
Como puede verse en el cuadro, permite la importación de datos
grabados en distintos formatos: planillas Excel, Bases de datos Microsoft
Access, archivos de texto entre otros.
En este curso se verá específicamente la captura de datos provenientes
de planillas de cálculo Excel.
Una vez seleccionado el archivo a importar, aparecen en la ventana
izquierda todas las hojas que lo componen para su selección. En esta
ventana, haciendo click en el signo “+” se despliega la lista de variables que
componen la hoja, con lo cual se puede elegir un subgrupo de ellas para
importarlas a SPSS.
Por otra parte, si se desea trabajar con la hoja completa, haciendo
doble click sobre el nombre de la misma, automáticamente quedan todas las
variables seleccionadas para su importación.
Además, si lo que se tiene en cada hoja de cálculo son distintas
variables para el mismo conjunto de registros (individuos) y existe una
variable que permita relacionar los registros de cada hoja, es posible
identificar tales relaciones cuando se genera la consulta para que los datos
correspondientes al mismo individuo sean importados en un solo registro.
Otra de las posibilidades que ofrece el programa es importar los datos
que cumplan con cierta condición, lo cual puede hacerse desde la siguiente
pantalla:
Con el cursor ubicado en la primera celda de la columna Expresión 1, se
despliega una lista con todas las variables del archivo, de la cual se puede
elegir una de ellas para escribir la primera condición que se desea que
cumplan los registros a importar basados en esta variable elegida. La
columna relación permite elegir entre un conjunto de símbolos tales como
igual, distinto, mayor, menor, mayor o igual y menor o igual para poder
escribir la condición deseada. En la columna Expresión 2 nuevamente es
posible elegir entre el conjunto de variables disponibles o bien ingresar un
valor para la variable seleccionada en Expresión 1. Si se desea incorporar más
de una condición, éstas se van vinculando eligiendo de la columna conector
la opción “y” u “o” según se desea que las condiciones se cumplan
simultáneamente o al menos una de las condiciones se cumpla para la
importación de los datos.
Si el usuario así lo desea, puede guardar estas especificaciones en un
archivo para que la próxima vez que desee trabajar con este conjunto de
datos, el programa realice la selección e importación directamente. Las
especificaciones de la consulta pueden guardarse en un archivo con
extensión .spq. En esa ocasión, deberá utilizar la opción CAPTURA DE BASES
DE DATOS CORRER CONSULTA (DATABASE CAPTURE RUN QUERY).
Con los datos ya capturados, pueden realizarse cambios de formato de
variables y definir rótulos tanto para las variables como así también para los
valores que asumen siguiendo los pasos antes detallados.
Transformación de valores de los datos: A diferencia de una planilla de cálculo, SPSS no permite el ingreso de
fórmulas como valor de una celda. Si es necesario definir nuevas variables
que resultan de operaciones a partir de variables ya existentes puede
utilizarse el menú TRANSFORMAR, eligiendo la opción CALCULAR VARIABLE
(TRANSFORM COMPUTE VARIABLE). A continuación se muestra la
ventana de diálogo:
Esta opción permite efectuar operaciones de tipo matemáticas, lógicas
e inclusive incluir restricciones utilizando el botón SI... En la ventana
“Variable de destino” se debe especificar el nombre de la nueva variable y en
“Expresión numérica” se pueden incluir variables ya existentes marcándolas
con un click y apretando la flecha de la derecha para pasarlas de ventana,
como así también se puede escoger alguna de las funciones que aparecen a
la derecha y pasarlas a la ventana de expresión utilizando la flecha superior.
Una vez completada la expresión, se presiona ACEPTAR y en el editor de
datos aparecerá la nueva variable.
Recodificación de variables: Otra posibilidad que permite el programa es cambiar los valores que
asume una de las variables, ya sea por medio de una reasignación de valores
sobre la misma variable o bien creando una nueva variable.
Por ejemplo, para la variable sexo se tienen definidos dos valores de la
siguiente manera: 1 = “femenino” – 2 = ”masculino”. En algún momento
puede surgir la necesidad de cambiar esa asignación a esta otra: 1 =
“femenino” - 0 =”masculino”. Para ello, con la opción TRANSFORMAR
RECODIFICAR (TRANSFORM RECODE...) y eligiendo alguna de las dos
opciones: que la recodificación la realice en la misma variable o que genere
otra distinta, aparecerá según corresponda alguna de las ventanas de diálogo
siguientes:
Como puede observarse en ambas ventanas aparece un botón
VALORES NUEVOS Y VIEJOS (OLD AND NEW VALUES) en el que se ingresa la
nueva codificación de la variable. Otra de las opciones disponibles es definir
alguna restricción al cambiar la codificación, utilizando el botón SI... que se
presenta para tal fin. En el caso de recodificar la variable en cuestión
definiendo una nueva, la ventana de diálogo permite además de especificar
el nombre de la nueva variable, la posibilidad de definir una etiqueta para
esta última. Como siempre, una vez definidas todas las opciones se pulsa el
botón ACEPTAR.
Como cambiar el orden de los datos: Otra herramienta de interés cuando se trabaja con un gran conjunto de
datos es la que refiere al orden en que se visualizan los datos e inclusive
algunos procedimientos requieren que los datos estén ordenados de acuerdo
a ciertos criterios antes de realizar la operación en cuestión. Así, SPSS por
medio de la opción DATOS ORDENAR CASOS (DATA SORT CASES)
permite cambiar el orden de las observaciones de la base. Esta operación
puede realizarse utilizando como criterios de orden tanto variables
numéricas como alfanuméricas, en orden ascendente o descendente.
Además se permite incluir más de un criterio (variable) de orden. Por
ejemplo, puede ser necesario querer ordenar la base según “categoría de
empleo” (1° criterio) Y “edad” (2° criterio). De esta manera, el programa
comienza ordenando los registros según los valores de la primera variable y
para los valores repetidos de ésta, se ordenan los datos utilizando la segunda
variable seleccionada.
Selección de casos:
Cuando se presentó el módulo de captura de datos desde otros
archivos, se mencionó la posibilidad de importar solo un subgrupo de
individuos de la base incluyendo en la consulta una restricción.
Otra posibilidad para seleccionar solo un grupo de individuos es por
medio de la opción DATOS SELECCIONAR CASOS (DATA SELECT CASES)
Aparecerá una ventana de diálogo como la que se presenta más
adelante en la cual se puede optar entre distintas alternativas. La primera de
ellas es seleccionar todos los casos y es el modo en que se encuentra SPSS
por omisión.
La segunda alternativa es definir una condición a partir de los valores
de una o más variables del archivo para elegir los casos que cumplan con ella.
Al elegir esta opción se activa el botón SI... (IF...) para poder ingresar la
condición en cuestión.
La tercera posibilidad que ofrece la ventana es la selección aleatoria de
casos, ya sea un porcentaje del archivo o un número exacto de casos.
Si dentro del conjunto de variables alguna de ellas ha sido definida
utilizando la opción “definir fechas” es posible seleccionar casos utilizando
dicha variable.
Por último, si se cuenta con una variable dicotómica, es decir que solo
tome valores 0 o 1 indicando ausencia o presencia de cierto atributo, la
misma puede utilizarse como variable de filtrado.
Al pie de la ventana de diálogo aparecen dos burbujas que permiten
optar entre solo filtrar los casos no seleccionados, es decir en la ventana de
edición de datos, los casos no seleccionados aparecerán con el número de
fila tachado, o bien reemplazar el archivo de datos actual por aquel en que
sólo aparecen los casos seleccionados. Una de las precauciones que deben
tenerse cuando se utiliza esta opción es que si se graba este archivo sin
cambiar el nombre del mismo, no podrán recuperarse los casos borrados. En
cambio, si se eligió el modo filtrado, usando nuevamente la ventana de
diálogo de selección de casos y eligiendo la opción “seleccionar todos los
casos”, se recuperan los datos originales para su uso.
Pegado de Bases: agregado de variables:
Puede ocurrir que en alguna oportunidad se generen más de una base
a partir de la información de una encuesta. Por ejemplo, puede tenerse una
base que contenga únicamente los datos personales de las personas
encuestadas y otra base en la que se registran las variables de un módulo
específico de una encuesta. Si en algún momento se necesita tener toda la
información en un solo archivo, esto puede hacerse utilizando la opción
DATOS FUNDIR ARCHIVOS AGREGAR VARIABLES (DATA MERGE
FILES ADD VARIABLES).
Para realizar a cabo esta operación es necesario tener ciertas
precauciones. Como puede verse en la ventana de diálogo, se identifican las
variables del archivo activo con un (*) mientras que las variables del otro
archivo (archivo externo) se identifican con (+). Para llevar a cabo este
agregado de variables, es posible aparear los registros de ambas bases si lo
que se intenta es agregar nueva información para el mismo conjunto de
registros de la base que se encuentra activa. Para ello es preciso que ambos
archivos tengan al menos una variable o un conjunto de ellas que permitan
identificar claramente cada registro (individuo) y que además estén
ordenados con el mismo criterio y en orden ascendente. De otra manera, el
programa “pegará” las nuevas columnas al archivo sin ningún apareamiento
de los registros.
Por otro lado, pueden elegirse cuáles son las variables que se desean
incluir en el nuevo archivo y renombrar alguna de ellas si es que hace falta.
No necesariamente ambos archivos tendrán los mismos individuos, con
lo cual se ofrecen tres opciones: que ambos archivos aporten individuos para
el nuevo fichero de datos, tomar como base el archivo externo o bien tomar
como base los casos presentes en el archivo activo. Para esto es necesario
que en ambas bases se tenga una variable de identificación de individuos
(variable clave) y que ambas bases estén ordenadas de la misma manera
según esa variable clave.
Pegado de Bases: agregado de individuos:
Otra posibilidad es que se tengan en dos bases distintas, dos grupos de
individuos diferentes y que en algún momento se desee juntarlos en una
base común. En este caso, debe tenerse la seguridad que ambas bases
tengan la misma estructura, es decir las mismas variables definidas con el
mismo nombre, formato y longitud. En ese caso, utilizando la ventana de
diálogo que se despliega al seleccionar la opción DATOS FUNDIR
ARCHIVOS AGREGAR CASOS (DATA MERGE FILES ADD CASES) se
puede seleccionar el archivo que se desea pegar con la base activa.
Si existieran variables no coincidentes en ambos archivos, las variables
del archivo activo se identifican utilizando (*) y las del archivo externo con
(+). También se encuentra disponible la opción de renombrar alguna variable
si así se desea. Otra posibilidad es la de “casar” variables que aparecen en los
dos archivos pero con nombres distintos o con distintos formatos. Para ellos
se seleccionan las dos variables en cuestión, se pulsa el botón EMPAREJAR
(PAIR) y aparecerán en la ventana de la derecha indicando que esa variable
aparecerá en el nuevo archivo y se utilizará como nombre de la variable el
utilizado en el archivo activo. Se finaliza la operación pulsando ACEPTAR.
Generación de un archivo resumen:
Si se desea generar a partir de la base de datos un nuevo archivo que
resuma información de los individuos al guardar información “agregada” (por
ejemplo generar registros con valores promedios de alguna característica
según grupos de individuos u otra medida que resuma información del grupo
al cual representa).
Para esto, se selecciona la opción DATOS AGREGAR (DATA
AGGREGATE...) y se despliega la siguiente ventana de diálogo:
Como puede verse aparecen dos cuadros, uno en el que se definen las
variables de corte o agrupamiento, por ejemplo, categoría de empleo y
clasificación de minoría. Más abajo aparece el cuadro de variables
“agregadas”, por ejemplo el salario. Con respecto a las variables elegidas en
este cuadro, debe tenerse la precaución de que las mismas sean numéricas
(de otro forma no tendría sentido calcular promedios, máximos, mínimos,
etc.). Pulsando la tecla función que aparece debajo del cuadro de variables
agregadas es posible elegir que información se desea guardar. Entre las
opciones figuran el promedio (es la opción que aparece en la figura), el valor
máximo, el mínimo, desvío estándar, entre otros. Otra información
disponible para ser incluida es la cantidad de casos que se presenta en cada
grupo definido o dicho de otra manera, es posible definir una nueva variable
que señale que un registro en cuestión resume la información de N_BREAK
individuos de la base original. Para ello se tilda esta opción en el cuadradito
que aparece al pie de la ventana de diálogo y si bien N_BREAK es el nombre
que el programa asigna por default, es posible cambiarlo. También puede
optarse entre crear un nuevo archivo de datos y elegir el nombre del mismo
como así también donde almacenarlo (utilizando el botón ARCHIVO) o bien,
reemplazar el archivo actual. Nuevamente, si se opta por esto último debe
tenerse la precaución de guardar el nuevo archivo con un nombre distinto al
fichero que le dio origen, ya que se perderá la información original.
División del archivo de datos. Si se desean realizar análisis separados para subgrupos del archivo es
posible dividir la base utilizando la opción DATOS SEGMENTAR ARCHIVO
(DATA SPLIT FILE) basándose en los valores de una o más variables de
agrupamiento (pueden utilizarse hasta 8 variables). Si se seleccionan varias
variables de agrupamiento, es necesario que la base completa esté ordenada
con el mismo criterio de agrupamiento definido. Es por esto que aparecen
dos burbujas que permiten indicar si los datos ya están ordenados de
acuerdo a esos criterios o si es necesario ordenar los datos para luego
realizar la segmentación del archivo.
Esta operación permite definir distintos grupos que serán utilizados
posteriormente para análisis de tipo comparativo.
Análisis de la Información: estadísticas descriptivas.
Una práctica usual en todo estudio es la de realizar un primer análisis
descriptivo de la información recopilada. Para ello, SPSS ofrece varias
herramientas, entre ellas la construcción de tablas de frecuencias, cálculo de
algunas medidas como ser promedios, medianas, modos, desvíos estándar,
etc. además de la posibilidad de construir gráficos que ayudan a la
visualización de los resultados obtenidos.
Construcción de Tablas de Frecuencias:
Utilizando la opción ANALIZAR ESTADISTICAS DESCRIPTIVAS
FRECUENCIAS aparecerá una ventana de diálogo como la siguiente la cual
permitirá seleccionar para que variable o grupo de variables se desea
información resumen.
En primer lugar permite la opción de imprimir una tabla de frecuencias
para las variables seleccionadas.
En la parte inferior de la ventana aparecen tres botones que ofrecen
nuevas ventanas con opciones. El primero de ellos, ESTADISTICAS permite
marcar el cálculo de percentiles, medidas de tendencia central, medidas de
dispersión y algunas relacionadas con la forma de la distribución de los datos.
Si se hace un click en el botón gráficos, es posible optar entre no incluir
gráficos en la salida del procedimiento o incluir gráficos de barras o gráficos
de sectores, adecuados en el caso de tener variables con valores de tipo
discreto o bien, datos categóricos. En cambio si la variable en estudio es de
tipo continua, el gráfico más apropiado es el histograma. También es posible
elegir si lo que se quiere graficar son frecuencias o porcentajes. Por último, el
botón formato está destinado a opciones de orden. Los dos criterios
disponibles son ordenar de acuerdo a los valores de la variable o según
frecuencias observadas.
Análisis exploratorio de los datos:
SPSS ofrece otras dos opciones interesantes para el análisis de los
datos. Una de ellas se encuentra en el menú ANALIZAR ESTADISTICAS
DESCRIPTIVAS DESCRIPTIVAS.
Esta ventana ofrece el cálculo de las mismas medidas que antes, pero
con la posibilidad de estandarizar los datos previamente. Esto permite
básicamente comparar datos de variables cuyas unidades de medidas son
diferentes ya que el estandarizado anula este efecto.
Otra opción se dispone en el menú ANALIZAR ESTADISTICAS
DESCRIPTIVAS EXPLORAR. En la ventana que se despliega aparecen las
todas las variables disponibles para marcarla pasarlas al renglón que
corresponda. A la derecha hay tres cuadros: el primero, “dependientes”, es al
que enviarse los nombres de las variables para la que se desea la información
requerida.
Más abajo, en el cuadro “factores” es posible utilizar una variable para
definir grupos y obtener análisis separados para cada uno de ellos. Por
último, en el renglón inferior es posible seleccionar una variable para
etiquetar o clasificar los casos de acuerdo a las clases de esa variable.
También se presentan tres botones: el de ESTADISTICOS permite elegir
que información estadística se desea reportar en la salida. Además de los
estadísticos que se ofrecen en el menú FRECUENCIAS o DESCRIPTIVAS es
posible optar por estadísticos robustos e inclusive listar valores extremos.
Esta última opción es realmente útil cuando se conoce poco sobre la variable
en estudio y también, cuando se tiene pensado aplicar alguna técnica que
pueda ver afectados sus resultados por la presencia de datos atípicos o
“raros”.
El botón GRAFICOS ofrece la posibilidad de hacer gráficos de caja,
histogramas y gráficos de tallo y hoja. Además, es posible realizar un test no
paramétrico para estudiar la normalidad de la/s variable/s y elegir alguna
transformación sobre los datos si fuera necesario. Estas opciones son
bastantes avanzadas por lo que se recomienda su utilización guiados por
algún estadístico ya que apuntan principalmente a estudiar el supuesto de
normalidad de los datos.
Con respecto al botón OPCIONES es posible elegir que actitud tomar
con respecto a los valores faltantes que aparezcan en el archivo. Estas
opciones son excluir los casos con faltantes de todos los análisis, excluirlos
únicamente para las variables en los que aparezca el faltante o crear una
categoría adicional para los faltantes.
Tablas de contingencia:
Se accede a este procedimiento a través del menú ANALIZAR
ESTADISTICAS DESCRIPTIVAS TABLAS DE CONTINGENCIA. Ofrece la
posibilidad de crear tablas con dos o más criterios de clasificación como así
también algunas pruebas y medidas de asociación para tablas de dos
clasificaciones. En este curso sólo se verá este procedimiento con fines
descriptivos ya que para la utilización de los valores de las pruebas
mencionadas es necesario tener en cuenta ciertos aspectos referidos al
diseño del estudio y poder determinar así si los supuestos que se requieren
para que los resultados de los tests sean válidos se cumplen o no.
La ventana de diálogo que se despliega es la siguiente
Como siempre, a la izquierda aparece la lista con las variables del
archivo las cuales pueden “pintarse” y pasarse hacia los cuadros de la
derecha según sea necesario. El cuadro superior “Filas” se utiliza para definir
la/s variable/s que se definen como clasificación Fila de la tabla, al igual que
las variables que se pasan al cuadro “columnas”.
Como “variables de capa” deben marcarse aquellas variables para las
que se quieren tablas cruzadas de “Filas” x “Columnas” separadas para cada
una categoría de la/s variable/s de capa. Por ejemplo, si se desea construir
una tabla de “duración de la carrera según el plan de estudio de la carrera
elegida” separada para cada sexo, en “Filas” se incluiría la variable DURAC; en
“Columnas” se ingresa PLAN y como Capa se incluye la variable SEXO.
Al pie de la ventana de diálogo aparecen tres botones. Las opciones
que ofrece el botón ESTADISTICOS se refieren a distintas medidas de
asociación entre las variables de la tabla clasificadas de acuerdo a la escala de
medida de las variables en cuestión.
El botón CASILLAS se utiliza para definir que tipo de información se
requiere en el cuerpo de la tabla. Se pueden incluir frecuencias observadas
(contando los casos a partir del archivo de datos), frecuencias esperadas (son
las que resultarían si un modelo de asociación supuesto fuera cierto y se las
utilizan para ver si ese modelo se ajusta a los datos observados), porcentajes
con respecto a totales por fila, por columna o el total general y residuos (la
diferencia entre las frecuencias observadas y esperadas).
Por último, el botón FORMATO permite definir el orden de las filas
según los valores de la variable fila.
Generación de tablas con medidas de resumen:
Otra de las opciones que ofrece el programa para presentar cuadros
con información resumen acerca de una variable o grupo de variables son las
que se presentan en el menú ANALIZAR ESTADÍSTICAS DESCRIPTIVAS
TABLAS USUALES TABLAS BÁSICAS (ANALIZE DESCRIPTIVE STATISTICS
CUSTOM TABLES BASIC TABLES).
La ventana de diálogo que se despliega es la siguiente:
En la ventana superior se ingresa la variable o grupo de variables para
las que se desea resumir información, por ejemplo la media, mediana y
modo.
A su vez, se pueden elegir variables de corte o agrupamiento para
presentar la información requerida. De esta forma se seleccionan las
variables cuyos valores formarán los grupos y se disponen en las casillas
correspondientes a filas, columnas y si es preciso en tablas separadas para
valores distintos de alguna/s variable/s.
En el botón ESTADÏSTICAS (STATISTICS) se encuentran las medidas
disponibles que serán presentadas en la tabla. Entre ellas se cuentan el
promedio, la mediana, el modo, varianza, desvío standard, porcentajes con
respecto a las filas, columnas, etc.
El botón LEYENDAS (LAYOUT) permite elegir de qué manera aparecen
los encabezados de la tabla y los títulos indicando las medidas que se
presentan entre otras.
El botón TOTALES como su nombre lo indica permite agregar totales a
la tabla, ya sean para cada variable de agrupamiento o marginales de cada
tabla.
Por último, los botones FORMATO y TITULOS permiten definir de qué
manera se señalan los valores faltantes en la tabla como así también agregar
títulos explicativos respectivamente.
Una vez que se completan todas las especificaciones, la tabla aparece
en el visor de resultados. Si se eligió alguna variable en la casilla “tablas
separadas”, este procedimiento genera tablas distintas para cada valor
distinto de la variable elegida pero en la ventana de resultados solo aparece
una de ellas. Para ver las restantes, simplemente es preciso hacer doble click
en la tabla y aparecerá un en la esquina superior izquierda una leyenda con el
nombre de la variable que define las tablas separadas y a que valor de ésta
corresponde la tabla que se encuentra visible, acompañado por una flecha la
cual permite desplegar el resto de los valores que toma la variable para
poder ver las restantes tablas. De esta manera puede observarse las distintas
tablas que genera el procedimiento.
Otra opción, un poco más sofisticada para construir tablas de este tipo
se encuentra en el menú ANALIZAR ESTADÍSTICAS DESCRIPTIVAS
TABLAS USUALES TABLAS GENERALES (ANALIZE DESCRIPTIVE
STATISTICS CUSTOM TABLES GENERAL TABLES).
En este caso la ventana de diálogo es la siguiente.
El funcionamiento de esta ventana es bastante parecido al presentado
anteriormente en el sentido que permite construir tablas con información
resumen sobre una variable o grupo de ellas discriminada de acuerdo a
variables de corte o agrupamiento que definan filas y columnas a partir de los
valores distintos en estas variables.
Una característica distintiva es que cada vez que se selecciona una
variable para las casillas “filas”, “columnas” o “leyenda” es que están
disponibles dos burbujas para elegir si los valores de la variable seleccionada
definen grupos o si para esta variable se presentan valores de resumen.
A su vez, si en alguna casilla se eligen dos o más variables también es
posible elegir entre anidar (Nest) los valores distintos de las mismas para
definir grupos que resulten de combinar los valores de cada una de ellas o si
se desea que se las trate por separado (UnNest).
Otra de los botones disponibles permite agregar a la tabla los totales
que correspondan a las variables que se eligen para definir grupos, si es que
se desea.
Por último, para las variables que se desean resumir (mostrar medidas
descriptivas de resumen) utilizando el botón EDITAR ESTADÍSTICAS (EDIT
STATISTICS) se puede elegir que medida/s se desean presentar.
Si se desean tablas separadas de acuerdo a los valores distintos de
alguna/s variable/s es preciso indicarlo en la casilla LEYENDA, y en la ventana
de resultados se verá sólo una de las tablas y las restantes se pueden mostrar
haciendo doble click sobre la tabla y eligiendo de las opciones que despliegan
en la leyenda se recorren todas las tablas generadas.
Creación de Gráficos Descriptivos:
Otra forma de crear gráficos en SPSS es utilizando el menú gráficos, el
cual despliega una serie de opciones que permite elegir el tipo de gráfico
deseado. Entre ellos es posible crear gráficos de líneas, de barras, sectores,
histogramas, etc. Como siempre, cada opción despliega ventanas de diálogo
en las que se ingresa/n la/s variable/s a graficar y distintas opciones.
Si se desea obtener rápidamente una idea de los gráficos disponibles
en el paquete como así también una ayuda rápida sobre cómo realizar el
gráfico deseado, en la opción GALERÏA (GALLERY) aparece una ventana con
las distintas opciones y la posibilidad de hacer doble click sobre el gráfico de
interés y obtener así una breve descripción del tipo de gráfico y la forma de
generarlo en SPSS.
La salida aparece en el visor de resultados y se permite la edición del
mismo haciendo simplemente un doble click en cualquier parte del mismo y
se desplegará una barra de herramientas con opciones para el cambio de
efectos de relleno, escala, tipo de líneas, marcadores de valores, definición
de títulos y etiquetas, etc.
Análisis de regresión:
Esta técnica estadística es quizá una de las más utilizadas en diversas
áreas de estudio, tales como la economía, biología, física, ciencias sociales,
etc.
El análisis de regresión es la metodología estadística para predecir
valores de una o más variables respuesta (también llamada variable
dependiente) a partir de una o más variables explicativas (variables
independientes o predictoras).
Sea X1, X2 ... Xp un conjunto de p variables explicativas que se piensan
relacionadas con la variable respuesta Y. Por ejemplo para p=2:
Y= tiempo de reparto
X1 = cantidad de productos.
X2 = distancia recorrida.
El modelo de regresión clásico establece que Y está compuesto por una
media, la cual depende de manera continua de las X’s y un error aleatorio
que da cuenta del error de medida y el efecto de variables no consideradas
explícitamente en el modelo. Por último se considera que los valores de las
variables explicativas son fijos y que el error es una variable aleatoria cuyo
comportamiento está caracterizado por ciertos supuestos distribucionales.
Específicamente el modelo de regresión lineal con dos variables
explicativas puede expresarse de la siguiente manera:
Y = 0 + 1 X1 + 2 X2 +
Dicho en otras palabras, la respuesta puede expresarse por una media
que depende de las variables explicativas o independientes + un término de
error aleatorio.
Para finalizar los supuestos que se hacen sobre los residuos o errores
aleatorios son los siguientes:
- La esperanza de los errores es igual a cero.
- La varianza de los errores es constante igual a 2.
- Los errores son no correlacionados
- Los errores se distribuyen igual e independientes según una distribución
normal.
Para realizar un Análisis de regresión utilizando el programa SPSS es
preciso hacerlo desde la opción ANALIZAR REGRESIÖN LINEAL
(analicé regression linear).
Con esta opción es posible estimar los coeficientes ’s del modelo de
regresión planteado, obtener valores ajustados y residuales del modelo de
regresión, calcular la tabla de análisis de la varianza (ANOVA) que permite
probar la bondad del modelo planteado y otras medidas adicionales para
evaluar el ajuste.
La ventana de diálogo que aparece es la que se muestra a
continuación:
En la casilla Dependiente (dependent) se ubica el nombre de la variable
que se quiere explicar por un modelo de regresión, (variable Y, dependiente
o respuesta) y en la casilla de Independientes las correspondientes variables
explicativas o X’s.
Con respecto al método hace referencia a distintas opciones que
dispone el programa para incluir las variables X’s al modelo y estas opciones
se utilizan básicamente cuando se desea encontrar el mejor modelo de
regresión para una variable Y. En este curso solo utilizaremos la opción
ENTER, es decir todas las variables que se seleccionan como independientes
o explicativas ingresan al modelo de regresión que se está ajustando.
Otra de las posibilidades que ofrece la ventana es la de ajustar el
modelo propuesto para un grupo de los casos basándose en los valores de la
variable que se seleccione en la casilla Variable de Selección (Selection
Variable). Si esta casilla se deja en blanco, todas las observaciones del archivo
se utilizarán para el ajuste del modelo. Por último, es posible utilizar los
valores o etiquetas de alguna variable para identificar casos en los gráficos
que se efectúen indicando dicha variable en la casilla Etiqueta de casos (Case
labels).
En el botón ESTADISTICAS (Statistics) se encuentran disponibles
distintas opciones acerca de que información aparecerá en la ventana de
salida o resultados: entre ellas se encuentran las estimaciones de los
parámetros del modelo, intervalos de confianza para los parámetros,
varianzas y covarianzas de los mismos. Con respecto al ajuste por default
aparece el cuadro de análisis de la varianza, medidas descriptivas,
correlaciones, etc. También aparecen algunas medidas referidos a los
residuos que aportan información al momento de corroborar los supuestos
del modelo basándose en los residuos del ajuste.
En el botón GRAFICOS (Plots) es posible definir gráficos de dispersión,
probabilísticos normales e histogramas que ayudan a la evaluación del
modelo.
Por otro lado, utilizando el botón GRABAR (save) se pueden generar
nuevas variables donde se graben los valores ajustados por el modelo de
regresión, residuales, algunas estadísticas de diagnóstico, entre otras.
Introducción al Análisis de series de tiempo:
Referido al tema Series de tiempo, el programa SPSS cuenta con varios
procedimientos, entre ellos suavizado exponencial, modelos ARIMA, e
inclusive un módulo con opciones para ajustar series estacionalmente
utilizando el programa X11 Arima.
Básicamente es preciso antes de utilizar alguno de estos menús
generar fechas utilizando la opción DATOS DEFINIR FECHAS e indicar el
tipo de fecha que se desea generar (en general, año y mes) y desde que
período se desea generar tales fechas. Si se elige el formato año y mes, el
programa genera automáticamente una variable indicadora del año, otra
para el mes y una tercera indicadora de período que es la que se utiliza
generalmente para el eje del tiempo en los gráficos que se construyan.
Para seleccionar alguno de estos procedimientos es necesario tener
una idea previa acerca de los posibles efectos que tenga la serie a analizar, ya
sea estacionalidad, tendencia o ambos.
La ventana de diálogo correspondiente al suavizado exponencial (exponential
smoothing) permite ajustar modelos simples sin tendencia ni estacionalidad
(simple), modelos que sólo presentan tendencia lineal (Holt), modelos con
tendencia lineal y estacionalidad (Winters) y modelos definidos por el
usuario (Custom).
Por su parte, la opción Autorregresión (autorregression ) permite el
ajuste de un modelo de regresión cuyos residuos siguen el comportamiento
de un proceso autorregresivo de primer orden.
El menú ARIMA permite el ajustar las series utilizando modelos
autorregresivos-promedios móviles, teniendo el usuario que definir el orden
de los procesos autorregresivos y promedios móviles respectivamente. Para
ello es importante comenzar el análisis observando la función de
autocorrelación para tener una idea del posible orden de los polinomios
mencionados.
Las ventanas de diálogo que se despliegan para cada una de las
opciones que ofrece el submenú de series de tiempo son las siguientes:
- Suavizado Exponencial: en esta ventana es posible elegir ajustar una serie
de tiempo ya sea que la misma no tenga tendencia ni estacionalidad
(modelo simple), solo tenga tendencia (modelo Holt), que tenga tendencia
lineal y estacionalidad (modelo Winters) o un modelo definido por el
usuario (custom). Si la serie tiene estacionalidad, puede mejorarse el
ajuste si primero se estiman los coeficientes estacionales con la opción
DESCOMPOSICION ESTACIONAL de este mismo submenú e indicándolo
en la casilla Factores estacionales (Seasonal Factors). Utilizando el botón
Gravar (save) es posible indicar que se guarden tanto los valores ajustados
de la serie por el modelo utilizado como así también los residuos del
ajuste. Por otro lado, el botón Parámetros (parameters) permite indicar si
se ajustará la serie utilizando valores de parámetros fijados por el usuario
o si se desea que el programa los estime iterativamente.
- Ajuste de modelos ARIMA: Esta ventana de diálogo permite ajustar
modelos Autorregresivos – Promedios móviles integrados. En el caso de
ajustar una sola serie se define como variable dependiente a la serie que
se desea ajustar y se completan las casillas correspondientes al orden
correspondiente a la parte autorregresiva (p), diferencias (d) o promedios
móviles (q), tanto para la parte ordinaria como la parte estacional
(seasonal).
- Desestacionalización utilizando el módulo X11Arima: El programa SPSS
permite ajustar series estacionalmente utilizando las opciones del
paquete X11Arima. Para ello es preciso elegir la opción que lleva este
nombre en el submenú de Series de Tiempo y la ventana de diálogo se
presenta a continuación:
En la casilla “Variables” se ingresa el nombre de la serie que se desea
estudiar. Si se desea identificar el modelo ARIMA que ajusta los datos se
marca en la casilla ARIMA, lo mismo ocurre si se desea corregir los valores
extremos de la serie (modify extremes). Además, en la esquina superior
derecha están las opciones para elegir entre modelos multiplicativos y/o
aditivos.
Por otra parte, hay botones que permiten elegir distintas opciones
para modelar la serie teniendo en cuenta el efecto “días de actividad”
(trading days), como así también elegir los distintos filtros (promedios
móviles) para la componente estacional y tendencia-ciclo.
Para terminar también dispone un botón para seleccionar que nuevas
variables se desean guardar en la hoja de datos activa (serie
estacionalmente ajustada, factores estacionales, tendencia-ciclo y
residuales).
CONCLUCION
El conocimiento y utilización de software estadístico es indispensable
hoy en día para una investigación seria en ciencias. También la toma de
decisiones dentro de muchas organizaciones se sustenta en un análisis
preciso de datos, y deberá utilizar este tipo de software.
Bien sea para describir o generalizar los datos obtenidos en nuestras
investigaciones, bien para la búsqueda de información y toma de decisiones
en otros contextos, es esencial un buen análisis de datos. El SPSS (Statistical
Package for the Social Sciences), al que injustamente se suele reducir a
programa de análisis estadístico, permite un tratamiento integrado de todas
las fases que conlleva el análisis de datos.
BIBLIOGRAFÍA
- SPSS inc. (1997) “Guía del usuario del sistema base de SPSS para
Windows.”
- Visauta Vinacua, B. (1997) “Análisis estadístico con SPSS para
Windows”. Volumen I Estadística Básica.. Ed. Mc Graw – Hill.
- Visauta Vinacua, B. (1997) “Análisis estadístico con SPSS para
Windows”. Volumen II Estadística Multivariante. B.. Ed. Mc Graw –
Hill.
ANEXOS