spss - sc448b732ab1c070a.jimcontent.com · spss puede adquirir datos de prácticamente cualquier...

Republica bolivariana de Venezuela Ministerio de la defensa para el poder popular

Universidad gran mariscal de Ayacucho Núcleo El Tigre, edo. Anzoátegui.

SPSS

INTEGRANTES: Andrea Almeida C.I. 20.548.202

Katerin Carbonell C.I.18.981.524

El Tigre, Abril 2010.

INTRODUCCION

En el mundo moderno, la necesidad de tomar decisiones más

acertadas nos obliga a conocer mejor los factores que influyen en cada

suceso; es por este motivo que el análisis de datos aparece como una

herramienta fundamental para comprender las causas y consecuencias del

comportamiento de nuestro entorno, brindándonos las bases para optimizar

los esfuerzos y recursos y así orientarlos a mejores resultados.

Con el desarrollo de nuevas tecnologías, los cálculos estadísticos

dejaron de ser una ardua tarea digna de un genio y se han convertido en una

labor relativamente sencilla que cualquier persona puede realizar. En la

actualidad existen en el mercado diversos software para el análisis de datos,

destacándose entre ellos el paquete estadístico SPSS principalmente por su

gran capacidad, la facilidad de uso y su adaptabilidad a la mayoría de las

ramas de la ciencia y los negocios.

A pesar de la utilidad del SPSS, en Latinoamérica su uso ha

permanecido reservado a sólo algunos sectores, fundamentalmente por la

aparente complejidad de manejo, así como la dificultad para acceder a los

diferentes manuales, cursos o tutoriales.

El SPSS (Statistical Package for Social Science) también es un programa

u herramienta muy bien utilizada para el dominio y análisis de información,

proveniente por ejemplo de encuestas. Es un completo sistema de análisis de

datos. SPSS puede adquirir datos de prácticamente cualquier tipo de archivo

y de bases de datos externas y utilizarlos para generar informes tabulares,

gráficos y diagramas de las distribuciones y de las tendencias, estadísticos

descriptivos y complejos análisis estadísticos.

El editor de datos le ofrece una herramienta simple y eficaz con un

diseño del tipo hoja de cálculo, que le permitirá introducir datos y examinar

el archivo de datos de trabajo.

Los gráficos, de alta resolución y con calidad de presentación, son una

parte esencial e integrada del sistema Base. La mayoría de los datos del

sistema SPSS Base y de la opción SPSS Tablas toman la forma de tablas

pivote, que resultan sumamente flexibles y que pueden modificarse

rápidamente para después copiarlas directamente en otras aplicaciones.

El SPSS posee una estructura de tipo modular que incluye un módulo

Base, además de una serie de módulos opcionales como son: Estadísticas

Profesionales; Estadísticas Avanzadas; Tablas; Tendencias; Categorías; Lisrel,

etc... El módulo Base forma el núcleo del sistema y como tal debe

permanecer residente en memoria. En él se encuentran los comandos de

lectura y transformación de datos y ficheros, los cuales nos permiten acceder

a una gran variedad de fuentes de datos como son dBase, Lotus, Excel y a

través de ODBC, Access Paradox, SQL Server, Oracle y otros muchos. También

dispone de las herramientas encargadas de realizar procedimientos

estadísticos básicos como análisis exploratorio de datos, tablas de

contingencia, comparación de medias, análisis de la varianza, pruebas no

paramétricas, correlación y regresión lineal múltiple, así como técnicas de

análisis factorial, discriminante, de conglomerados y cálculo de proximidades.

Este curso se centrará sobre todo en estos procedimientos que contiene el

módulo Base, ya que los restantes módulos están destinados a otros

procedimientos estadísticos más avanzados.

VERSIONES DEL SPSS

SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del

que han aparecido las siguientes versiones:

SPSS-X (para grandes servidores tipo UNIX)

SPSS/PC (1984, en DOS. Primera versión para computador portátil)

SPSS/PC+ (1986 (en DOS)

SPSS for Windows 6 (1992) / 6.1 para Macintosh

SPSS for Windows 7

SPSS for Windows 8

SPSS for Windows 9

SPSS for Windows 10 / for Macintosh 10 (2000)

SPSS for Windows 11 (2001) / for Mac OS X 11(2002)

SPSS for Windows 11.5 (2002)

SPSS for Windows 12 (2003)

SPSS for Windows 13 (2004): Permite por primera vez trabajar con

múltiples bases de datos al mismo tiempo.


SPSS for Macintosh 13 (2006)


SPSS for Windows 16 (Octubre de 2007): En la lista de usuarios de SPSS

"SPSSX (r) Discussion [SPSSX-L@LISTSERV. UGA. EDU]" varios

funcionarios de la empresa anunciaron previamente la salida de la

versión 16 de este software. En ella se incorporó una interfaz basada

http://es.wikipedia.org/wiki/UNIX

http://es.wikipedia.org/wiki/Windows










http://es.wikipedia.org/wiki/Macintosh



en Java que permite realizar algunas mejoras en las facilidades de uso

del sistema.

SPSS for Macintosh 16

SPSS for Linux 16

SPSS for Windows 17 (2008): Incorpora aportes importantes como el

ser multilenguaje, pudiendo cambiar de idioma en las opciones

siempre que queramos. También incluye modificaciones en el editor de

sintaxis de forma tal que resalta las palabras claves y comandos,

haciendo sugerencias mientras se escribe. En este sentido se aproxima

a los sistemas IDE que se utilizan en programación.

http://es.wikipedia.org/wiki/Lenguaje_de_programaci%C3%B3n_Java

http://es.wikipedia.org/wiki/Macintosh

http://es.wikipedia.org/wiki/Linux


MÓDULOS DEL SPSS

El sistema de módulos de SPSS, como los de otros programas (similar al de

algunos lenguajes de programación) provee toda una serie de capacidades

adicionales a las existentes en el sistema base. Algunos de los módulos

disponibles son:

Modelos de Regresión

Modelos Avanzados

o Reducción de datos: Permite crear variables sintéticas a partir

de variables colineales por medio del Análisis Factorial.

o Clasificación: Permite realizar agrupaciones de observaciones o

de variables (cluster analysis) mediante tres algoritmos distintos.

o Pruebas no paramétricas: Permite realizar distintas pruebas

estadísticas especializadas en distribuciones no normales.

Tablas: Permite al usuario dar un formato especial a las salidas de los

datos para su uso posterior. Existe una cierta tendencia dentro de los

usuarios y de los desarrolladores del software por dejar de lado el

sistema original de TABLES para hacer uso más extensivo de las

llamadas CUSTOM TABLES.

Tendencias

Categorías: Permite realizar análisis multivariados de variables

normalmente categorías. También se pueden usar variables métricas

siempre que se realice el proceso de recodificación adecuado de las

mismas.

Análisis Conjunto: Permite realizar el análisis de datos recogidos para

este tipo especifico de pruebas estadísticas.

Mapas: Permite la representación geográfica de la información

contenida en un fichero (descontinuado para SPSS 16).

Pruebas Exactas: permite realizar pruebas estadísticas en muestras

pequeñas.

Análisis de Valores Perdidos: Regresión simple basada en

imputaciones sobre los valores ausentes.

Muestras Complejas: permite trabajar para la creación de muestras

estratificadas, por conglomerados u otros tipos de muestras.

SamplePower (cálculo de tamaños muestrales)

Árboles de Clasificación: Permite formular árboles de clasificación y/o

decisión con lo cual se puede identificar la conformación de grupos y

predecir la conducta de sus miembros.

Validación de Datos: Permite al usuario realizar revisiones lógicas de la

información contenida en un fichero.sav. y obtener reportes de los

valores considerados extraños. Es similar al uso de sintaxis o scripts

para realizar revisiones de los ficheros. De la misma forma que estos

mecanismos es posterior a la digitalización de los datos.

SPSS Programmability Extension (SPSS 14 en adelante). Permite

utilizar el lenguaje de programación Python para un mejor control de

diversos procesos dentro del programa que hasta ahora eran

realizados principalmente mediante scripts (con el lenguaje SAX Basic).

Existe también la posibilidad de usar las tecnologías .NET de Microsoft

para hacer uso de las librerías del SPSS. Aunque algunos usuarios han

http://es.wikipedia.org/wiki/An%C3%A1lisis_conjunto

http://es.wikipedia.org/wiki/Python

http://es.wikipedia.org/wiki/.NET

cuestionado sobre la necesidad de incluir otros lenguajes, la empresa

no tiene esto entre sus objetivos inmediatos.

Desde el SPSS/PC hay una versión adjunta denomina SPSS Student que es

un programa completo de la versión correspondiente pero limitada en su

capacidad en cuanto al número de registros y variables que puede procesar.

Esta versión es para fines de enseñanza del manejo del programa.

MANEJO

SPSS tiene un sistema de ficheros en el cual el principal son los archivos de

datos (extensión. SAV). Aparte de este tipo existen otros dos tipos de uso

frecuente:

Archivos de salida (output, extensión. SPO): en estos se despliega toda

la información de manipulación de los datos que realizan los usuarios

mediante las ventanas de comandos. Son susceptibles de ser

exportados con varios formatos (originalmente HTML, RTF o TXT,

actualmente la versión 15 incorpora la exportación a PDF junto a los

formatos XLS y DOC que ya se encontraban en la versión 12).

Archivos de sintaxis (extensión. SPS): Casi todas las ventanas de SPSS

cuentan con un botón que permite hacer el pegado del proceso que el

usuario desea realizar. Lo anterior genera un archivo de sintaxis donde

se van guardando todas las instrucciones que llevan a cabo los

comandos del SPSS. Este archivo es susceptible de ser modificado por

el usuario. Muchos de los primeros usuarios del SPSS suelen escribir

estos archivos en vez de utilizar el sistema de pegado del programa.

Existe un tercer tipo de fichero: el fichero de scripts (extensión. SBS). Este

fichero es utilizado por los usuarios más avanzados del software para generar

rutinas que permiten automatizar procesos muy largos y/o complejos.

Muchos de estos procesos suelen no ser parte de las salidas estándar de los

comandos del SPSS, aunque parten de estas salidas. Buena parte de la

funcionalidad de los archivos de scripts ha sido ahora asumida por la

inserción del lenguaje de programación Python en las rutinas de sintax del

SPSS. Procedimientos que antes solo se podían realizar mediante scripts

ahora se pueden hacer desde el sintax mismo.

El programa cuando se instala trae un determinado número de ejemplos o

utilidades de casi todos los ficheros en cuestión. Estos son usados para

ilustrar algunos de los ejemplos de uso del programa.

FICHERO DE DATOS DE SPSS

Los ficheros de datos en formato SPSS tienen en Windows la extensión.

SAV. Al abrir un fichero de datos con el SPSS, vemos la vista de datos, una

tabla en la que las filas indican los casos y las columnas las variables. Cada

celda corresponde al valor que una determinada variable adopta en un cierto

caso.

Además de esta vista de datos, en las últimas versiones del programa

existe una vista de variables en la que se describen las características de cada

una. En esta vista las filas corresponden a cada variable y las columnas nos

permiten acceder a sus características:

Nombre, limitado a 8 caracteres.

Tipo de variable (compárese este listado de opciones con los tipos de

variables estadísticas existentes)

o Numérico, número en formato estándar)

o Coma decimal, número con comas cada tres posiciones y con un

punto como delimitador de los decimales

o Punto decimal, número con puntos cada tres posiciones y con

una coma como límite delimitador de los decimales.

o Notación científica, número que se expresa con un formato tal

que se sigue de una E y un número que expresa la potencia de

10 a la que se multiplica la parte numérica previa

o Fecha

o Moneda dólar, formato numérico con el que se expresan

cantidades en dólares

http://es.wikipedia.org/wiki/Variable_estad%C3%ADstica

o Moneda del usuario, formato numérico con el que se expresan

cantidades en la moneda definida en la pestaña de monedas del

cuadro de diálogo "Opciones"

o Cadena de caracteres o variable alfanumérica

Tamaño total

Tamaño de la parte decimal

Etiqueta de la variable

Etiquetas para los valores

Valores perdidos

Espacio que ocupa en la vista de datos

Alineación de la variable en la vista de datos

Escala de medición.

Algunos usuarios pasan por alto las características de las variables cuando

se trabaja en la base de datos. Sin embargo, cuando se utilizan scripts o

Python las características de las variables pueden tomar gran relevancia en la

construcción de procedimientos ad-hoc.

FICHERO DE SINTAXIS DE SPSS

Se pueden generar estos archivos de sintax con la ayuda del programa

mismo, pues en casi todas las ventanas donde se realizan tareas en el SPSS

existe un botón "Paste". Este botón cierra la ventana en cuestión y guarda la

sintaxis de las acciones seleccionadas en dicha ventana. Una vez salvado este

archivo es susceptible de modificación.

La sintaxis tal cual se presenta a continuación fue producida

directamente con el SPSS. Este programa le da un formato legible a la

sintaxis, formato que el software en algunos casos no requiere para su

correcto uso.

Otra peculiaridad de las sintaxis del SPSS es que no son "case

sensitive". Ante lo cual es común ver sintaxis escritas en solo mayúsculas,

solo minúsculas o bien una combinación propia de cada usuario. Esta

situación se modifica para aquellas personas que hacen uso de Python dentro

de sus sintaxis, pues este es un lenguaje sensitivo a las variaciones entre

mayúsculas y minúsculas. Esto obliga a estos usuarios a escribir sintaxis con

mayor cuidado.

Una de las ventajas de este paquete es su facilidad en el manejo ya que

mediante el despliegue de un menú interactivo permite realizar todo tipo de

operaciones sobre los datos como así también aplicar distintas técnicas

estadísticas.

Los pasos básicos en el análisis de datos utilizando este paquete son:

Creación de la base de datos desde SPSS o bien la captura de los

datos desde otro archivo.

Selección de los procedimientos de análisis a emplear.

Selección de las variables para los distintos análisis.

Análisis de los resultados.

En este documento se desarrollan estos cuatro pasos poniendo

especial énfasis en el primero de ellos, la manipulación de datos y el análisis

descriptivo de los mismos. A continuación algunas características generales

del programa, la forma en que se inicia una sesión y se cargan los datos, de

que manera se pueden transformar los datos, como re codificar variables,

ordenar los datos, particionar y unir bases de datos. Por último se presentan

algunos procedimientos estadísticos que ofrece el programa y que se

consideran de utilidad para el trabajo particular.

Pantallas básicas:

Durante el transcurso de una sesión en SPSS se activan básicamente dos pantallas: la que corresponde al editor de datos y el visor de resultados.

La primera de ellas se activa automáticamente cuando se inicia la

sesión, mientras que la otra se habilita al efectuar algún procedimiento. Esta

última se encuentra subdividida en dos partes: a la izquierda de la pantalla

aparece una estructura de árbol que muestra los procedimientos realizados y

en que orden se efectuaron. A la derecha aparecen los resultados

propiamente dichos, tales como tablas de frecuencias, gráficos, los

resultados del cálculo de medidas descriptivas, etc.

Por supuesto, para obtener resultados de cualquier tipo es preciso

tener cargado un conjunto de datos, ya sea mediante el ingreso directo de

los mismos o mediante la captura de la información a partir de otro archivo.

Otra característica del programa que facilita su utilización es el uso de

ventanas de diálogo que permiten elegir las variables a utilizar y especificar

las opciones del procedimiento. Al respecto, todas estas ventanas funcionan

de la misma manera: en general, a la izquierda aparece un cuadro donde se

muestra la lista de variables del archivo disponibles para el procedimiento

que se desea realizar.

Simplemente se marcan haciendo un click con el botón izquierdo del

mouse arriba del nombre de la variable que corresponde quedando marcada

con lo cual se habilita el botón “flecha” que permite pasar de cuadro esa

variable, o directamente con un doble click del mouse. De la misma manera,

cuando las especificaciones mínimas del procedimiento ya están completas

se habilita el botón ACEPTAR (OK). Si esto no ocurre, significa que hay alguna

especificación incorrecta o incompleta por lo cual hay que revisar las

opciones y variables ingresadas.

Inicio de una sesión:

Para comenzar una sesión en SPSS se hace simplemente un doble click

sobre el ícono correspondiente al programa y automáticamente se activa la

ventana de edición de datos cuyo aspecto es semejante al de una planilla de

cálculo.

Como se dijo anteriormente, el primer paso en cualquier análisis

consta o bien en la carga de los datos directamente o si éstos están grabados

en otro archivo (supongamos en una planilla de cálculo EXCEL), en la captura

de los mismos.

SPSS organiza la información de la siguiente manera: cada una de las

filas constituye un caso o individuo y cada columna representa una variable

o atributo observado en el individuo. De esta manera, al final de la carga de

datos se obtiene una matriz de datos con n filas y p columnas (n = cantidad

de individuos, p = cantidad de variables).

Teniendo en cuenta este formato que utiliza el programa, se comienza

la carga en la primera fila y primera columna de la planilla y no es aconsejable

dejar filas en blanco intercaladas con filas completas ya que el programa

asume que para esos individuos no se tiene información (valores perdidos del

sistema). Más aún, si durante la carga de los datos quedan celdas sin ningún

dato, el programa asigna un punto ‘.’ indicando que es un valor perdido para

ese individuo y variable en cuestión.

Otra característica del programa es que mantiene activo sólo un

archivo de datos a diferencia de una planilla de datos en el que se pueden

tener múltiples hojas activas.

Carga directa de los datos:

Para comenzar a cargar información en un archivo SPSS es preciso

tener en cuenta las características de variable que aparecen en el sistema

definidas por omisión. El formato es de tipo numérico, con ocho caracteres

de extensión para la parte entera y dos posiciones para la parte decimal,

escala de medida numérica (escala de razón) y alineación a la derecha de las

celdas.

Si el formato mencionado no se corresponde con el de la información

que se desea ingresar, es posible cambiar alguno/s de estos atributos

utilizando la opción DEFINIR VARIABLE (en inglés, “define variable”)

disponible en el menú desplegable DATOS (data) de la barra de menúes o

posicionado con el mouse sobre el encabezado de la columna (variable) en

cuestión utilizando el botón derecho del mouse.

La ventana de diálogo que se despliega es la siguiente:

Como se ve, es posible cambiar el nombre de la variable que el sistema

asigna por default (VAR00001) por el que el usuario desee, teniendo en

cuenta que éste no puede superar los 8 caracteres de extensión, no se hace

distinción entre minúsculas y mayúsculas y que no es posible nombrar de la

misma manera dos o más variables en la misma base.

Además en esta ventana aparecen cuatro botones: TIPO, ETIQUETAS,

VALORES PERDIDOS y FORMATO DE COLUMNA. El primero de ellos se utiliza

para elegir el tipo de variable que se desea definir, a saber: numérico,

fechas, moneda, notación científica, alfanumérico, entre otros.

El segundo botón muestra la siguiente ventana y permite ingresar una

etiqueta de variable cuya extensión puede alcanzar los 256 caracteres de

extensión y a su vez, también es posible definir etiquetas de valor para cada

valor distinto que tome la variable si es preciso, por ejemplo:

Por último los botones VALORES PERDIDOS y FORMATO DE COLUMNA

ofrecen distintas opciones para la definición de valores faltantes y algunas

características con respecto al ancho de la columna y tipo de alineación

respectivamente.

Un aspecto interesante cuando se cargan estos datos es que si se

utiliza el modo “ETIQUETAS” (disponible en el menú VISTA ETIQUETAS DE

VALOR o en inglés VIEW VALUE LABELS) es posible ver en el visor de datos

el rótulo que se corresponde con los valores ingresados. Además como

opción de carga de datos es posible en lugar de tipear el valor de la variable,

elegir del conjunto de rótulos definidos cual es el valor que se desea ingresar.

Para ello, con el cursor en la celda en cuestión y el modo etiquetas activado,

con el botón derecho del mouse se despliega un menú con la opción “Elegir

valores desde las etiquetas” (en inglés, pick values from labels).

Suponiendo que la variable a ingresar sea el sexo, cuyos valores y

rótulos sean “1= femenino” y “2= masculino” respectivamente, se pueden

cargar los valores 1 o 2 directamente, o bien eligiendo del conjunto de

rótulos los valores “femenino” o “masculino”. De esta manera, siempre se

cargarán valores válidos para la variable lo cual resulta muy importante para

no cometer errores que afecten la consistencia de los datos codificados.

Por último, éstas etiquetas serán utilizadas como rótulos en las salidas

de los distintos procedimientos que se apliquen como ser tablas de

frecuencias o gráficos.

Importación de datos a partir de una planilla de cálculo:

Si la planilla a importar está grabada en formato Excel 5 o superior

pero los datos están contenidos en una sola hoja de cálculo, primero hay que

grabarla en versión Excel 4 y luego proceder a su captura. Para ello, se utiliza

la opción ARCHIVO ABRIR (FILE OPEN) de la barra de menúes y

seleccionar la extensión .xls (archivo excel) como así también especificar en

que subdirectorio está guardada la planilla. Una vez marcada la hoja que se

desea abrir, el programa muestra una ventana de diálogo como la que

aparece a continuación:

Como es común que en la primera fila de la planilla Excel aparezcan los

encabezados con los nombres de las variables, cuando se capturan los datos

es necesario aclararlo haciendo click en el cuadradito “leer nombres de

variables” que aparece a la izquierda de la ventana de diálogo si es que

efectivamente en la primera fila de la planilla se encuentran los nombres de

las columnas. Por otra parte, si la información que se desea recuperar está

grabada en un rango de la hoja, puede especificarse el rango en cuestión en

el renglón que aparece en la misma ventana, por ejemplo, A1:W290.

Por otra parte, si los datos que se necesitan están grabados en un

archivo EXCEL 5.0 o superior y además están ordenados en dos o más hojas

de cálculo, o bien solo se desea importar un subgrupo de registros que

cumplan ciertas condiciones, la forma de recuperar estos datos es creando

una consulta.

Para ello, seleccionando del menú ARCHIVO la opción CAPTURA DE

BASES DE DATOS NUEVA CONSULTA (DATABASE CAPTURE NEW

QUERY).

En este momento se despliega un asistente que permite ir armando

paso a paso la consulta deseada, siguiendo la secuencia utilizando los

botones “siguientes” y “atrás” que aparecen al pie de la ventana de diálogo.

Como puede verse en el cuadro, permite la importación de datos

grabados en distintos formatos: planillas Excel, Bases de datos Microsoft

Access, archivos de texto entre otros.

En este curso se verá específicamente la captura de datos provenientes

de planillas de cálculo Excel.

Una vez seleccionado el archivo a importar, aparecen en la ventana

izquierda todas las hojas que lo componen para su selección. En esta

ventana, haciendo click en el signo “+” se despliega la lista de variables que

componen la hoja, con lo cual se puede elegir un subgrupo de ellas para

importarlas a SPSS.

Por otra parte, si se desea trabajar con la hoja completa, haciendo

doble click sobre el nombre de la misma, automáticamente quedan todas las

variables seleccionadas para su importación.

Además, si lo que se tiene en cada hoja de cálculo son distintas

variables para el mismo conjunto de registros (individuos) y existe una

variable que permita relacionar los registros de cada hoja, es posible

identificar tales relaciones cuando se genera la consulta para que los datos

correspondientes al mismo individuo sean importados en un solo registro.

Otra de las posibilidades que ofrece el programa es importar los datos

que cumplan con cierta condición, lo cual puede hacerse desde la siguiente

pantalla:

Con el cursor ubicado en la primera celda de la columna Expresión 1, se

despliega una lista con todas las variables del archivo, de la cual se puede

elegir una de ellas para escribir la primera condición que se desea que

cumplan los registros a importar basados en esta variable elegida. La

columna relación permite elegir entre un conjunto de símbolos tales como

igual, distinto, mayor, menor, mayor o igual y menor o igual para poder

escribir la condición deseada. En la columna Expresión 2 nuevamente es

posible elegir entre el conjunto de variables disponibles o bien ingresar un

valor para la variable seleccionada en Expresión 1. Si se desea incorporar más

de una condición, éstas se van vinculando eligiendo de la columna conector

la opción “y” u “o” según se desea que las condiciones se cumplan

simultáneamente o al menos una de las condiciones se cumpla para la

importación de los datos.

Si el usuario así lo desea, puede guardar estas especificaciones en un

archivo para que la próxima vez que desee trabajar con este conjunto de

datos, el programa realice la selección e importación directamente. Las

especificaciones de la consulta pueden guardarse en un archivo con

extensión .spq. En esa ocasión, deberá utilizar la opción CAPTURA DE BASES

DE DATOS CORRER CONSULTA (DATABASE CAPTURE RUN QUERY).

Con los datos ya capturados, pueden realizarse cambios de formato de

variables y definir rótulos tanto para las variables como así también para los

valores que asumen siguiendo los pasos antes detallados.

Transformación de valores de los datos: A diferencia de una planilla de cálculo, SPSS no permite el ingreso de

fórmulas como valor de una celda. Si es necesario definir nuevas variables

que resultan de operaciones a partir de variables ya existentes puede

utilizarse el menú TRANSFORMAR, eligiendo la opción CALCULAR VARIABLE

(TRANSFORM COMPUTE VARIABLE). A continuación se muestra la

ventana de diálogo:

Esta opción permite efectuar operaciones de tipo matemáticas, lógicas

e inclusive incluir restricciones utilizando el botón SI... En la ventana

“Variable de destino” se debe especificar el nombre de la nueva variable y en

“Expresión numérica” se pueden incluir variables ya existentes marcándolas

con un click y apretando la flecha de la derecha para pasarlas de ventana,

como así también se puede escoger alguna de las funciones que aparecen a

la derecha y pasarlas a la ventana de expresión utilizando la flecha superior.

Una vez completada la expresión, se presiona ACEPTAR y en el editor de

datos aparecerá la nueva variable.

Recodificación de variables: Otra posibilidad que permite el programa es cambiar los valores que

asume una de las variables, ya sea por medio de una reasignación de valores

sobre la misma variable o bien creando una nueva variable.

Por ejemplo, para la variable sexo se tienen definidos dos valores de la

siguiente manera: 1 = “femenino” – 2 = ”masculino”. En algún momento

puede surgir la necesidad de cambiar esa asignación a esta otra: 1 =

“femenino” - 0 =”masculino”. Para ello, con la opción TRANSFORMAR

RECODIFICAR (TRANSFORM RECODE...) y eligiendo alguna de las dos

opciones: que la recodificación la realice en la misma variable o que genere

otra distinta, aparecerá según corresponda alguna de las ventanas de diálogo

siguientes:

Como puede observarse en ambas ventanas aparece un botón

VALORES NUEVOS Y VIEJOS (OLD AND NEW VALUES) en el que se ingresa la

nueva codificación de la variable. Otra de las opciones disponibles es definir

alguna restricción al cambiar la codificación, utilizando el botón SI... que se

presenta para tal fin. En el caso de recodificar la variable en cuestión

definiendo una nueva, la ventana de diálogo permite además de especificar

el nombre de la nueva variable, la posibilidad de definir una etiqueta para

esta última. Como siempre, una vez definidas todas las opciones se pulsa el

botón ACEPTAR.

Como cambiar el orden de los datos: Otra herramienta de interés cuando se trabaja con un gran conjunto de

datos es la que refiere al orden en que se visualizan los datos e inclusive

algunos procedimientos requieren que los datos estén ordenados de acuerdo

a ciertos criterios antes de realizar la operación en cuestión. Así, SPSS por

medio de la opción DATOS ORDENAR CASOS (DATA SORT CASES)

permite cambiar el orden de las observaciones de la base. Esta operación

puede realizarse utilizando como criterios de orden tanto variables

numéricas como alfanuméricas, en orden ascendente o descendente.

Además se permite incluir más de un criterio (variable) de orden. Por

ejemplo, puede ser necesario querer ordenar la base según “categoría de

empleo” (1° criterio) Y “edad” (2° criterio). De esta manera, el programa

comienza ordenando los registros según los valores de la primera variable y

para los valores repetidos de ésta, se ordenan los datos utilizando la segunda

variable seleccionada.

Selección de casos:

Cuando se presentó el módulo de captura de datos desde otros

archivos, se mencionó la posibilidad de importar solo un subgrupo de

individuos de la base incluyendo en la consulta una restricción.

Otra posibilidad para seleccionar solo un grupo de individuos es por

medio de la opción DATOS SELECCIONAR CASOS (DATA SELECT CASES)

Aparecerá una ventana de diálogo como la que se presenta más

adelante en la cual se puede optar entre distintas alternativas. La primera de

ellas es seleccionar todos los casos y es el modo en que se encuentra SPSS

por omisión.

La segunda alternativa es definir una condición a partir de los valores

de una o más variables del archivo para elegir los casos que cumplan con ella.

Al elegir esta opción se activa el botón SI... (IF...) para poder ingresar la

condición en cuestión.

La tercera posibilidad que ofrece la ventana es la selección aleatoria de

casos, ya sea un porcentaje del archivo o un número exacto de casos.

Si dentro del conjunto de variables alguna de ellas ha sido definida

utilizando la opción “definir fechas” es posible seleccionar casos utilizando

dicha variable.

Por último, si se cuenta con una variable dicotómica, es decir que solo

tome valores 0 o 1 indicando ausencia o presencia de cierto atributo, la

misma puede utilizarse como variable de filtrado.

Al pie de la ventana de diálogo aparecen dos burbujas que permiten

optar entre solo filtrar los casos no seleccionados, es decir en la ventana de

edición de datos, los casos no seleccionados aparecerán con el número de

fila tachado, o bien reemplazar el archivo de datos actual por aquel en que

sólo aparecen los casos seleccionados. Una de las precauciones que deben

tenerse cuando se utiliza esta opción es que si se graba este archivo sin

cambiar el nombre del mismo, no podrán recuperarse los casos borrados. En

cambio, si se eligió el modo filtrado, usando nuevamente la ventana de

diálogo de selección de casos y eligiendo la opción “seleccionar todos los

casos”, se recuperan los datos originales para su uso.

Pegado de Bases: agregado de variables:

Puede ocurrir que en alguna oportunidad se generen más de una base

a partir de la información de una encuesta. Por ejemplo, puede tenerse una

base que contenga únicamente los datos personales de las personas

encuestadas y otra base en la que se registran las variables de un módulo

específico de una encuesta. Si en algún momento se necesita tener toda la

información en un solo archivo, esto puede hacerse utilizando la opción

DATOS FUNDIR ARCHIVOS AGREGAR VARIABLES (DATA MERGE

FILES ADD VARIABLES).

Para realizar a cabo esta operación es necesario tener ciertas

precauciones. Como puede verse en la ventana de diálogo, se identifican las

variables del archivo activo con un (*) mientras que las variables del otro

archivo (archivo externo) se identifican con (+). Para llevar a cabo este

agregado de variables, es posible aparear los registros de ambas bases si lo

que se intenta es agregar nueva información para el mismo conjunto de

registros de la base que se encuentra activa. Para ello es preciso que ambos

archivos tengan al menos una variable o un conjunto de ellas que permitan

identificar claramente cada registro (individuo) y que además estén

ordenados con el mismo criterio y en orden ascendente. De otra manera, el

programa “pegará” las nuevas columnas al archivo sin ningún apareamiento

de los registros.

Por otro lado, pueden elegirse cuáles son las variables que se desean

incluir en el nuevo archivo y renombrar alguna de ellas si es que hace falta.

No necesariamente ambos archivos tendrán los mismos individuos, con

lo cual se ofrecen tres opciones: que ambos archivos aporten individuos para

el nuevo fichero de datos, tomar como base el archivo externo o bien tomar

como base los casos presentes en el archivo activo. Para esto es necesario

que en ambas bases se tenga una variable de identificación de individuos

(variable clave) y que ambas bases estén ordenadas de la misma manera

según esa variable clave.

Pegado de Bases: agregado de individuos:

Otra posibilidad es que se tengan en dos bases distintas, dos grupos de

individuos diferentes y que en algún momento se desee juntarlos en una

base común. En este caso, debe tenerse la seguridad que ambas bases

tengan la misma estructura, es decir las mismas variables definidas con el

mismo nombre, formato y longitud. En ese caso, utilizando la ventana de

diálogo que se despliega al seleccionar la opción DATOS FUNDIR

ARCHIVOS AGREGAR CASOS (DATA MERGE FILES ADD CASES) se

puede seleccionar el archivo que se desea pegar con la base activa.

Si existieran variables no coincidentes en ambos archivos, las variables

del archivo activo se identifican utilizando (*) y las del archivo externo con

(+). También se encuentra disponible la opción de renombrar alguna variable

si así se desea. Otra posibilidad es la de “casar” variables que aparecen en los

dos archivos pero con nombres distintos o con distintos formatos. Para ellos

se seleccionan las dos variables en cuestión, se pulsa el botón EMPAREJAR

(PAIR) y aparecerán en la ventana de la derecha indicando que esa variable

aparecerá en el nuevo archivo y se utilizará como nombre de la variable el

utilizado en el archivo activo. Se finaliza la operación pulsando ACEPTAR.

Generación de un archivo resumen:

Si se desea generar a partir de la base de datos un nuevo archivo que

resuma información de los individuos al guardar información “agregada” (por

ejemplo generar registros con valores promedios de alguna característica

según grupos de individuos u otra medida que resuma información del grupo

al cual representa).

Para esto, se selecciona la opción DATOS AGREGAR (DATA

AGGREGATE...) y se despliega la siguiente ventana de diálogo:

Como puede verse aparecen dos cuadros, uno en el que se definen las

variables de corte o agrupamiento, por ejemplo, categoría de empleo y

clasificación de minoría. Más abajo aparece el cuadro de variables

“agregadas”, por ejemplo el salario. Con respecto a las variables elegidas en

este cuadro, debe tenerse la precaución de que las mismas sean numéricas

(de otro forma no tendría sentido calcular promedios, máximos, mínimos,

etc.). Pulsando la tecla función que aparece debajo del cuadro de variables

agregadas es posible elegir que información se desea guardar. Entre las

opciones figuran el promedio (es la opción que aparece en la figura), el valor

máximo, el mínimo, desvío estándar, entre otros. Otra información

disponible para ser incluida es la cantidad de casos que se presenta en cada

grupo definido o dicho de otra manera, es posible definir una nueva variable

que señale que un registro en cuestión resume la información de N_BREAK

individuos de la base original. Para ello se tilda esta opción en el cuadradito

que aparece al pie de la ventana de diálogo y si bien N_BREAK es el nombre

que el programa asigna por default, es posible cambiarlo. También puede

optarse entre crear un nuevo archivo de datos y elegir el nombre del mismo

como así también donde almacenarlo (utilizando el botón ARCHIVO) o bien,

reemplazar el archivo actual. Nuevamente, si se opta por esto último debe

tenerse la precaución de guardar el nuevo archivo con un nombre distinto al

fichero que le dio origen, ya que se perderá la información original.

División del archivo de datos. Si se desean realizar análisis separados para subgrupos del archivo es

posible dividir la base utilizando la opción DATOS SEGMENTAR ARCHIVO

(DATA SPLIT FILE) basándose en los valores de una o más variables de

agrupamiento (pueden utilizarse hasta 8 variables). Si se seleccionan varias

variables de agrupamiento, es necesario que la base completa esté ordenada

con el mismo criterio de agrupamiento definido. Es por esto que aparecen

dos burbujas que permiten indicar si los datos ya están ordenados de

acuerdo a esos criterios o si es necesario ordenar los datos para luego

realizar la segmentación del archivo.

Esta operación permite definir distintos grupos que serán utilizados

posteriormente para análisis de tipo comparativo.

Análisis de la Información: estadísticas descriptivas.

Una práctica usual en todo estudio es la de realizar un primer análisis

descriptivo de la información recopilada. Para ello, SPSS ofrece varias

herramientas, entre ellas la construcción de tablas de frecuencias, cálculo de

algunas medidas como ser promedios, medianas, modos, desvíos estándar,

etc. además de la posibilidad de construir gráficos que ayudan a la

visualización de los resultados obtenidos.

Construcción de Tablas de Frecuencias:

Utilizando la opción ANALIZAR ESTADISTICAS DESCRIPTIVAS

FRECUENCIAS aparecerá una ventana de diálogo como la siguiente la cual

permitirá seleccionar para que variable o grupo de variables se desea

información resumen.

En primer lugar permite la opción de imprimir una tabla de frecuencias

para las variables seleccionadas.

En la parte inferior de la ventana aparecen tres botones que ofrecen

nuevas ventanas con opciones. El primero de ellos, ESTADISTICAS permite

marcar el cálculo de percentiles, medidas de tendencia central, medidas de

dispersión y algunas relacionadas con la forma de la distribución de los datos.

Si se hace un click en el botón gráficos, es posible optar entre no incluir

gráficos en la salida del procedimiento o incluir gráficos de barras o gráficos

de sectores, adecuados en el caso de tener variables con valores de tipo

discreto o bien, datos categóricos. En cambio si la variable en estudio es de

tipo continua, el gráfico más apropiado es el histograma. También es posible

elegir si lo que se quiere graficar son frecuencias o porcentajes. Por último, el

botón formato está destinado a opciones de orden. Los dos criterios

disponibles son ordenar de acuerdo a los valores de la variable o según

frecuencias observadas.

Análisis exploratorio de los datos:

SPSS ofrece otras dos opciones interesantes para el análisis de los

datos. Una de ellas se encuentra en el menú ANALIZAR ESTADISTICAS

DESCRIPTIVAS DESCRIPTIVAS.

Esta ventana ofrece el cálculo de las mismas medidas que antes, pero

con la posibilidad de estandarizar los datos previamente. Esto permite

básicamente comparar datos de variables cuyas unidades de medidas son

diferentes ya que el estandarizado anula este efecto.

Otra opción se dispone en el menú ANALIZAR ESTADISTICAS

DESCRIPTIVAS EXPLORAR. En la ventana que se despliega aparecen las

todas las variables disponibles para marcarla pasarlas al renglón que

corresponda. A la derecha hay tres cuadros: el primero, “dependientes”, es al

que enviarse los nombres de las variables para la que se desea la información

requerida.

Más abajo, en el cuadro “factores” es posible utilizar una variable para

definir grupos y obtener análisis separados para cada uno de ellos. Por

último, en el renglón inferior es posible seleccionar una variable para

etiquetar o clasificar los casos de acuerdo a las clases de esa variable.

También se presentan tres botones: el de ESTADISTICOS permite elegir

que información estadística se desea reportar en la salida. Además de los

estadísticos que se ofrecen en el menú FRECUENCIAS o DESCRIPTIVAS es

posible optar por estadísticos robustos e inclusive listar valores extremos.

Esta última opción es realmente útil cuando se conoce poco sobre la variable

en estudio y también, cuando se tiene pensado aplicar alguna técnica que

pueda ver afectados sus resultados por la presencia de datos atípicos o

“raros”.

El botón GRAFICOS ofrece la posibilidad de hacer gráficos de caja,

histogramas y gráficos de tallo y hoja. Además, es posible realizar un test no

paramétrico para estudiar la normalidad de la/s variable/s y elegir alguna

transformación sobre los datos si fuera necesario. Estas opciones son

bastantes avanzadas por lo que se recomienda su utilización guiados por

algún estadístico ya que apuntan principalmente a estudiar el supuesto de

normalidad de los datos.

Con respecto al botón OPCIONES es posible elegir que actitud tomar

con respecto a los valores faltantes que aparezcan en el archivo. Estas

opciones son excluir los casos con faltantes de todos los análisis, excluirlos

únicamente para las variables en los que aparezca el faltante o crear una

categoría adicional para los faltantes.

Tablas de contingencia:

Se accede a este procedimiento a través del menú ANALIZAR

ESTADISTICAS DESCRIPTIVAS TABLAS DE CONTINGENCIA. Ofrece la

posibilidad de crear tablas con dos o más criterios de clasificación como así

también algunas pruebas y medidas de asociación para tablas de dos

clasificaciones. En este curso sólo se verá este procedimiento con fines

descriptivos ya que para la utilización de los valores de las pruebas

mencionadas es necesario tener en cuenta ciertos aspectos referidos al

diseño del estudio y poder determinar así si los supuestos que se requieren

para que los resultados de los tests sean válidos se cumplen o no.

La ventana de diálogo que se despliega es la siguiente

Como siempre, a la izquierda aparece la lista con las variables del

archivo las cuales pueden “pintarse” y pasarse hacia los cuadros de la

derecha según sea necesario. El cuadro superior “Filas” se utiliza para definir

la/s variable/s que se definen como clasificación Fila de la tabla, al igual que

las variables que se pasan al cuadro “columnas”.

Como “variables de capa” deben marcarse aquellas variables para las

que se quieren tablas cruzadas de “Filas” x “Columnas” separadas para cada

una categoría de la/s variable/s de capa. Por ejemplo, si se desea construir

una tabla de “duración de la carrera según el plan de estudio de la carrera

elegida” separada para cada sexo, en “Filas” se incluiría la variable DURAC; en

“Columnas” se ingresa PLAN y como Capa se incluye la variable SEXO.

Al pie de la ventana de diálogo aparecen tres botones. Las opciones

que ofrece el botón ESTADISTICOS se refieren a distintas medidas de

asociación entre las variables de la tabla clasificadas de acuerdo a la escala de

medida de las variables en cuestión.

El botón CASILLAS se utiliza para definir que tipo de información se

requiere en el cuerpo de la tabla. Se pueden incluir frecuencias observadas

(contando los casos a partir del archivo de datos), frecuencias esperadas (son

las que resultarían si un modelo de asociación supuesto fuera cierto y se las

utilizan para ver si ese modelo se ajusta a los datos observados), porcentajes

con respecto a totales por fila, por columna o el total general y residuos (la

diferencia entre las frecuencias observadas y esperadas).

Por último, el botón FORMATO permite definir el orden de las filas

según los valores de la variable fila.

Generación de tablas con medidas de resumen:

Otra de las opciones que ofrece el programa para presentar cuadros

con información resumen acerca de una variable o grupo de variables son las

que se presentan en el menú ANALIZAR ESTADÍSTICAS DESCRIPTIVAS

TABLAS USUALES TABLAS BÁSICAS (ANALIZE DESCRIPTIVE STATISTICS

CUSTOM TABLES BASIC TABLES).

La ventana de diálogo que se despliega es la siguiente:

En la ventana superior se ingresa la variable o grupo de variables para

las que se desea resumir información, por ejemplo la media, mediana y

modo.

A su vez, se pueden elegir variables de corte o agrupamiento para

presentar la información requerida. De esta forma se seleccionan las

variables cuyos valores formarán los grupos y se disponen en las casillas

correspondientes a filas, columnas y si es preciso en tablas separadas para

valores distintos de alguna/s variable/s.

En el botón ESTADÏSTICAS (STATISTICS) se encuentran las medidas

disponibles que serán presentadas en la tabla. Entre ellas se cuentan el

promedio, la mediana, el modo, varianza, desvío standard, porcentajes con

respecto a las filas, columnas, etc.

El botón LEYENDAS (LAYOUT) permite elegir de qué manera aparecen

los encabezados de la tabla y los títulos indicando las medidas que se

presentan entre otras.

El botón TOTALES como su nombre lo indica permite agregar totales a

la tabla, ya sean para cada variable de agrupamiento o marginales de cada

tabla.

Por último, los botones FORMATO y TITULOS permiten definir de qué

manera se señalan los valores faltantes en la tabla como así también agregar

títulos explicativos respectivamente.

Una vez que se completan todas las especificaciones, la tabla aparece

en el visor de resultados. Si se eligió alguna variable en la casilla “tablas

separadas”, este procedimiento genera tablas distintas para cada valor

distinto de la variable elegida pero en la ventana de resultados solo aparece

una de ellas. Para ver las restantes, simplemente es preciso hacer doble click

en la tabla y aparecerá un en la esquina superior izquierda una leyenda con el

nombre de la variable que define las tablas separadas y a que valor de ésta

corresponde la tabla que se encuentra visible, acompañado por una flecha la

cual permite desplegar el resto de los valores que toma la variable para

poder ver las restantes tablas. De esta manera puede observarse las distintas

tablas que genera el procedimiento.

Otra opción, un poco más sofisticada para construir tablas de este tipo

se encuentra en el menú ANALIZAR ESTADÍSTICAS DESCRIPTIVAS

TABLAS USUALES TABLAS GENERALES (ANALIZE DESCRIPTIVE

STATISTICS CUSTOM TABLES GENERAL TABLES).

En este caso la ventana de diálogo es la siguiente.

El funcionamiento de esta ventana es bastante parecido al presentado

anteriormente en el sentido que permite construir tablas con información

resumen sobre una variable o grupo de ellas discriminada de acuerdo a

variables de corte o agrupamiento que definan filas y columnas a partir de los

valores distintos en estas variables.

Una característica distintiva es que cada vez que se selecciona una

variable para las casillas “filas”, “columnas” o “leyenda” es que están

disponibles dos burbujas para elegir si los valores de la variable seleccionada

definen grupos o si para esta variable se presentan valores de resumen.

A su vez, si en alguna casilla se eligen dos o más variables también es

posible elegir entre anidar (Nest) los valores distintos de las mismas para

definir grupos que resulten de combinar los valores de cada una de ellas o si

se desea que se las trate por separado (UnNest).

Otra de los botones disponibles permite agregar a la tabla los totales

que correspondan a las variables que se eligen para definir grupos, si es que

se desea.

Por último, para las variables que se desean resumir (mostrar medidas

descriptivas de resumen) utilizando el botón EDITAR ESTADÍSTICAS (EDIT

STATISTICS) se puede elegir que medida/s se desean presentar.

Si se desean tablas separadas de acuerdo a los valores distintos de

alguna/s variable/s es preciso indicarlo en la casilla LEYENDA, y en la ventana

de resultados se verá sólo una de las tablas y las restantes se pueden mostrar

haciendo doble click sobre la tabla y eligiendo de las opciones que despliegan

en la leyenda se recorren todas las tablas generadas.

Creación de Gráficos Descriptivos:

Otra forma de crear gráficos en SPSS es utilizando el menú gráficos, el

cual despliega una serie de opciones que permite elegir el tipo de gráfico

deseado. Entre ellos es posible crear gráficos de líneas, de barras, sectores,

histogramas, etc. Como siempre, cada opción despliega ventanas de diálogo

en las que se ingresa/n la/s variable/s a graficar y distintas opciones.

Si se desea obtener rápidamente una idea de los gráficos disponibles

en el paquete como así también una ayuda rápida sobre cómo realizar el

gráfico deseado, en la opción GALERÏA (GALLERY) aparece una ventana con

las distintas opciones y la posibilidad de hacer doble click sobre el gráfico de

interés y obtener así una breve descripción del tipo de gráfico y la forma de

generarlo en SPSS.

La salida aparece en el visor de resultados y se permite la edición del

mismo haciendo simplemente un doble click en cualquier parte del mismo y

se desplegará una barra de herramientas con opciones para el cambio de

efectos de relleno, escala, tipo de líneas, marcadores de valores, definición

de títulos y etiquetas, etc.

Análisis de regresión:

Esta técnica estadística es quizá una de las más utilizadas en diversas

áreas de estudio, tales como la economía, biología, física, ciencias sociales,

etc.

El análisis de regresión es la metodología estadística para predecir

valores de una o más variables respuesta (también llamada variable

dependiente) a partir de una o más variables explicativas (variables

independientes o predictoras).

Sea X1, X2 ... Xp un conjunto de p variables explicativas que se piensan

relacionadas con la variable respuesta Y. Por ejemplo para p=2:

Y= tiempo de reparto

X1 = cantidad de productos.

X2 = distancia recorrida.

El modelo de regresión clásico establece que Y está compuesto por una

media, la cual depende de manera continua de las X’s y un error aleatorio

que da cuenta del error de medida y el efecto de variables no consideradas

explícitamente en el modelo. Por último se considera que los valores de las

variables explicativas son fijos y que el error es una variable aleatoria cuyo

comportamiento está caracterizado por ciertos supuestos distribucionales.

Específicamente el modelo de regresión lineal con dos variables

explicativas puede expresarse de la siguiente manera:

Y = 0 + 1 X1 + 2 X2 +

Dicho en otras palabras, la respuesta puede expresarse por una media

que depende de las variables explicativas o independientes + un término de

error aleatorio.

Para finalizar los supuestos que se hacen sobre los residuos o errores

aleatorios son los siguientes:

- La esperanza de los errores es igual a cero.

- La varianza de los errores es constante igual a 2.

- Los errores son no correlacionados

- Los errores se distribuyen igual e independientes según una distribución

normal.

Para realizar un Análisis de regresión utilizando el programa SPSS es

preciso hacerlo desde la opción ANALIZAR REGRESIÖN LINEAL

(analicé regression linear).

Con esta opción es posible estimar los coeficientes ’s del modelo de

regresión planteado, obtener valores ajustados y residuales del modelo de

regresión, calcular la tabla de análisis de la varianza (ANOVA) que permite

probar la bondad del modelo planteado y otras medidas adicionales para

evaluar el ajuste.

La ventana de diálogo que aparece es la que se muestra a

continuación:

En la casilla Dependiente (dependent) se ubica el nombre de la variable

que se quiere explicar por un modelo de regresión, (variable Y, dependiente

o respuesta) y en la casilla de Independientes las correspondientes variables

explicativas o X’s.

Con respecto al método hace referencia a distintas opciones que

dispone el programa para incluir las variables X’s al modelo y estas opciones

se utilizan básicamente cuando se desea encontrar el mejor modelo de

regresión para una variable Y. En este curso solo utilizaremos la opción

ENTER, es decir todas las variables que se seleccionan como independientes

o explicativas ingresan al modelo de regresión que se está ajustando.

Otra de las posibilidades que ofrece la ventana es la de ajustar el

modelo propuesto para un grupo de los casos basándose en los valores de la

variable que se seleccione en la casilla Variable de Selección (Selection

Variable). Si esta casilla se deja en blanco, todas las observaciones del archivo

se utilizarán para el ajuste del modelo. Por último, es posible utilizar los

valores o etiquetas de alguna variable para identificar casos en los gráficos

que se efectúen indicando dicha variable en la casilla Etiqueta de casos (Case

labels).

En el botón ESTADISTICAS (Statistics) se encuentran disponibles

distintas opciones acerca de que información aparecerá en la ventana de

salida o resultados: entre ellas se encuentran las estimaciones de los

parámetros del modelo, intervalos de confianza para los parámetros,

varianzas y covarianzas de los mismos. Con respecto al ajuste por default

aparece el cuadro de análisis de la varianza, medidas descriptivas,

correlaciones, etc. También aparecen algunas medidas referidos a los

residuos que aportan información al momento de corroborar los supuestos

del modelo basándose en los residuos del ajuste.

En el botón GRAFICOS (Plots) es posible definir gráficos de dispersión,

probabilísticos normales e histogramas que ayudan a la evaluación del

modelo.

Por otro lado, utilizando el botón GRABAR (save) se pueden generar

nuevas variables donde se graben los valores ajustados por el modelo de

regresión, residuales, algunas estadísticas de diagnóstico, entre otras.

Introducción al Análisis de series de tiempo:

Referido al tema Series de tiempo, el programa SPSS cuenta con varios

procedimientos, entre ellos suavizado exponencial, modelos ARIMA, e

inclusive un módulo con opciones para ajustar series estacionalmente

utilizando el programa X11 Arima.

Básicamente es preciso antes de utilizar alguno de estos menús

generar fechas utilizando la opción DATOS DEFINIR FECHAS e indicar el

tipo de fecha que se desea generar (en general, año y mes) y desde que

período se desea generar tales fechas. Si se elige el formato año y mes, el

programa genera automáticamente una variable indicadora del año, otra

para el mes y una tercera indicadora de período que es la que se utiliza

generalmente para el eje del tiempo en los gráficos que se construyan.

Para seleccionar alguno de estos procedimientos es necesario tener

una idea previa acerca de los posibles efectos que tenga la serie a analizar, ya

sea estacionalidad, tendencia o ambos.

La ventana de diálogo correspondiente al suavizado exponencial (exponential

smoothing) permite ajustar modelos simples sin tendencia ni estacionalidad

(simple), modelos que sólo presentan tendencia lineal (Holt), modelos con

tendencia lineal y estacionalidad (Winters) y modelos definidos por el

usuario (Custom).

Por su parte, la opción Autorregresión (autorregression ) permite el

ajuste de un modelo de regresión cuyos residuos siguen el comportamiento

de un proceso autorregresivo de primer orden.

El menú ARIMA permite el ajustar las series utilizando modelos

autorregresivos-promedios móviles, teniendo el usuario que definir el orden

de los procesos autorregresivos y promedios móviles respectivamente. Para

ello es importante comenzar el análisis observando la función de

autocorrelación para tener una idea del posible orden de los polinomios

mencionados.

Las ventanas de diálogo que se despliegan para cada una de las

opciones que ofrece el submenú de series de tiempo son las siguientes:

- Suavizado Exponencial: en esta ventana es posible elegir ajustar una serie

de tiempo ya sea que la misma no tenga tendencia ni estacionalidad

(modelo simple), solo tenga tendencia (modelo Holt), que tenga tendencia

lineal y estacionalidad (modelo Winters) o un modelo definido por el

usuario (custom). Si la serie tiene estacionalidad, puede mejorarse el

ajuste si primero se estiman los coeficientes estacionales con la opción

DESCOMPOSICION ESTACIONAL de este mismo submenú e indicándolo

en la casilla Factores estacionales (Seasonal Factors). Utilizando el botón

Gravar (save) es posible indicar que se guarden tanto los valores ajustados

de la serie por el modelo utilizado como así también los residuos del

ajuste. Por otro lado, el botón Parámetros (parameters) permite indicar si

se ajustará la serie utilizando valores de parámetros fijados por el usuario

o si se desea que el programa los estime iterativamente.

- Ajuste de modelos ARIMA: Esta ventana de diálogo permite ajustar

modelos Autorregresivos – Promedios móviles integrados. En el caso de

ajustar una sola serie se define como variable dependiente a la serie que

se desea ajustar y se completan las casillas correspondientes al orden

correspondiente a la parte autorregresiva (p), diferencias (d) o promedios

móviles (q), tanto para la parte ordinaria como la parte estacional

(seasonal).

- Desestacionalización utilizando el módulo X11Arima: El programa SPSS

permite ajustar series estacionalmente utilizando las opciones del

paquete X11Arima. Para ello es preciso elegir la opción que lleva este

nombre en el submenú de Series de Tiempo y la ventana de diálogo se

presenta a continuación:

En la casilla “Variables” se ingresa el nombre de la serie que se desea

estudiar. Si se desea identificar el modelo ARIMA que ajusta los datos se

marca en la casilla ARIMA, lo mismo ocurre si se desea corregir los valores

extremos de la serie (modify extremes). Además, en la esquina superior

derecha están las opciones para elegir entre modelos multiplicativos y/o

aditivos.

Por otra parte, hay botones que permiten elegir distintas opciones

para modelar la serie teniendo en cuenta el efecto “días de actividad”

(trading days), como así también elegir los distintos filtros (promedios

móviles) para la componente estacional y tendencia-ciclo.

Para terminar también dispone un botón para seleccionar que nuevas

variables se desean guardar en la hoja de datos activa (serie

estacionalmente ajustada, factores estacionales, tendencia-ciclo y

residuales).

CONCLUCION

El conocimiento y utilización de software estadístico es indispensable

hoy en día para una investigación seria en ciencias. También la toma de

decisiones dentro de muchas organizaciones se sustenta en un análisis

preciso de datos, y deberá utilizar este tipo de software.

Bien sea para describir o generalizar los datos obtenidos en nuestras

investigaciones, bien para la búsqueda de información y toma de decisiones

en otros contextos, es esencial un buen análisis de datos. El SPSS (Statistical

Package for the Social Sciences), al que injustamente se suele reducir a

programa de análisis estadístico, permite un tratamiento integrado de todas

las fases que conlleva el análisis de datos.

BIBLIOGRAFÍA

- SPSS inc. (1997) “Guía del usuario del sistema base de SPSS para

Windows.”

- Visauta Vinacua, B. (1997) “Análisis estadístico con SPSS para

Windows”. Volumen I Estadística Básica.. Ed. Mc Graw – Hill.

- Visauta Vinacua, B. (1997) “Análisis estadístico con SPSS para

Windows”. Volumen II Estadística Multivariante. B.. Ed. Mc Graw –

Hill.

ANEXOS

spss - sc448b732ab1c070a.jimcontent.com · spss puede adquirir datos de prácticamente cualquier...

Documents