estadistica aplicada.doc

84
ESTADÍSTICA APLICADA Ms. Ing. GASTÓN MARCO FLORES RAMOS

Upload: j-carlos-castillon-vilcapoma

Post on 10-Aug-2015

47 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ESTADISTICA APLICADA.doc

ESTADIacuteSTICA APLICADA

Ms Ing GASTOacuteN MARCO FLORES RAMOS

1 GENERALIDADES

La palabra estadiacutestica suele utilizarse bajo dos significados distintos a saber

1ordm Como coleccioacuten de datos numeacutericos- Esto es el significado maacutes vulgar de la palabra estadiacutestica Se sobrentiende que dichos datos numeacutericos han de estar presentados de manera ordenada y sistemaacutetica Una informacioacuten numeacuterica cualquiera puede no constituir una estadiacutestica para merecer este apelativo los datos han de constituir un conjunto coherente establecido de forma sistemaacutetica y siguiendo un criterio de ordenacioacuten

2ordm Como ciencia- En este significado La Estadiacutestica estudia el comportamiento de los fenoacutemenos de masas Como todas las ciencias busca las caracteriacutesticas generales de un colectivo y prescinde de las particulares de cada elemento Asiacute por ejemplo al investigar el salario de los trabajadores iniciaremos el trabajo tomando un grupo numeroso de trabajadores y obtener despueacutes la proporcioacuten de salarios

Por tanto el objetivo de la estadiacutestica es hallar las regularidades que se encuentran en los fenoacutemenos de masa

11 Poblaciones y muestras

Cuando se realiza un estudio de investigacioacuten se pretende generalmente inferir o generalizar resultados de una muestra a una poblacioacuten Se estudia en particular a un reducido nuacutemero de individuos a los que tenemos acceso con la idea de poder generalizar los hallazgos a la poblacioacuten de la cual esa muestra procede Este proceso de inferencia se efectuacutea por medio de meacutetodos estadiacutesticos basados en la probabilidad

La poblacioacuten representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser inaccesible Es en definitiva un colectivo homogeacuteneo que reuacutene unas caracteriacutesticas determinadas

La muestra es el conjunto menor de individuos (subconjunto de la poblacioacuten accesible y limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la poblacioacuten) El individuo es cada uno de los componentes de la poblacioacuten y la muestra La muestra debe ser representativa de la poblacioacuten y con ello queremos decir que cualquier individuo de la poblacioacuten en estudio debe haber tenido la misma probabilidad de ser elegido

Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos sentildealar

a Ahorrar tiempo Estudiar a menos individuos es evidente que lleva menos tiempo b Como consecuencia del punto anterior ahorraremos costos

c Estudiar la totalidad de los pacientes o personas con una caracteriacutestica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar

d Aumentar la calidad del estudio Al disponer de maacutes tiempo y recursos las observaciones y mediciones realizadas a un reducido nuacutemero de individuos pueden ser maacutes exactas y plurales que si las tuvieacutesemos que realizar a una poblacioacuten

e La seleccioacuten de muestras especiacuteficas nos permitiraacute reducir la heterogeneidad de una poblacioacuten al indicar los criterios de inclusioacuten yo exclusioacuten

2

12 Tipos de datos

Lo que estudiamos en cada individuo de la muestra son las variables (edad sexo peso talla salarios etceacutetera) Los datos son los valores que toma la variable en cada caso Lo que vamos a realizar es medir es decir asignar valores a las variables incluidas en el estudio Deberemos ademaacutes concretar la escala de medida que aplicaremos a cada variable

La naturaleza de las observaciones seraacute de gran importancia a la hora de elegir el meacutetodo estadiacutestico maacutes apropiado para abordar su anaacutelisis Con este fin clasificaremos las variables a grandes rasgos en dos tipos variables cuantitativas o variables cualitativas

a Variables cuantitativas Son las variables que pueden medirse cuantificarse o expresarse numeacutericamente Las variables cuantitativas pueden ser de dos tipos Variables cuantitativas continuas si admiten tomar cualquier valor dentro de un

rango numeacuterico determinado (edad peso talla)

Variables cuantitativas discretas si no admiten todos los valores intermedios en un rango Suelen tomar solamente valores enteros (nuacutemero de hijos nuacutemero trabajadores nuacutemero de hermanos etc)

b Variables cualitativas Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias categoriacuteas La situacioacuten maacutes sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombremujer enfermosano fumadorno fumador) Son datos dicotoacutemicos o binarios Como resulta obvio en muchas ocasiones este tipo de clasificacioacuten no es suficiente y se requiere de un mayor nuacutemero de categoriacuteas (color de los ojos grupo sanguiacuteneo profesioacuten etceacutetera)

En el proceso de medicioacuten de estas variables se pueden utilizar dos escalas

Escalas nominales eacutesta es una forma de observar o medir en la que los datos se ajustan por categoriacuteas que no mantienen una relacioacuten de orden entre siacute (color de los ojos sexo profesioacuten presencia o ausencia de un factor de riesgo o enfermedad etceacutetera)

Escalas ordinales en las escalas utilizadas existe un cierto orden o jerarquiacutea entre las categoriacuteas

13 Estadiacutestica descriptiva

Una vez que se han recogido los valores que toman las variables de nuestro estudio (datos) procederemos al anaacutelisis descriptivo de los mismos Para variables categoacutericas como el sexo se quiere conocer el nuacutemero de casos en cada una de las categoriacuteas reflejando habitualmente el porcentaje que representan del total y expresaacutendolo en una tabla de frecuencias

Para variables numeacutericas en las que puede haber un gran nuacutemero de valores observados distintos se ha de optar por un meacutetodo de anaacutelisis distinto respondiendo a las siguientes preguntas

a iquestAlrededor de queacute valor se agrupan los datos b Supuesto que se agrupan alrededor de un nuacutemero iquestcoacutemo lo hacen iquestmuy

concentrados iquestmuy dispersos

3

1 MEDIDAS DE TENDENCIA CENTRAL

Las medidas de centralizacioacuten vienen a responder a la primera pregunta La medida maacutes evidente que podemos calcular para describir un conjunto de observaciones numeacutericas es su valor medio

21 Media aritmeacutetica

a) Para datos sin agrupar

La media aritmeacutetica de una variable se define como la suma ponderada de los valores de la

variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresioacuten

Ejemplo

Consideremos 10 trabajadores de edades 21 antildeos 32 15 59 60 61 64 60 71 y 80 La media de edad de estos sujetos seraacute de

Maacutes formalmente si denotamos por (X1 X2Xn) los n datos que tenemos recogidos de la variable en cuestioacuten el valor medio vendraacute dado por

b) Para datos agrupados

xi representa el valor de la variable o en su caso la marca de clase

Propiedades

1 Si multiplicamos o dividimos todas las observaciones por un mismo nuacutemero la media queda multiplicada o dividida por dicho numero

2 Si le sumamos a todas las observaciones un mismo nuacutemero la media aumentaraacute en dicha cantidad

Ejemplo

Sea la distribucioacuten de las notas de estadiacutesticas Hallar la Media Aritmeacutetica

4

Li-1 l1 xi ni xini

2 4 3 3 9

4 6 5 2 10

6 8 7 5 35

8 10 9 9 81

10 12 11 12 132

12 14 13 10 130

14 16 15 2 30

16 18 17 5 85

SUMA 48 512

X = 51248 = 1066

22 Mediana

La mediana es el valor central de la variable es decir supuesta la muestra ordenada en orden creciente o decreciente el valor que divide en dos partes la muestra

a) Para datos sin agrupar

Tendremos en cuenta el tamantildeo de la muestra

Si N es Impar hay un teacutermino central el teacutermino que seraacute el valor de la mediana

Si N es Par hay dos teacuterminos centrales la mediana seraacute la media de esos dos valores

Ejemplo

Para N impar

146789121620 24252730 N=13

Teacutermino Central el 7ordm 12

5

Me=12

Para N par

146789121620 242527 N=12

Teacuterminos Centrales el 6ordm y 7ordm 9 y 12

Me=

b) Para datos agrupados

Si la variable es continua la tabla vendraacute en intervalos por lo que se calcula de la siguiente forma

Nos vamos a apoyar en un graacutefico de un histograma de frecuencias acumuladas

De donde la mediana vale donde ai es la amplitud del intervalo

Ejemplo

Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma

Li-1 Li ni Ni

6

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

Como el tamantildeo de la muestra es N=50 buscamos el intervalo en el que la Frecuencia acumulada es mayor que 502=25 que en este caso es el 3ordm y aplicamos la foacutermula anterior Luego la Mediana seraacute

Me=

23 MODA

La moda es el valor de la variable que tenga mayor frecuencia absoluta la que maacutes se repite es la uacutenica medida de centralizacioacuten que tiene sentido estudiar en una variable cualitativa pues no precisa la realizacioacuten de ninguacuten caacutelculo

Por su propia definicioacuten la moda no es uacutenica pues puede haber dos o maacutes valores de la variable que tengan la misma frecuencia siendo esta maacutexima En cuyo caso tendremos una distribucioacuten bimodal o polimodal seguacuten el caso

Por lo tanto el caacutelculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacioacuten mayor sin embargo debemos detenernos un poco en el caacutelculo de la moda para distribuciones cuantitativas continuas

a) Para datos sin agrupar

EjemploDetermine la moda del siguiente conjunto de notas

1 03 05 08 12 08 102 04 06 07 06 04 02 11 13 143

Xi 03 05 08 10 12

Ni 1 1 2 1 1

Distribucioacuten unimodal Mo = 8

Xi 02 04 06 07 11 13 14

Ni 1 2 2 1 1 1

Distribucioacuten bimodal Mo1 = 04 y Mo2 = 06

7

b) Para datos agrupados

Apoyaacutendonos en el graacutefico podemos llegar a la determinacioacuten de la expresioacuten para la Moda que es

Otros autores dan una expresioacuten aproximada para la moda que viene dada por la siguiente expresioacuten

Ejemplo

Veamos su caacutelculo mediante un ejemplo para ello usaremos los datos del apartado anterior

Li-1 Li ni Ni

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

ni ndash ni-1Mo = Li-1 + ------------------------------------ ai

ni ndash ni-1+ ni ndash ni-1

8

Utilizando la foacutermula aproximada

3 MEDIDAS DE DISPERSIOacuteN

Tal y como se adelantaba antes otro aspecto a tener en cuenta al describir datos continuos es la dispersioacuten de los mismos Existen distintas formas de cuantificar esa variabilidad

31 Rango

Es la primera medida que vamos a estudiar se define como la diferencia existente entre el valor mayor y el menor de la distribucioacuten Lo notaremos como R Realmente no es una medida muy significativa e la mayoriacutea de los casos pero indudablemente es muy faacutecil de calcular

Hemos estudiado varias medidas de centralizacioacuten por lo que podemos hablar de desviacioacuten con respecto a cualquiera de ellas sin embargo la mas utilizada es con respecto a la media

Ejemplo

Si las calificaciones del rendimiento en el trabajo del Grupo A tiene un alcance de 02 19 y la del Grupo B 04 19 iquestCuaacutel de los Grupos tiene mayor rango

Respuesta

El Grupo A tiene un rango mayor que el Grupo B esto quiere decir que en el Grupo A los rendimientos estaacuten mas dispersos

32 Desviacioacuten Media DM

Es la suma de los valores absolutos de la desviaciones de los datos o marcas de clase con respecto a la media aritmeacutetica

a) Para datos sin agrupar

Donde Xi = Marca de clase X = Media N = Nuacutemero de observaciones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

9

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

|(08-11)| + |(10-11)| + |(12-11)| + |(14-11)|DM = ---------------------------------------------------------- 4

3 + 1 + 1 + 3DM = ---------------------- = 2 4

b) Para datos agrupados

Ejemplo

Calcular la DM de un conjunto de calificaciones de rendimientos en el trabajo

Yi-1 Yi ni Xi Xini |Xi-X | |Xi-X |ni

00 ndash 0404 ndash 0808 ndash 1212 ndash 1616 ndash 20

10212818

26101418

2012120112324

976576176224624

97611522112179211232

50 588 26048

26048DM = ----------- = 5210 50

33 Varianza

Es la media de los cuadrados de las desviaciones y la denotaremos por o por

a) Para datos sin agrupar

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada

10

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 2: ESTADISTICA APLICADA.doc

1 GENERALIDADES

La palabra estadiacutestica suele utilizarse bajo dos significados distintos a saber

1ordm Como coleccioacuten de datos numeacutericos- Esto es el significado maacutes vulgar de la palabra estadiacutestica Se sobrentiende que dichos datos numeacutericos han de estar presentados de manera ordenada y sistemaacutetica Una informacioacuten numeacuterica cualquiera puede no constituir una estadiacutestica para merecer este apelativo los datos han de constituir un conjunto coherente establecido de forma sistemaacutetica y siguiendo un criterio de ordenacioacuten

2ordm Como ciencia- En este significado La Estadiacutestica estudia el comportamiento de los fenoacutemenos de masas Como todas las ciencias busca las caracteriacutesticas generales de un colectivo y prescinde de las particulares de cada elemento Asiacute por ejemplo al investigar el salario de los trabajadores iniciaremos el trabajo tomando un grupo numeroso de trabajadores y obtener despueacutes la proporcioacuten de salarios

Por tanto el objetivo de la estadiacutestica es hallar las regularidades que se encuentran en los fenoacutemenos de masa

11 Poblaciones y muestras

Cuando se realiza un estudio de investigacioacuten se pretende generalmente inferir o generalizar resultados de una muestra a una poblacioacuten Se estudia en particular a un reducido nuacutemero de individuos a los que tenemos acceso con la idea de poder generalizar los hallazgos a la poblacioacuten de la cual esa muestra procede Este proceso de inferencia se efectuacutea por medio de meacutetodos estadiacutesticos basados en la probabilidad

La poblacioacuten representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser inaccesible Es en definitiva un colectivo homogeacuteneo que reuacutene unas caracteriacutesticas determinadas

La muestra es el conjunto menor de individuos (subconjunto de la poblacioacuten accesible y limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la poblacioacuten) El individuo es cada uno de los componentes de la poblacioacuten y la muestra La muestra debe ser representativa de la poblacioacuten y con ello queremos decir que cualquier individuo de la poblacioacuten en estudio debe haber tenido la misma probabilidad de ser elegido

Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos sentildealar

a Ahorrar tiempo Estudiar a menos individuos es evidente que lleva menos tiempo b Como consecuencia del punto anterior ahorraremos costos

c Estudiar la totalidad de los pacientes o personas con una caracteriacutestica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar

d Aumentar la calidad del estudio Al disponer de maacutes tiempo y recursos las observaciones y mediciones realizadas a un reducido nuacutemero de individuos pueden ser maacutes exactas y plurales que si las tuvieacutesemos que realizar a una poblacioacuten

e La seleccioacuten de muestras especiacuteficas nos permitiraacute reducir la heterogeneidad de una poblacioacuten al indicar los criterios de inclusioacuten yo exclusioacuten

2

12 Tipos de datos

Lo que estudiamos en cada individuo de la muestra son las variables (edad sexo peso talla salarios etceacutetera) Los datos son los valores que toma la variable en cada caso Lo que vamos a realizar es medir es decir asignar valores a las variables incluidas en el estudio Deberemos ademaacutes concretar la escala de medida que aplicaremos a cada variable

La naturaleza de las observaciones seraacute de gran importancia a la hora de elegir el meacutetodo estadiacutestico maacutes apropiado para abordar su anaacutelisis Con este fin clasificaremos las variables a grandes rasgos en dos tipos variables cuantitativas o variables cualitativas

a Variables cuantitativas Son las variables que pueden medirse cuantificarse o expresarse numeacutericamente Las variables cuantitativas pueden ser de dos tipos Variables cuantitativas continuas si admiten tomar cualquier valor dentro de un

rango numeacuterico determinado (edad peso talla)

Variables cuantitativas discretas si no admiten todos los valores intermedios en un rango Suelen tomar solamente valores enteros (nuacutemero de hijos nuacutemero trabajadores nuacutemero de hermanos etc)

b Variables cualitativas Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias categoriacuteas La situacioacuten maacutes sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombremujer enfermosano fumadorno fumador) Son datos dicotoacutemicos o binarios Como resulta obvio en muchas ocasiones este tipo de clasificacioacuten no es suficiente y se requiere de un mayor nuacutemero de categoriacuteas (color de los ojos grupo sanguiacuteneo profesioacuten etceacutetera)

En el proceso de medicioacuten de estas variables se pueden utilizar dos escalas

Escalas nominales eacutesta es una forma de observar o medir en la que los datos se ajustan por categoriacuteas que no mantienen una relacioacuten de orden entre siacute (color de los ojos sexo profesioacuten presencia o ausencia de un factor de riesgo o enfermedad etceacutetera)

Escalas ordinales en las escalas utilizadas existe un cierto orden o jerarquiacutea entre las categoriacuteas

13 Estadiacutestica descriptiva

Una vez que se han recogido los valores que toman las variables de nuestro estudio (datos) procederemos al anaacutelisis descriptivo de los mismos Para variables categoacutericas como el sexo se quiere conocer el nuacutemero de casos en cada una de las categoriacuteas reflejando habitualmente el porcentaje que representan del total y expresaacutendolo en una tabla de frecuencias

Para variables numeacutericas en las que puede haber un gran nuacutemero de valores observados distintos se ha de optar por un meacutetodo de anaacutelisis distinto respondiendo a las siguientes preguntas

a iquestAlrededor de queacute valor se agrupan los datos b Supuesto que se agrupan alrededor de un nuacutemero iquestcoacutemo lo hacen iquestmuy

concentrados iquestmuy dispersos

3

1 MEDIDAS DE TENDENCIA CENTRAL

Las medidas de centralizacioacuten vienen a responder a la primera pregunta La medida maacutes evidente que podemos calcular para describir un conjunto de observaciones numeacutericas es su valor medio

21 Media aritmeacutetica

a) Para datos sin agrupar

La media aritmeacutetica de una variable se define como la suma ponderada de los valores de la

variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresioacuten

Ejemplo

Consideremos 10 trabajadores de edades 21 antildeos 32 15 59 60 61 64 60 71 y 80 La media de edad de estos sujetos seraacute de

Maacutes formalmente si denotamos por (X1 X2Xn) los n datos que tenemos recogidos de la variable en cuestioacuten el valor medio vendraacute dado por

b) Para datos agrupados

xi representa el valor de la variable o en su caso la marca de clase

Propiedades

1 Si multiplicamos o dividimos todas las observaciones por un mismo nuacutemero la media queda multiplicada o dividida por dicho numero

2 Si le sumamos a todas las observaciones un mismo nuacutemero la media aumentaraacute en dicha cantidad

Ejemplo

Sea la distribucioacuten de las notas de estadiacutesticas Hallar la Media Aritmeacutetica

4

Li-1 l1 xi ni xini

2 4 3 3 9

4 6 5 2 10

6 8 7 5 35

8 10 9 9 81

10 12 11 12 132

12 14 13 10 130

14 16 15 2 30

16 18 17 5 85

SUMA 48 512

X = 51248 = 1066

22 Mediana

La mediana es el valor central de la variable es decir supuesta la muestra ordenada en orden creciente o decreciente el valor que divide en dos partes la muestra

a) Para datos sin agrupar

Tendremos en cuenta el tamantildeo de la muestra

Si N es Impar hay un teacutermino central el teacutermino que seraacute el valor de la mediana

Si N es Par hay dos teacuterminos centrales la mediana seraacute la media de esos dos valores

Ejemplo

Para N impar

146789121620 24252730 N=13

Teacutermino Central el 7ordm 12

5

Me=12

Para N par

146789121620 242527 N=12

Teacuterminos Centrales el 6ordm y 7ordm 9 y 12

Me=

b) Para datos agrupados

Si la variable es continua la tabla vendraacute en intervalos por lo que se calcula de la siguiente forma

Nos vamos a apoyar en un graacutefico de un histograma de frecuencias acumuladas

De donde la mediana vale donde ai es la amplitud del intervalo

Ejemplo

Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma

Li-1 Li ni Ni

6

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

Como el tamantildeo de la muestra es N=50 buscamos el intervalo en el que la Frecuencia acumulada es mayor que 502=25 que en este caso es el 3ordm y aplicamos la foacutermula anterior Luego la Mediana seraacute

Me=

23 MODA

La moda es el valor de la variable que tenga mayor frecuencia absoluta la que maacutes se repite es la uacutenica medida de centralizacioacuten que tiene sentido estudiar en una variable cualitativa pues no precisa la realizacioacuten de ninguacuten caacutelculo

Por su propia definicioacuten la moda no es uacutenica pues puede haber dos o maacutes valores de la variable que tengan la misma frecuencia siendo esta maacutexima En cuyo caso tendremos una distribucioacuten bimodal o polimodal seguacuten el caso

Por lo tanto el caacutelculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacioacuten mayor sin embargo debemos detenernos un poco en el caacutelculo de la moda para distribuciones cuantitativas continuas

a) Para datos sin agrupar

EjemploDetermine la moda del siguiente conjunto de notas

1 03 05 08 12 08 102 04 06 07 06 04 02 11 13 143

Xi 03 05 08 10 12

Ni 1 1 2 1 1

Distribucioacuten unimodal Mo = 8

Xi 02 04 06 07 11 13 14

Ni 1 2 2 1 1 1

Distribucioacuten bimodal Mo1 = 04 y Mo2 = 06

7

b) Para datos agrupados

Apoyaacutendonos en el graacutefico podemos llegar a la determinacioacuten de la expresioacuten para la Moda que es

Otros autores dan una expresioacuten aproximada para la moda que viene dada por la siguiente expresioacuten

Ejemplo

Veamos su caacutelculo mediante un ejemplo para ello usaremos los datos del apartado anterior

Li-1 Li ni Ni

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

ni ndash ni-1Mo = Li-1 + ------------------------------------ ai

ni ndash ni-1+ ni ndash ni-1

8

Utilizando la foacutermula aproximada

3 MEDIDAS DE DISPERSIOacuteN

Tal y como se adelantaba antes otro aspecto a tener en cuenta al describir datos continuos es la dispersioacuten de los mismos Existen distintas formas de cuantificar esa variabilidad

31 Rango

Es la primera medida que vamos a estudiar se define como la diferencia existente entre el valor mayor y el menor de la distribucioacuten Lo notaremos como R Realmente no es una medida muy significativa e la mayoriacutea de los casos pero indudablemente es muy faacutecil de calcular

Hemos estudiado varias medidas de centralizacioacuten por lo que podemos hablar de desviacioacuten con respecto a cualquiera de ellas sin embargo la mas utilizada es con respecto a la media

Ejemplo

Si las calificaciones del rendimiento en el trabajo del Grupo A tiene un alcance de 02 19 y la del Grupo B 04 19 iquestCuaacutel de los Grupos tiene mayor rango

Respuesta

El Grupo A tiene un rango mayor que el Grupo B esto quiere decir que en el Grupo A los rendimientos estaacuten mas dispersos

32 Desviacioacuten Media DM

Es la suma de los valores absolutos de la desviaciones de los datos o marcas de clase con respecto a la media aritmeacutetica

a) Para datos sin agrupar

Donde Xi = Marca de clase X = Media N = Nuacutemero de observaciones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

9

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

|(08-11)| + |(10-11)| + |(12-11)| + |(14-11)|DM = ---------------------------------------------------------- 4

3 + 1 + 1 + 3DM = ---------------------- = 2 4

b) Para datos agrupados

Ejemplo

Calcular la DM de un conjunto de calificaciones de rendimientos en el trabajo

Yi-1 Yi ni Xi Xini |Xi-X | |Xi-X |ni

00 ndash 0404 ndash 0808 ndash 1212 ndash 1616 ndash 20

10212818

26101418

2012120112324

976576176224624

97611522112179211232

50 588 26048

26048DM = ----------- = 5210 50

33 Varianza

Es la media de los cuadrados de las desviaciones y la denotaremos por o por

a) Para datos sin agrupar

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada

10

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 3: ESTADISTICA APLICADA.doc

12 Tipos de datos

Lo que estudiamos en cada individuo de la muestra son las variables (edad sexo peso talla salarios etceacutetera) Los datos son los valores que toma la variable en cada caso Lo que vamos a realizar es medir es decir asignar valores a las variables incluidas en el estudio Deberemos ademaacutes concretar la escala de medida que aplicaremos a cada variable

La naturaleza de las observaciones seraacute de gran importancia a la hora de elegir el meacutetodo estadiacutestico maacutes apropiado para abordar su anaacutelisis Con este fin clasificaremos las variables a grandes rasgos en dos tipos variables cuantitativas o variables cualitativas

a Variables cuantitativas Son las variables que pueden medirse cuantificarse o expresarse numeacutericamente Las variables cuantitativas pueden ser de dos tipos Variables cuantitativas continuas si admiten tomar cualquier valor dentro de un

rango numeacuterico determinado (edad peso talla)

Variables cuantitativas discretas si no admiten todos los valores intermedios en un rango Suelen tomar solamente valores enteros (nuacutemero de hijos nuacutemero trabajadores nuacutemero de hermanos etc)

b Variables cualitativas Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias categoriacuteas La situacioacuten maacutes sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombremujer enfermosano fumadorno fumador) Son datos dicotoacutemicos o binarios Como resulta obvio en muchas ocasiones este tipo de clasificacioacuten no es suficiente y se requiere de un mayor nuacutemero de categoriacuteas (color de los ojos grupo sanguiacuteneo profesioacuten etceacutetera)

En el proceso de medicioacuten de estas variables se pueden utilizar dos escalas

Escalas nominales eacutesta es una forma de observar o medir en la que los datos se ajustan por categoriacuteas que no mantienen una relacioacuten de orden entre siacute (color de los ojos sexo profesioacuten presencia o ausencia de un factor de riesgo o enfermedad etceacutetera)

Escalas ordinales en las escalas utilizadas existe un cierto orden o jerarquiacutea entre las categoriacuteas

13 Estadiacutestica descriptiva

Una vez que se han recogido los valores que toman las variables de nuestro estudio (datos) procederemos al anaacutelisis descriptivo de los mismos Para variables categoacutericas como el sexo se quiere conocer el nuacutemero de casos en cada una de las categoriacuteas reflejando habitualmente el porcentaje que representan del total y expresaacutendolo en una tabla de frecuencias

Para variables numeacutericas en las que puede haber un gran nuacutemero de valores observados distintos se ha de optar por un meacutetodo de anaacutelisis distinto respondiendo a las siguientes preguntas

a iquestAlrededor de queacute valor se agrupan los datos b Supuesto que se agrupan alrededor de un nuacutemero iquestcoacutemo lo hacen iquestmuy

concentrados iquestmuy dispersos

3

1 MEDIDAS DE TENDENCIA CENTRAL

Las medidas de centralizacioacuten vienen a responder a la primera pregunta La medida maacutes evidente que podemos calcular para describir un conjunto de observaciones numeacutericas es su valor medio

21 Media aritmeacutetica

a) Para datos sin agrupar

La media aritmeacutetica de una variable se define como la suma ponderada de los valores de la

variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresioacuten

Ejemplo

Consideremos 10 trabajadores de edades 21 antildeos 32 15 59 60 61 64 60 71 y 80 La media de edad de estos sujetos seraacute de

Maacutes formalmente si denotamos por (X1 X2Xn) los n datos que tenemos recogidos de la variable en cuestioacuten el valor medio vendraacute dado por

b) Para datos agrupados

xi representa el valor de la variable o en su caso la marca de clase

Propiedades

1 Si multiplicamos o dividimos todas las observaciones por un mismo nuacutemero la media queda multiplicada o dividida por dicho numero

2 Si le sumamos a todas las observaciones un mismo nuacutemero la media aumentaraacute en dicha cantidad

Ejemplo

Sea la distribucioacuten de las notas de estadiacutesticas Hallar la Media Aritmeacutetica

4

Li-1 l1 xi ni xini

2 4 3 3 9

4 6 5 2 10

6 8 7 5 35

8 10 9 9 81

10 12 11 12 132

12 14 13 10 130

14 16 15 2 30

16 18 17 5 85

SUMA 48 512

X = 51248 = 1066

22 Mediana

La mediana es el valor central de la variable es decir supuesta la muestra ordenada en orden creciente o decreciente el valor que divide en dos partes la muestra

a) Para datos sin agrupar

Tendremos en cuenta el tamantildeo de la muestra

Si N es Impar hay un teacutermino central el teacutermino que seraacute el valor de la mediana

Si N es Par hay dos teacuterminos centrales la mediana seraacute la media de esos dos valores

Ejemplo

Para N impar

146789121620 24252730 N=13

Teacutermino Central el 7ordm 12

5

Me=12

Para N par

146789121620 242527 N=12

Teacuterminos Centrales el 6ordm y 7ordm 9 y 12

Me=

b) Para datos agrupados

Si la variable es continua la tabla vendraacute en intervalos por lo que se calcula de la siguiente forma

Nos vamos a apoyar en un graacutefico de un histograma de frecuencias acumuladas

De donde la mediana vale donde ai es la amplitud del intervalo

Ejemplo

Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma

Li-1 Li ni Ni

6

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

Como el tamantildeo de la muestra es N=50 buscamos el intervalo en el que la Frecuencia acumulada es mayor que 502=25 que en este caso es el 3ordm y aplicamos la foacutermula anterior Luego la Mediana seraacute

Me=

23 MODA

La moda es el valor de la variable que tenga mayor frecuencia absoluta la que maacutes se repite es la uacutenica medida de centralizacioacuten que tiene sentido estudiar en una variable cualitativa pues no precisa la realizacioacuten de ninguacuten caacutelculo

Por su propia definicioacuten la moda no es uacutenica pues puede haber dos o maacutes valores de la variable que tengan la misma frecuencia siendo esta maacutexima En cuyo caso tendremos una distribucioacuten bimodal o polimodal seguacuten el caso

Por lo tanto el caacutelculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacioacuten mayor sin embargo debemos detenernos un poco en el caacutelculo de la moda para distribuciones cuantitativas continuas

a) Para datos sin agrupar

EjemploDetermine la moda del siguiente conjunto de notas

1 03 05 08 12 08 102 04 06 07 06 04 02 11 13 143

Xi 03 05 08 10 12

Ni 1 1 2 1 1

Distribucioacuten unimodal Mo = 8

Xi 02 04 06 07 11 13 14

Ni 1 2 2 1 1 1

Distribucioacuten bimodal Mo1 = 04 y Mo2 = 06

7

b) Para datos agrupados

Apoyaacutendonos en el graacutefico podemos llegar a la determinacioacuten de la expresioacuten para la Moda que es

Otros autores dan una expresioacuten aproximada para la moda que viene dada por la siguiente expresioacuten

Ejemplo

Veamos su caacutelculo mediante un ejemplo para ello usaremos los datos del apartado anterior

Li-1 Li ni Ni

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

ni ndash ni-1Mo = Li-1 + ------------------------------------ ai

ni ndash ni-1+ ni ndash ni-1

8

Utilizando la foacutermula aproximada

3 MEDIDAS DE DISPERSIOacuteN

Tal y como se adelantaba antes otro aspecto a tener en cuenta al describir datos continuos es la dispersioacuten de los mismos Existen distintas formas de cuantificar esa variabilidad

31 Rango

Es la primera medida que vamos a estudiar se define como la diferencia existente entre el valor mayor y el menor de la distribucioacuten Lo notaremos como R Realmente no es una medida muy significativa e la mayoriacutea de los casos pero indudablemente es muy faacutecil de calcular

Hemos estudiado varias medidas de centralizacioacuten por lo que podemos hablar de desviacioacuten con respecto a cualquiera de ellas sin embargo la mas utilizada es con respecto a la media

Ejemplo

Si las calificaciones del rendimiento en el trabajo del Grupo A tiene un alcance de 02 19 y la del Grupo B 04 19 iquestCuaacutel de los Grupos tiene mayor rango

Respuesta

El Grupo A tiene un rango mayor que el Grupo B esto quiere decir que en el Grupo A los rendimientos estaacuten mas dispersos

32 Desviacioacuten Media DM

Es la suma de los valores absolutos de la desviaciones de los datos o marcas de clase con respecto a la media aritmeacutetica

a) Para datos sin agrupar

Donde Xi = Marca de clase X = Media N = Nuacutemero de observaciones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

9

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

|(08-11)| + |(10-11)| + |(12-11)| + |(14-11)|DM = ---------------------------------------------------------- 4

3 + 1 + 1 + 3DM = ---------------------- = 2 4

b) Para datos agrupados

Ejemplo

Calcular la DM de un conjunto de calificaciones de rendimientos en el trabajo

Yi-1 Yi ni Xi Xini |Xi-X | |Xi-X |ni

00 ndash 0404 ndash 0808 ndash 1212 ndash 1616 ndash 20

10212818

26101418

2012120112324

976576176224624

97611522112179211232

50 588 26048

26048DM = ----------- = 5210 50

33 Varianza

Es la media de los cuadrados de las desviaciones y la denotaremos por o por

a) Para datos sin agrupar

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada

10

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 4: ESTADISTICA APLICADA.doc

1 MEDIDAS DE TENDENCIA CENTRAL

Las medidas de centralizacioacuten vienen a responder a la primera pregunta La medida maacutes evidente que podemos calcular para describir un conjunto de observaciones numeacutericas es su valor medio

21 Media aritmeacutetica

a) Para datos sin agrupar

La media aritmeacutetica de una variable se define como la suma ponderada de los valores de la

variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresioacuten

Ejemplo

Consideremos 10 trabajadores de edades 21 antildeos 32 15 59 60 61 64 60 71 y 80 La media de edad de estos sujetos seraacute de

Maacutes formalmente si denotamos por (X1 X2Xn) los n datos que tenemos recogidos de la variable en cuestioacuten el valor medio vendraacute dado por

b) Para datos agrupados

xi representa el valor de la variable o en su caso la marca de clase

Propiedades

1 Si multiplicamos o dividimos todas las observaciones por un mismo nuacutemero la media queda multiplicada o dividida por dicho numero

2 Si le sumamos a todas las observaciones un mismo nuacutemero la media aumentaraacute en dicha cantidad

Ejemplo

Sea la distribucioacuten de las notas de estadiacutesticas Hallar la Media Aritmeacutetica

4

Li-1 l1 xi ni xini

2 4 3 3 9

4 6 5 2 10

6 8 7 5 35

8 10 9 9 81

10 12 11 12 132

12 14 13 10 130

14 16 15 2 30

16 18 17 5 85

SUMA 48 512

X = 51248 = 1066

22 Mediana

La mediana es el valor central de la variable es decir supuesta la muestra ordenada en orden creciente o decreciente el valor que divide en dos partes la muestra

a) Para datos sin agrupar

Tendremos en cuenta el tamantildeo de la muestra

Si N es Impar hay un teacutermino central el teacutermino que seraacute el valor de la mediana

Si N es Par hay dos teacuterminos centrales la mediana seraacute la media de esos dos valores

Ejemplo

Para N impar

146789121620 24252730 N=13

Teacutermino Central el 7ordm 12

5

Me=12

Para N par

146789121620 242527 N=12

Teacuterminos Centrales el 6ordm y 7ordm 9 y 12

Me=

b) Para datos agrupados

Si la variable es continua la tabla vendraacute en intervalos por lo que se calcula de la siguiente forma

Nos vamos a apoyar en un graacutefico de un histograma de frecuencias acumuladas

De donde la mediana vale donde ai es la amplitud del intervalo

Ejemplo

Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma

Li-1 Li ni Ni

6

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

Como el tamantildeo de la muestra es N=50 buscamos el intervalo en el que la Frecuencia acumulada es mayor que 502=25 que en este caso es el 3ordm y aplicamos la foacutermula anterior Luego la Mediana seraacute

Me=

23 MODA

La moda es el valor de la variable que tenga mayor frecuencia absoluta la que maacutes se repite es la uacutenica medida de centralizacioacuten que tiene sentido estudiar en una variable cualitativa pues no precisa la realizacioacuten de ninguacuten caacutelculo

Por su propia definicioacuten la moda no es uacutenica pues puede haber dos o maacutes valores de la variable que tengan la misma frecuencia siendo esta maacutexima En cuyo caso tendremos una distribucioacuten bimodal o polimodal seguacuten el caso

Por lo tanto el caacutelculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacioacuten mayor sin embargo debemos detenernos un poco en el caacutelculo de la moda para distribuciones cuantitativas continuas

a) Para datos sin agrupar

EjemploDetermine la moda del siguiente conjunto de notas

1 03 05 08 12 08 102 04 06 07 06 04 02 11 13 143

Xi 03 05 08 10 12

Ni 1 1 2 1 1

Distribucioacuten unimodal Mo = 8

Xi 02 04 06 07 11 13 14

Ni 1 2 2 1 1 1

Distribucioacuten bimodal Mo1 = 04 y Mo2 = 06

7

b) Para datos agrupados

Apoyaacutendonos en el graacutefico podemos llegar a la determinacioacuten de la expresioacuten para la Moda que es

Otros autores dan una expresioacuten aproximada para la moda que viene dada por la siguiente expresioacuten

Ejemplo

Veamos su caacutelculo mediante un ejemplo para ello usaremos los datos del apartado anterior

Li-1 Li ni Ni

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

ni ndash ni-1Mo = Li-1 + ------------------------------------ ai

ni ndash ni-1+ ni ndash ni-1

8

Utilizando la foacutermula aproximada

3 MEDIDAS DE DISPERSIOacuteN

Tal y como se adelantaba antes otro aspecto a tener en cuenta al describir datos continuos es la dispersioacuten de los mismos Existen distintas formas de cuantificar esa variabilidad

31 Rango

Es la primera medida que vamos a estudiar se define como la diferencia existente entre el valor mayor y el menor de la distribucioacuten Lo notaremos como R Realmente no es una medida muy significativa e la mayoriacutea de los casos pero indudablemente es muy faacutecil de calcular

Hemos estudiado varias medidas de centralizacioacuten por lo que podemos hablar de desviacioacuten con respecto a cualquiera de ellas sin embargo la mas utilizada es con respecto a la media

Ejemplo

Si las calificaciones del rendimiento en el trabajo del Grupo A tiene un alcance de 02 19 y la del Grupo B 04 19 iquestCuaacutel de los Grupos tiene mayor rango

Respuesta

El Grupo A tiene un rango mayor que el Grupo B esto quiere decir que en el Grupo A los rendimientos estaacuten mas dispersos

32 Desviacioacuten Media DM

Es la suma de los valores absolutos de la desviaciones de los datos o marcas de clase con respecto a la media aritmeacutetica

a) Para datos sin agrupar

Donde Xi = Marca de clase X = Media N = Nuacutemero de observaciones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

9

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

|(08-11)| + |(10-11)| + |(12-11)| + |(14-11)|DM = ---------------------------------------------------------- 4

3 + 1 + 1 + 3DM = ---------------------- = 2 4

b) Para datos agrupados

Ejemplo

Calcular la DM de un conjunto de calificaciones de rendimientos en el trabajo

Yi-1 Yi ni Xi Xini |Xi-X | |Xi-X |ni

00 ndash 0404 ndash 0808 ndash 1212 ndash 1616 ndash 20

10212818

26101418

2012120112324

976576176224624

97611522112179211232

50 588 26048

26048DM = ----------- = 5210 50

33 Varianza

Es la media de los cuadrados de las desviaciones y la denotaremos por o por

a) Para datos sin agrupar

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada

10

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 5: ESTADISTICA APLICADA.doc

Li-1 l1 xi ni xini

2 4 3 3 9

4 6 5 2 10

6 8 7 5 35

8 10 9 9 81

10 12 11 12 132

12 14 13 10 130

14 16 15 2 30

16 18 17 5 85

SUMA 48 512

X = 51248 = 1066

22 Mediana

La mediana es el valor central de la variable es decir supuesta la muestra ordenada en orden creciente o decreciente el valor que divide en dos partes la muestra

a) Para datos sin agrupar

Tendremos en cuenta el tamantildeo de la muestra

Si N es Impar hay un teacutermino central el teacutermino que seraacute el valor de la mediana

Si N es Par hay dos teacuterminos centrales la mediana seraacute la media de esos dos valores

Ejemplo

Para N impar

146789121620 24252730 N=13

Teacutermino Central el 7ordm 12

5

Me=12

Para N par

146789121620 242527 N=12

Teacuterminos Centrales el 6ordm y 7ordm 9 y 12

Me=

b) Para datos agrupados

Si la variable es continua la tabla vendraacute en intervalos por lo que se calcula de la siguiente forma

Nos vamos a apoyar en un graacutefico de un histograma de frecuencias acumuladas

De donde la mediana vale donde ai es la amplitud del intervalo

Ejemplo

Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma

Li-1 Li ni Ni

6

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

Como el tamantildeo de la muestra es N=50 buscamos el intervalo en el que la Frecuencia acumulada es mayor que 502=25 que en este caso es el 3ordm y aplicamos la foacutermula anterior Luego la Mediana seraacute

Me=

23 MODA

La moda es el valor de la variable que tenga mayor frecuencia absoluta la que maacutes se repite es la uacutenica medida de centralizacioacuten que tiene sentido estudiar en una variable cualitativa pues no precisa la realizacioacuten de ninguacuten caacutelculo

Por su propia definicioacuten la moda no es uacutenica pues puede haber dos o maacutes valores de la variable que tengan la misma frecuencia siendo esta maacutexima En cuyo caso tendremos una distribucioacuten bimodal o polimodal seguacuten el caso

Por lo tanto el caacutelculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacioacuten mayor sin embargo debemos detenernos un poco en el caacutelculo de la moda para distribuciones cuantitativas continuas

a) Para datos sin agrupar

EjemploDetermine la moda del siguiente conjunto de notas

1 03 05 08 12 08 102 04 06 07 06 04 02 11 13 143

Xi 03 05 08 10 12

Ni 1 1 2 1 1

Distribucioacuten unimodal Mo = 8

Xi 02 04 06 07 11 13 14

Ni 1 2 2 1 1 1

Distribucioacuten bimodal Mo1 = 04 y Mo2 = 06

7

b) Para datos agrupados

Apoyaacutendonos en el graacutefico podemos llegar a la determinacioacuten de la expresioacuten para la Moda que es

Otros autores dan una expresioacuten aproximada para la moda que viene dada por la siguiente expresioacuten

Ejemplo

Veamos su caacutelculo mediante un ejemplo para ello usaremos los datos del apartado anterior

Li-1 Li ni Ni

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

ni ndash ni-1Mo = Li-1 + ------------------------------------ ai

ni ndash ni-1+ ni ndash ni-1

8

Utilizando la foacutermula aproximada

3 MEDIDAS DE DISPERSIOacuteN

Tal y como se adelantaba antes otro aspecto a tener en cuenta al describir datos continuos es la dispersioacuten de los mismos Existen distintas formas de cuantificar esa variabilidad

31 Rango

Es la primera medida que vamos a estudiar se define como la diferencia existente entre el valor mayor y el menor de la distribucioacuten Lo notaremos como R Realmente no es una medida muy significativa e la mayoriacutea de los casos pero indudablemente es muy faacutecil de calcular

Hemos estudiado varias medidas de centralizacioacuten por lo que podemos hablar de desviacioacuten con respecto a cualquiera de ellas sin embargo la mas utilizada es con respecto a la media

Ejemplo

Si las calificaciones del rendimiento en el trabajo del Grupo A tiene un alcance de 02 19 y la del Grupo B 04 19 iquestCuaacutel de los Grupos tiene mayor rango

Respuesta

El Grupo A tiene un rango mayor que el Grupo B esto quiere decir que en el Grupo A los rendimientos estaacuten mas dispersos

32 Desviacioacuten Media DM

Es la suma de los valores absolutos de la desviaciones de los datos o marcas de clase con respecto a la media aritmeacutetica

a) Para datos sin agrupar

Donde Xi = Marca de clase X = Media N = Nuacutemero de observaciones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

9

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

|(08-11)| + |(10-11)| + |(12-11)| + |(14-11)|DM = ---------------------------------------------------------- 4

3 + 1 + 1 + 3DM = ---------------------- = 2 4

b) Para datos agrupados

Ejemplo

Calcular la DM de un conjunto de calificaciones de rendimientos en el trabajo

Yi-1 Yi ni Xi Xini |Xi-X | |Xi-X |ni

00 ndash 0404 ndash 0808 ndash 1212 ndash 1616 ndash 20

10212818

26101418

2012120112324

976576176224624

97611522112179211232

50 588 26048

26048DM = ----------- = 5210 50

33 Varianza

Es la media de los cuadrados de las desviaciones y la denotaremos por o por

a) Para datos sin agrupar

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada

10

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 6: ESTADISTICA APLICADA.doc

Me=12

Para N par

146789121620 242527 N=12

Teacuterminos Centrales el 6ordm y 7ordm 9 y 12

Me=

b) Para datos agrupados

Si la variable es continua la tabla vendraacute en intervalos por lo que se calcula de la siguiente forma

Nos vamos a apoyar en un graacutefico de un histograma de frecuencias acumuladas

De donde la mediana vale donde ai es la amplitud del intervalo

Ejemplo

Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma

Li-1 Li ni Ni

6

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

Como el tamantildeo de la muestra es N=50 buscamos el intervalo en el que la Frecuencia acumulada es mayor que 502=25 que en este caso es el 3ordm y aplicamos la foacutermula anterior Luego la Mediana seraacute

Me=

23 MODA

La moda es el valor de la variable que tenga mayor frecuencia absoluta la que maacutes se repite es la uacutenica medida de centralizacioacuten que tiene sentido estudiar en una variable cualitativa pues no precisa la realizacioacuten de ninguacuten caacutelculo

Por su propia definicioacuten la moda no es uacutenica pues puede haber dos o maacutes valores de la variable que tengan la misma frecuencia siendo esta maacutexima En cuyo caso tendremos una distribucioacuten bimodal o polimodal seguacuten el caso

Por lo tanto el caacutelculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacioacuten mayor sin embargo debemos detenernos un poco en el caacutelculo de la moda para distribuciones cuantitativas continuas

a) Para datos sin agrupar

EjemploDetermine la moda del siguiente conjunto de notas

1 03 05 08 12 08 102 04 06 07 06 04 02 11 13 143

Xi 03 05 08 10 12

Ni 1 1 2 1 1

Distribucioacuten unimodal Mo = 8

Xi 02 04 06 07 11 13 14

Ni 1 2 2 1 1 1

Distribucioacuten bimodal Mo1 = 04 y Mo2 = 06

7

b) Para datos agrupados

Apoyaacutendonos en el graacutefico podemos llegar a la determinacioacuten de la expresioacuten para la Moda que es

Otros autores dan una expresioacuten aproximada para la moda que viene dada por la siguiente expresioacuten

Ejemplo

Veamos su caacutelculo mediante un ejemplo para ello usaremos los datos del apartado anterior

Li-1 Li ni Ni

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

ni ndash ni-1Mo = Li-1 + ------------------------------------ ai

ni ndash ni-1+ ni ndash ni-1

8

Utilizando la foacutermula aproximada

3 MEDIDAS DE DISPERSIOacuteN

Tal y como se adelantaba antes otro aspecto a tener en cuenta al describir datos continuos es la dispersioacuten de los mismos Existen distintas formas de cuantificar esa variabilidad

31 Rango

Es la primera medida que vamos a estudiar se define como la diferencia existente entre el valor mayor y el menor de la distribucioacuten Lo notaremos como R Realmente no es una medida muy significativa e la mayoriacutea de los casos pero indudablemente es muy faacutecil de calcular

Hemos estudiado varias medidas de centralizacioacuten por lo que podemos hablar de desviacioacuten con respecto a cualquiera de ellas sin embargo la mas utilizada es con respecto a la media

Ejemplo

Si las calificaciones del rendimiento en el trabajo del Grupo A tiene un alcance de 02 19 y la del Grupo B 04 19 iquestCuaacutel de los Grupos tiene mayor rango

Respuesta

El Grupo A tiene un rango mayor que el Grupo B esto quiere decir que en el Grupo A los rendimientos estaacuten mas dispersos

32 Desviacioacuten Media DM

Es la suma de los valores absolutos de la desviaciones de los datos o marcas de clase con respecto a la media aritmeacutetica

a) Para datos sin agrupar

Donde Xi = Marca de clase X = Media N = Nuacutemero de observaciones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

9

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

|(08-11)| + |(10-11)| + |(12-11)| + |(14-11)|DM = ---------------------------------------------------------- 4

3 + 1 + 1 + 3DM = ---------------------- = 2 4

b) Para datos agrupados

Ejemplo

Calcular la DM de un conjunto de calificaciones de rendimientos en el trabajo

Yi-1 Yi ni Xi Xini |Xi-X | |Xi-X |ni

00 ndash 0404 ndash 0808 ndash 1212 ndash 1616 ndash 20

10212818

26101418

2012120112324

976576176224624

97611522112179211232

50 588 26048

26048DM = ----------- = 5210 50

33 Varianza

Es la media de los cuadrados de las desviaciones y la denotaremos por o por

a) Para datos sin agrupar

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada

10

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 7: ESTADISTICA APLICADA.doc

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

Como el tamantildeo de la muestra es N=50 buscamos el intervalo en el que la Frecuencia acumulada es mayor que 502=25 que en este caso es el 3ordm y aplicamos la foacutermula anterior Luego la Mediana seraacute

Me=

23 MODA

La moda es el valor de la variable que tenga mayor frecuencia absoluta la que maacutes se repite es la uacutenica medida de centralizacioacuten que tiene sentido estudiar en una variable cualitativa pues no precisa la realizacioacuten de ninguacuten caacutelculo

Por su propia definicioacuten la moda no es uacutenica pues puede haber dos o maacutes valores de la variable que tengan la misma frecuencia siendo esta maacutexima En cuyo caso tendremos una distribucioacuten bimodal o polimodal seguacuten el caso

Por lo tanto el caacutelculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacioacuten mayor sin embargo debemos detenernos un poco en el caacutelculo de la moda para distribuciones cuantitativas continuas

a) Para datos sin agrupar

EjemploDetermine la moda del siguiente conjunto de notas

1 03 05 08 12 08 102 04 06 07 06 04 02 11 13 143

Xi 03 05 08 10 12

Ni 1 1 2 1 1

Distribucioacuten unimodal Mo = 8

Xi 02 04 06 07 11 13 14

Ni 1 2 2 1 1 1

Distribucioacuten bimodal Mo1 = 04 y Mo2 = 06

7

b) Para datos agrupados

Apoyaacutendonos en el graacutefico podemos llegar a la determinacioacuten de la expresioacuten para la Moda que es

Otros autores dan una expresioacuten aproximada para la moda que viene dada por la siguiente expresioacuten

Ejemplo

Veamos su caacutelculo mediante un ejemplo para ello usaremos los datos del apartado anterior

Li-1 Li ni Ni

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

ni ndash ni-1Mo = Li-1 + ------------------------------------ ai

ni ndash ni-1+ ni ndash ni-1

8

Utilizando la foacutermula aproximada

3 MEDIDAS DE DISPERSIOacuteN

Tal y como se adelantaba antes otro aspecto a tener en cuenta al describir datos continuos es la dispersioacuten de los mismos Existen distintas formas de cuantificar esa variabilidad

31 Rango

Es la primera medida que vamos a estudiar se define como la diferencia existente entre el valor mayor y el menor de la distribucioacuten Lo notaremos como R Realmente no es una medida muy significativa e la mayoriacutea de los casos pero indudablemente es muy faacutecil de calcular

Hemos estudiado varias medidas de centralizacioacuten por lo que podemos hablar de desviacioacuten con respecto a cualquiera de ellas sin embargo la mas utilizada es con respecto a la media

Ejemplo

Si las calificaciones del rendimiento en el trabajo del Grupo A tiene un alcance de 02 19 y la del Grupo B 04 19 iquestCuaacutel de los Grupos tiene mayor rango

Respuesta

El Grupo A tiene un rango mayor que el Grupo B esto quiere decir que en el Grupo A los rendimientos estaacuten mas dispersos

32 Desviacioacuten Media DM

Es la suma de los valores absolutos de la desviaciones de los datos o marcas de clase con respecto a la media aritmeacutetica

a) Para datos sin agrupar

Donde Xi = Marca de clase X = Media N = Nuacutemero de observaciones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

9

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

|(08-11)| + |(10-11)| + |(12-11)| + |(14-11)|DM = ---------------------------------------------------------- 4

3 + 1 + 1 + 3DM = ---------------------- = 2 4

b) Para datos agrupados

Ejemplo

Calcular la DM de un conjunto de calificaciones de rendimientos en el trabajo

Yi-1 Yi ni Xi Xini |Xi-X | |Xi-X |ni

00 ndash 0404 ndash 0808 ndash 1212 ndash 1616 ndash 20

10212818

26101418

2012120112324

976576176224624

97611522112179211232

50 588 26048

26048DM = ----------- = 5210 50

33 Varianza

Es la media de los cuadrados de las desviaciones y la denotaremos por o por

a) Para datos sin agrupar

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada

10

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 8: ESTADISTICA APLICADA.doc

b) Para datos agrupados

Apoyaacutendonos en el graacutefico podemos llegar a la determinacioacuten de la expresioacuten para la Moda que es

Otros autores dan una expresioacuten aproximada para la moda que viene dada por la siguiente expresioacuten

Ejemplo

Veamos su caacutelculo mediante un ejemplo para ello usaremos los datos del apartado anterior

Li-1 Li ni Ni

45 55 6 6

55 65 10 16

65 75 19 35

75 85 11 46

85 95 4 50

ni ndash ni-1Mo = Li-1 + ------------------------------------ ai

ni ndash ni-1+ ni ndash ni-1

8

Utilizando la foacutermula aproximada

3 MEDIDAS DE DISPERSIOacuteN

Tal y como se adelantaba antes otro aspecto a tener en cuenta al describir datos continuos es la dispersioacuten de los mismos Existen distintas formas de cuantificar esa variabilidad

31 Rango

Es la primera medida que vamos a estudiar se define como la diferencia existente entre el valor mayor y el menor de la distribucioacuten Lo notaremos como R Realmente no es una medida muy significativa e la mayoriacutea de los casos pero indudablemente es muy faacutecil de calcular

Hemos estudiado varias medidas de centralizacioacuten por lo que podemos hablar de desviacioacuten con respecto a cualquiera de ellas sin embargo la mas utilizada es con respecto a la media

Ejemplo

Si las calificaciones del rendimiento en el trabajo del Grupo A tiene un alcance de 02 19 y la del Grupo B 04 19 iquestCuaacutel de los Grupos tiene mayor rango

Respuesta

El Grupo A tiene un rango mayor que el Grupo B esto quiere decir que en el Grupo A los rendimientos estaacuten mas dispersos

32 Desviacioacuten Media DM

Es la suma de los valores absolutos de la desviaciones de los datos o marcas de clase con respecto a la media aritmeacutetica

a) Para datos sin agrupar

Donde Xi = Marca de clase X = Media N = Nuacutemero de observaciones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

9

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

|(08-11)| + |(10-11)| + |(12-11)| + |(14-11)|DM = ---------------------------------------------------------- 4

3 + 1 + 1 + 3DM = ---------------------- = 2 4

b) Para datos agrupados

Ejemplo

Calcular la DM de un conjunto de calificaciones de rendimientos en el trabajo

Yi-1 Yi ni Xi Xini |Xi-X | |Xi-X |ni

00 ndash 0404 ndash 0808 ndash 1212 ndash 1616 ndash 20

10212818

26101418

2012120112324

976576176224624

97611522112179211232

50 588 26048

26048DM = ----------- = 5210 50

33 Varianza

Es la media de los cuadrados de las desviaciones y la denotaremos por o por

a) Para datos sin agrupar

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada

10

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 9: ESTADISTICA APLICADA.doc

Utilizando la foacutermula aproximada

3 MEDIDAS DE DISPERSIOacuteN

Tal y como se adelantaba antes otro aspecto a tener en cuenta al describir datos continuos es la dispersioacuten de los mismos Existen distintas formas de cuantificar esa variabilidad

31 Rango

Es la primera medida que vamos a estudiar se define como la diferencia existente entre el valor mayor y el menor de la distribucioacuten Lo notaremos como R Realmente no es una medida muy significativa e la mayoriacutea de los casos pero indudablemente es muy faacutecil de calcular

Hemos estudiado varias medidas de centralizacioacuten por lo que podemos hablar de desviacioacuten con respecto a cualquiera de ellas sin embargo la mas utilizada es con respecto a la media

Ejemplo

Si las calificaciones del rendimiento en el trabajo del Grupo A tiene un alcance de 02 19 y la del Grupo B 04 19 iquestCuaacutel de los Grupos tiene mayor rango

Respuesta

El Grupo A tiene un rango mayor que el Grupo B esto quiere decir que en el Grupo A los rendimientos estaacuten mas dispersos

32 Desviacioacuten Media DM

Es la suma de los valores absolutos de la desviaciones de los datos o marcas de clase con respecto a la media aritmeacutetica

a) Para datos sin agrupar

Donde Xi = Marca de clase X = Media N = Nuacutemero de observaciones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

9

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

|(08-11)| + |(10-11)| + |(12-11)| + |(14-11)|DM = ---------------------------------------------------------- 4

3 + 1 + 1 + 3DM = ---------------------- = 2 4

b) Para datos agrupados

Ejemplo

Calcular la DM de un conjunto de calificaciones de rendimientos en el trabajo

Yi-1 Yi ni Xi Xini |Xi-X | |Xi-X |ni

00 ndash 0404 ndash 0808 ndash 1212 ndash 1616 ndash 20

10212818

26101418

2012120112324

976576176224624

97611522112179211232

50 588 26048

26048DM = ----------- = 5210 50

33 Varianza

Es la media de los cuadrados de las desviaciones y la denotaremos por o por

a) Para datos sin agrupar

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada

10

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 10: ESTADISTICA APLICADA.doc

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

|(08-11)| + |(10-11)| + |(12-11)| + |(14-11)|DM = ---------------------------------------------------------- 4

3 + 1 + 1 + 3DM = ---------------------- = 2 4

b) Para datos agrupados

Ejemplo

Calcular la DM de un conjunto de calificaciones de rendimientos en el trabajo

Yi-1 Yi ni Xi Xini |Xi-X | |Xi-X |ni

00 ndash 0404 ndash 0808 ndash 1212 ndash 1616 ndash 20

10212818

26101418

2012120112324

976576176224624

97611522112179211232

50 588 26048

26048DM = ----------- = 5210 50

33 Varianza

Es la media de los cuadrados de las desviaciones y la denotaremos por o por

a) Para datos sin agrupar

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada

10

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 11: ESTADISTICA APLICADA.doc

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4 (08-11)2 + (10-11)2 + (12-11)2 + (14-11)2S2x = ---------------------------------------------------------- 4 9 + 1 + 1 + 9S2x = ---------------------- = 5 4

b) para datos agrupados

Aunque tambieacuten es posible calcularlo como

Este estadiacutestico tiene el inconveniente de ser poco significativo pues se mide en el cuadrado de la unidad de la variable por ejemplo si la variable viene dada en cm La varianza vendraacute en cm2

Ejemplo

Y1-1 Yi Xi Ni Xini (xi-X)2 (Xi-X)2ni

00 ndash 0202 ndash 0404 ndash 0606 ndash 0808 ndash 1010 ndash 1212 ndash 1414 ndash 16

13579111315

3521283710

3151084723391150

6658637946173064666002633061474634106

1997571897284361155987020410156103220341056

50 458 934719

934719S2x = --------------- = 18694 50

34 Desviacioacuten tiacutepica (S)

11

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 12: ESTADISTICA APLICADA.doc

Es la raiacutez cuadrada de la varianza Expresa la dispersioacuten de la distribucioacuten y se expresa en las mismas unidades de medida de la variable La desviacioacuten tiacutepica es la medida de dispersioacuten maacutes utilizada en estadiacutestica

a) Para datos sin agrupar

Aunque esta foacutermula de la desviacioacuten tiacutepica muestral es correcta en la praacutectica la estadiacutestica nos interesa para realizar inferencias poblacionales por lo que en el denominador se utiliza en lugar de n el valor n-1

Por tanto la medida que se utiliza es la cuasidesviacioacuten tiacutepica dada por

Aunque en muchos contextos se utiliza el teacutermino de desviacioacuten tiacutepica para referirse a ambas expresiones

Ejemplo

Sean los calificativos de rendimientos en el trabajo del grupos A 08 10 12 14

08 + 10 + 12 +14 Hallando X = ------------------------- = 11 4

(08-11)2 + (10-11)2 + (12-11)2 + (14-11)2Sx =radic ---------------------------------------------------------- 4 9 + 1 + 1 + 9Sx = radic---------------------- 4

Sx = =radic5 = 224

b) Para datos agrupados

12

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 13: ESTADISTICA APLICADA.doc

Este estadiacutestico se mide en la misma unidad que la variable por lo que se puede interpretar mejor

Ejemplo

Sx = radic s2xSx = radic18694Sx = 43235 Coeficiente de Variacioacuten (CV) Es una medida de dispersioacuten relativa de los datos y se calcula dividiendo la desviacioacuten tiacutepica muestral por la media y multiplicando el cociente por 100 Su utilidad estriba en que nos permite comparar la dispersioacuten o variabilidad de dos o maacutes grupos Asiacute por ejemplo si tenemos el peso de 5 trabajadores (70 60 56 83 y 79 Kg) cuya media es de 696 kg y su desviacioacuten tiacutepica (s) = 1044 y la TAS de los mismos (150 170 135 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacioacuten tiacutepica de 213 La pregunta seriacutea iquestqueacute distribucioacuten es maacutes dispersa el peso o la tensioacuten arterial Si comparamos las desviaciones tiacutepicas observamos que la desviacioacuten tiacutepica de la tensioacuten arterial es mucho mayor sin embargo no podemos comparar dos variables que tienen escalas de medidas diferentes por lo que calculamos los coeficientes de variacioacuten

Ejemplo SxCV = --------- 100 X

432CV = ------- 100 = 4716 (Datos heterogeacuteneos) 916

4 CORRELACION Y REGRESION41 CorrelacioacutenSe llama correlacioacuten a la relacioacuten entre dos o maacutes variables estadiacutesticas referidas a una misma muestraEl grado de correlacioacuten entre dos variables se mide mediante los coeficientes de correlacioacutenClases de correlacioacutenExisten varias clases veamos solo algunos

a) Correlacioacuten simple Cuando se realiza entre dos variablesb) Correlacioacuten muacuteltiple Cuando intervienen tres o maacutes variablesc) Correlacioacuten lineal Cuando el diagrama de dispersioacuten tiende a formar una curvad) Correlacioacuten no lineal Cuando el diagrama de dispersioacuten tiende a formar una curva

Diagramas de Dispersioacuten

13

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 14: ESTADISTICA APLICADA.doc

Si las variables (X e Y) que se relacionan se llevan a graficarlas en un plano cartesiano obtendremos una nube de puntos de diversas representaciones y correspondieacutendoles a cada diagrama de dispersioacuten su respectivo coeficiente de correlacioacuten el mismo que soacutelo variaraacute entre -100 lt= r lt= +100

Grados de Correlacioacuten

Cuando la correlacioacuten es directa el coeficiente de correlacioacuten es positiva es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba y de izquierda a derecha

Cuando la correlacioacuten es inversa el coeficiente de correlacioacuten es negativo es decir el diagrama de dispersioacuten tiene una orientacioacuten de abajo hacia arriba pero de derecha a izquierda

Tabla de Elorza H (1987)

De plusmn 096 a plusmn 100 Correlacioacuten perfectaDe plusmn 085 a plusmn 095 Correlacioacuten fuerteDe plusmn 070 a plusmn 084 Correlacioacuten significativaDe plusmn 050 a plusmn 069 Correlacioacuten moderadaDe plusmn 020 a plusmn 049 Correlacioacuten deacutebilDe plusmn 010 a plusmn 019 Correlacioacuten muy deacutebilDe plusmn 000 a plusmn 009 Correlacioacuten nula

42 Correlacioacuten y Regresioacuten

Cuando basaacutendose en datos muestrales se desea estimar el valor de una variable Y correspondiente a un valor dado de una variable X se puede corregir estimando al valor de Y de la curva de miacutenimos cuadrados que ajusta con datos muestrales La curva resultante se llama CURVA DE REGRESION de Y sobre X ya que Y se estima a partir de los valores de X

Se puede resumir que se puede estimar (regresioacuten) el valor de una variable a partir de una o mas variables relacionadas (correlacioacuten) es decir en que medida una ecuacioacuten lineal ( o no lineal) explica o describe adecuadamente al relacioacuten entre variables

14

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 15: ESTADISTICA APLICADA.doc

La Liacutenea Recta

Y = a0 + a1X

Donde a0 y a1 son constantes y pueden ser hallados

Dados los puntos cualesquiera (x1y1) y (x2y2) de la recta la ecuacioacuten puede expresarse tambieacuten

Y2-Y1

Y ndash Y1 = ----------- (X-X1) o Y-Y1 = m(X-X1) X2-X1

Y2-Y1

Donde ldquomrdquo es la pendiente de la liacutenea recta = m = ----------- X2-X1

Recta de Miacutenimos Cuadrados

Sean los puntos (X1Y1)(x2y2)hellip(xnYn) y la recta de aproximacioacuten por miacutenimos cuadrados tiene la ecuacioacuten

Y = a0 + a1X

Donde para hallar las constantes a0 a1 a partir del sistema de ecuaciones

Ecuaciones normales para la recta de miacutenimos cuadrados

sumY = a0N+a1sumX

sumXY = a0sumX + a1sumX2

Las constantes a0 y a1 se obtienen

(sumY)(sumX2)-(sumX)(sumXY) NsumXY-(sumX)(sumY)

A0 = --------------------------------- a1 = ---------------------------

NsumX2 ndash (sumX)2 NsumX2-(sumX)2

Ejemplo

Ajustar una recta de miacutenimos cuadrados a los datos de la tabla adjunta tomando (a) X como variable independiente y (b) Y como variable dependiente

X 3 5 6 8 9 11

Y 2 3 4 6 5 8

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

15

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 16: ESTADISTICA APLICADA.doc

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

Las ecuaciones de la recta y las ecuaciones normales son

Y = a0 + a1X

sumY = a0N+a1sumXsumXY = a0sumX + a1sumX2

6a0 + 42a1 = 28 helliphelliphellip(1)42a0 + 336a1 = 226 hellip(2)

Resolviendo el sistema de ecuaciones se tiene-252a0 ndash 1764a1 = -1176 252a0 + 2016a1 = 1356----------------------------------- 0 + 256a1 = 180

a1 = 180252 = 071a0 = -13 = -03

Y = -03 + 071X

Para la ecuacioacuten de la recta usar X = b0 + b1Y con las siguientes ecuaciones normales

sumX = b0N + b1sumYsumXY = b0sumY + b1sumY2

Se debe llegar a la Ec X = 100 + 129Y

43 Coeficiente de Correlacioacuten ldquorrdquo de Pearson

Es el coeficiente ideado por Karl Pearson estadiacutestico ingleacutes y es el iacutendice de correlacioacuten maacutes usado La escala que utiliza es de intervalo o de razoacuten y se define como la media de los productos de las puntuaciones ndashz de ambas variables (XY)

Simboacutelicamente sumZxZyr = ----------------- N

r = Coeficiente de correlacioacuten de PearsonZx = Puntuacioacuten Z de la variacioacuten XZy = Puntuacioacuten Z de la variacioacuten YsumZxZy = Sumatoria de los productos de las puntuacionesN = Nuacutemero de las puntuaciones

Foacutermula directa para el caacutelculo del coeficiente r de Pearson a partir de las calificaciones brutas

NsumXY ndash (sumX)(sumY)

16

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 17: ESTADISTICA APLICADA.doc

r = -------------------------------------------------- radic[NsumX2 ndash (sumX)2] [NsumY2 ndash (sumY)2]

Donde

sumX Sumatoria de las calificaciones brutas de la variable XsumY Sumatoria de las calificaciones brutas de la variable YsumXY Sumatoria del producto de las calificaciones X e YsumX2 Sumatoria de los cuadrados de las calificaciones XsumY2 Sumatoria de los cuadrados de las calificaciones Y(sumX)2 Cuadrado de la sumatoria de las calificaciones X(sumY )2 Cuadrado de la sumatoria de las calificaciones YN Nuacutemero de calificaciones pareadasr Coeficiente de correlacioacuten de Pearson

Ejemplo Hallar el coeficiente de correlacioacuten r de Pearson de las puntuaciones originales de 14 trabajadores que obtuvieron en dos pruebas de rendimiento laboral

Trabaj X x x2 Y y y2 Zx Zy ZxZy1 18 3 9 28 4 16 15 10 1502 18 3 9 30 6 36 15 15 2253 17 2 4 30 6 36 10 15 1504 17 2 4 26 2 4 10 05 0505 16 1 1 28 4 16 05 10 0506 16 1 1 24 0 0 05 00 0007 15 0 0 22 -2 4 00 -05 0008 15 0 0 20 -4 16 00 -10 0009 14 -1 1 26 2 4 -05 05 -02510 14 -1 1 22 -2 4 -05 -05 02511 13 -2 4 24 0 0 -10 00 00012 13 -2 4 28 -6 36 -10 -15 15013 12 -3 9 20 -4 16 -15 -10 15014 12 -3 9 18 -6 36 -15 -15 225N=14 sum =210 56 336 224 1150

sumZxZyr = ----------------- N

x` = sumxN = 21014 = 15 Zx = (x ndashxrsquo)Sx Sx = radic(sumx2N) = radic (5614) = radic 4 = 2

y` = sumyN = 33614 = 24 Zy = (y ndashyrsquo)Sy Sy = radic(sumy2N) = radic (22414) = radic 16 = 4

Zx5 = (16-15) Sx = frac12 = 050 Zx13 =(12-15)2 = -32 = -150

sumZxZyr = ----------------- = 115014 = 082 N

17

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 18: ESTADISTICA APLICADA.doc

44 Error Estaacutendar de Estimacioacuten (Syx) Si el coeficiente de correlacioacuten lineal es 100 o sea la relacioacuten entre las dos variables es perfecta entonces los valores de Y observados corresponderaacuten exactamente igual a la prevista Pero en investigaciones sociales este tipo de correlaciones perfectas no se dan

Las que si se dan usualmente son cuando la correlacioacuten es nula (r=0) existiraacute un error muy grande en toda la prediccioacuten en cambio si el coeficiente de correlacioacuten es alto (r=090) por ejemplo el error de prediccioacuten de las Y observadas con las puntuaciones y previstas seraacute miacutenimo Para hallar o medir este error se utiliza el Error Estaacutendar de Estimacioacuten

El Error Estaacutendar de Estimacioacuten variacutea entre 0 y la desviacioacuten estaacutendar de la variable dependiere (Y) y es igual a

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

Ejercicio Seguacuten el caso anterior

X Y X2 XY Y2

3 2 9 6 4

5 3 25 15 9

6 4 36 24 16

8 6 64 48 36

9 5 81 45 25

11 8 121 88 64

sum= 42 28 336 226 154

[sumXY ndash (sumX) (sumY)N ] [sumY2 - (sumY)2N] - ------------------------------- sum X2 ndash (sumX)2NSxy = radic ---------------------------------------------------------- N - 2

[226 ndash (42) (28)6 ] [154 - (28)26] - ------------------------------- 336 ndash (42)26Sxy = radic ---------------------------------------------------------- 6 - 2

[233 ndash 2143]Sxy = radic -------------------- = 0689 4

18

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 19: ESTADISTICA APLICADA.doc

ESTADIacuteSTICA APLICADACON SPSS

Ms Ing GASTOacuteN MARCO FLORES RAMOS

19

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 20: ESTADISTICA APLICADA.doc

INTRODUCCIOacuteN

El paquete estadiacutestico SPSS (Statistical Package for Social Sciences) es un software para ordenadores personales de tipo modular destinado a realizar una gran variedad de anaacutelisis estadiacutesticos

Aunque son muchos los moacutedulos que posee los maacutes importantes son

BASE Forma el nuacutecleo del sistema y como tal debe permanecer residente en memoria En eacutel se encuentran los comandos necesarios para el acceso la manipulacioacuten el anaacutelisis y la presentacioacuten de datos Nos permite acceder a una gran variedad de fuentes de datos entre las que se encuentran dBase Lotus Excel y a traveacutes de ODBC Access Paradox SQL Server Oracle y muchos maacutes Los procedimientos estadiacutesticos baacutesicos que incluye son Anaacutelisis Exploratorio de Datos Tablas de Contingencia Comparacioacuten de Medias Anaacutelisis de la Varianza Pruebas no Parameacutetricas Correlacioacuten y Regresioacuten Lineal Muacuteltiple Esta uacuteltima versioacuten del SPSS incluye ademaacutes Anaacutelisis Factorial Discriminante de Conglomerados y Caacutelculo de Proximidades

ESTADIacuteSTICAS PROFESIONALES Este moacutedulo contiene procedimientos estadiacutesticos tales como Regresioacuten logiacutestica Regresioacuten no lineal restringida y no restringida Cuadrados miacutenimos ponderados Cuadrados miacutenimos en dos fases Escalado Multidimensional Modelos Logit y Probit y Anaacutelisis de Fiabilidad

ESTADIacuteSTICAS AVANZADAS En este moacutedulo se recogen aquellos anaacutelisis estadiacutesticos avanzados como son el Modelo Lineal General (MLG) el Anaacutelisis Loglineal Hiloglineal y Genlog la Estimacioacuten de componentes de la varianza el Anaacutelisis de Supervivencia la Estimacioacuten Kaplan-Meier la Regresioacuten de Cox con covariables dependientes en el tiempo los Modelos Manova y la Biblioteca de Macros

TENDENCIAS Este es el moacutedulo dedicado al tratamiento y anaacutelisis de Series Temporales Podemos separar las series en sus componentes guardando los factores estacionales tendencias ciacuteclicas y componentes de error automaacuteticamente Incluye las Teacutecnicas de Box-Jenkins y Anaacutelisis Espectral

CATEGORIacuteAS Aquiacute se incluyen programas relativos a los Procedimientos de Escalamiento Anaacutelisis de Correspondencias Simple y Muacuteltiple

ANAacuteLISIS CONJUNTO Permite trabajar con medidas del impacto de atributos individuales en productos o preferencias de consumidores y genera tarjetas en las que los entrevistadores pueden ordenar para indicar sus preferencias en funcioacuten de los atributos

TABLAS Este uacuteltimo moacutedulo contiene los programas encaminados a la elaboracioacuten de Tablas Pivote de alta calidad con una gran cantidad de opciones de formato y presentacioacuten

El SPSS se puede emplear de una manera interactiva o como un programa en el que se procesan varias tareas de una sola vez El Meacutetodo Interactivo consiste en elegir el procedimiento estadiacutestico que se desea a traveacutes de menuacutes y cuadros de diaacutelogo que recogen los aspectos maacutes relevantes de la tarea que se vaya a realizar Como programa el SPSS estaacute organizado en base a comandos que constituyen los elementos de un lenguaje Cada procedimiento tiene asociado una serie de comandos y con la combinacioacuten de los mismos se puede elaborar un fichero de sintaxis para llevar a cabo anaacutelisis estadiacutesticos maacutes

20

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 21: ESTADISTICA APLICADA.doc

complejos Los ficheros de sintaxis se ejecutan directamente mediante la opcioacuten Ejecutar Proceso dentro del menuacute Utilidades A esta opcioacuten se la denomina Proceso por lotes

1 GENERALIDADESEl paquete estadiacutestico SPSS responde al funcionamiento de todo programa que lleva a cabo anaacutelisis estadiacutesticos pasados los datos a analizar a un fichero con las caracteriacutesticas del programa eacuteste es analizado con una serie de oacuterdenes dando lugar a unos resultados de tipo estadiacutestico que el investigador debe interpretar Este camino a seguir es el que guiaraacute la presentacioacuten de SPSS que efectuacutea este mini-manual debido a que es el camino maacutes natural de aprendizaje del mismo

11 El procedimiento general de resolucioacuten de un problema con SPSS Los pasos a seguir para llevar a cabo un anaacutelisis de tipo estadiacutestico son los siguientes 1ordm Recoger la informacioacuten del problema que se desee investigar y tenerla organizada generalmente en papel 2ordm Grabar esa informacioacuten en un archivo de datos correspondiente al programa que se va a usar en el caso de SPSS en un archivo que tiene el nombre que deseemos pero que posee forzosamente la extensioacuten sav 3ordm Sobre tal archivo de datos se llevaraacute a cabo el anaacutelisis con SPSS usando diferentes procedimientos que como veremos se seleccionan de distintos menuacutes 4ordm Los resultados de tales anaacutelisis son volcados a un visor de resultados en el que su visualizacioacuten y edicioacuten es maacutes coacutemoda y desde el que se pueden guardar en un fichero de nombre el que se desee pero de extensioacuten spo 5ordm El investigador interpreta los resultados y extrae las conclusiones que le parecen relevantes de los mismos y con eso se cierra el ciclo sobre el que estamos trabajando

El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de anaacutelisis y es el que subyace a toda la presentacioacuten que aquiacute se hace por tanto empezaremos a entrar en detalle de los pasos para llevarlo a cabo

12 La ventana principal de SPSS el Editor de datos de SPSS El paquete SPSS desde la versioacuten 7 es un paquete adaptado al entorno WINDOWS con lo cual la forma de ejecutarlo es a traveacutes de ventanas en las que se despliegan menuacutes de los que se pueden elegir distintas opciones y asiacute sucesivamente por tanto es a traveacutes de un entorno de tipo graacutefico desde donde se solventan los problemas y no a traveacutes de comandos (aunque tambieacuten se puede hacer asiacute) como se haciacutea antes en los paquetes estadiacutesticos maacutes usuales Por lo que acabamos de decir la forma de iniciar la ejecucioacuten del programa SPSS es pinchando dos veces con el ratoacuten (ldquopincharrdquo lo utilizaremos como sinoacutenimo de ldquohacer clicrdquo con el botoacuten principal del ratoacuten) en el icono de SPSS que es como el de la Figura y que se suele encontrar en el escritorio en forma de enlace o en el menuacute de inicio dentro del apartado de programas Una de las primeras tareas que tendraacute que hacer el usuario de SPSS seraacute localizar la posicioacuten del icono y adaptarlo a su gusto para que la entrada al programa sea faacutecil

Cuando se ha pinchado dos veces sobre el icono se abre la ventana principal de SPSS que es el Editor de datos de SPSS aunque tambieacuten la llamaremos ventana principal de SPSS Esta ventana tiene dos versiones o vistas vista de datos y vista de variables En la figura podemos ver la vista de datos en ella aparecen ya incorporados los datos del fichero de datos ejemplosav (que es el fichero que nos acompantildearaacute a lo largo de todo el manual) En la figura aparece la vista de variables en ella se muestran las caracteriacutesticas de todas las variables del fichero de datos De una vista a otra se cambia pinchando con el ratoacuten en la pestantildea correspondiente en la parte inferior izquierda de la ventana Dentro de la vista de datos se pueden distinguir varias zonas La primera zona (parte maacutes alta de la ventana generalmente en color azul) estaacute formada por la barra que contiene el nombre de la ventana incluyendo el nombre del fichero de datos activo si existe en nuestro caso el ejemplosav La segunda zona a destacar (justo debajo de la anterior) es la zona de los menuacutes en la que

21

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 22: ESTADISTICA APLICADA.doc

aparecen los nombres de los menuacutes desplegables que nos serviraacuten para llevar a cabo nuestras tareas

13 Menu PrincipalLos menuacutes que se pueden desplegar figuran en la siguiente tabla con una breve descripcioacuten de lo que se puede hacer con ellos descripcioacuten que corresponde en muchos casos con la de cualquier programa Windows que presenta tales menuacutes

Tabla Menuacutes de la ventana principal de SPSS

22

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 23: ESTADISTICA APLICADA.doc

Menuacute Funcioacuten Archivo Todas las funciones que se pueden hacer con archivos Abrir cerrar guardar importar

exportar imprimir etc Edicioacuten Realiza todas las funciones tiacutepicas de la edicioacuten como son cortar copiar eliminar buscar

reemplazar etc Ver Permite controlar la forma en la que se ve la pantalla principal controlando las barras que

aparecen en ella asiacute como la forma en la que se presentan los datos Datos Contiene el conjunto de acciones que se pueden llevar a cabo con los datos definir

propiedades de las variables seleccionar casos ordenar casos y muchas maacutes

Transformar Permite realizar cualquier funcioacuten conducente a crear nuevas variables a partir de otras existentes o no transformar recodificar asignar rangos etc

Analizar Acceso al conjunto de programas de SPSS que van desde la generacioacuten de una tabla de frecuencias a anaacutelisis multivariantes complejos

Graacuteficos Acceso al conjunto de graacuteficos estadiacutesticos que van desde un simple histograma al dibujo de una curva ROC

Utilidades Acceso a la descripcioacuten de las variables del fichero activo creacioacuten de grupos de variables asiacute como edicioacuten de los menuacutes

Ventana Acceso raacutepido a las ventanas de datos de resultados de sintaxis Ayuda en liacutenea sobre todo el paquete SPSS

Como se puede observar en la tabla bajo una de las letras del roacutetulo del menuacute aparece un subrayado indicando tal cosa que combinando la tecla Alt con la letra subrayada se puede desplegar el menuacute correspondiente pudiendo desplazarse uno por eacutel sin maacutes que usar las teclas de flecha presentes en el teclado

Muchas de las opciones de estos menuacutes las vamos a ir estudiando y utilizando a lo largo de este manual Comentaremos aquiacute soacutelo algunas opciones baacutesicas de uso general La opcioacuten Abrir del menuacute Archivo nos permite abrir un archivo (generalmente de datos) para empezar a trabajar con eacutel Hoy diacutea esta opcioacuten es comuacuten (y funciona igual) en casi todos los programas Windows Al pinchar sobre ella se abre una ventana como la de la Figura En la primera caja de esta ventana (justo a la derecha de Buscar en) se coloca la carpeta donde estaacute el archivo que queremos abrir pinchando en la pestantildea podemos acceder al aacuterbol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta SPSS) En la uacuteltima caja y pulsando la pestantildea podemos seleccionar el tipo de archivo que queremos abrir (por defecto aparece archivos de datos de SPSS esto es con extensioacuten sav) entonces en la segunda caja (la maacutes grande de la ventana) apareceraacute una lista con todos los archivos del tipo seleccionado que existen en la carpeta seleccionada y de ahiacute

23

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 24: ESTADISTICA APLICADA.doc

seleccionaremos el que deseemos abrir que apareceraacute escrito en la tercera caja de la ventana Finalmente pulsando el botoacuten Abrir se abriraacute el archivo Eacuteste tambieacuten se puede abrir haciendo doble clic sobre su nombre en la segunda caja

Tambieacuten en el menuacute Archivo tenemos dos opciones para guardar el fichero de datos activo La opcioacuten Guardar permite almacenar el fichero activo en un disco Si el fichero activo ha sido leiacutedo previamente se guardaraacute con el mismo nombre que teniacutea (el fichero original que existiacutea en el disco se perderaacute) Por el contrario si el fichero ha sido creado sin que exista ninguna imagen de eacutel en el disco se nos pediraacute que demos un nombre al nuevo fichero en el que se va a guardar la informacioacuten Debe quedar claro que esta opcioacuten siempre guarda un fichero de datos de SPSS es decir aqueacutel que tiene una extensioacuten sav Por el contrario la opcioacuten Guardar como permite guardar el fichero activo con otro nombre yo con formato de otras aplicaciones informaacuteticas como bases de datos u hojas de caacutelculo

Cuando se selecciona la opcioacuten se abre una ventana en la que se seleccionaraacute la carpeta donde se va a guardar el archivo se escribiraacute el nombre del archivo donde se desea guardar la informacioacuten se seleccionaraacute el tipo de archivo deseado y se pulsaraacute el botoacuten Guardar

La opcioacuten Imprimir del menuacute Archivo nos permite sacar por impresora el fichero activo (todo o una parte de eacutel) y funciona de forma similar a otras aplicaciones Windows Finalmente la opcioacuten Deshacer del menuacute Edicioacuten nos permite deshacer si es posible la uacuteltima accioacuten que hemos realizado

La tercera zona de la ventana principal de SPSS que estaacute formada por iconos es la que se denomina barra de herramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden llevar a cabo con SPSS (y de las que se desea un acceso maacutes raacutepido) cuando uno pasea el cursor por encima de los iconos se despliega un texto que indica la accioacuten que lleva a cabo Los iconos apareceraacuten resaltados o no seguacuten esteacuten o no accesibles en un momento determinado La barra de herramientas puede configurarse y antildeadir o eliminar iconos en ella pero los maacutes comunes son los que aparecen en la Figura y que seraacuten descritos cuando se utilicen por primera vez Por ahora soacutelo mencionar que los iconos 1 2 3 y 5 realizan respectivamente las funciones baacutesicas de abrir guardar imprimir y deshacer ya descritas en los paacuterrafos anteriores

24

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 25: ESTADISTICA APLICADA.doc

2 TRABAJANDO CON SPSSEn todas las situaciones la explicacioacuten se acompantildearaacute de un ejemplo que nos ayudaraacute a explicar de manera aplicada los detalles de los procedimientos que estemos estudiando tal ejemplo es el que se expone a continuacioacuten

21 Un ejemplo que nos acompantildearaacute a lo largo del manual El ejemplo que emplearemos tiene sus datos grabados en un fichero denominado ejemplosav en este fichero aparecen los datos referentes a un estudio acerca de los trabajadores de una empresa La descripcioacuten de las variables se muestra en la Tabla que pretende ser suficientemente explicativa como para que el lector entienda la informacioacuten grabada alliacute El lector deberiacutea familiarizarse con las variables presentes en el fichero pues se haraacute continua referencia en el texto a tales variables en cada uno de los apartados en los que se estudie

Tabla Descripcioacuten y nombre de las variables a usar en los ejemplos

DESCRIPCION DE LAS VARIABLES NOMBRE DE LASVARIABLES

Edad (antildeos) EDADEstado civil (0=soltero1=casado) ECIVILAntildeos en la direccioacuten actual DIRECCNIngresos familiares en miles INGRESOSCategoriacutea de ingresos en miles (1=menos de 25 2=25 a 493=50 a 74 4=75 a mas)

CATING

Nivel de educacioacuten(1=Primaria2=Segundaria3=EstSup4=Bachiller5=Titulado

EDUC

Tiempo en la empresa actual (antildeos) EMPLEOTiempo en la categoriacutea actual (1=menos de 5 2=de 5 a 15 3=mas de15) CATEMPGenero(h=hombre m=mujer) GENERONumero de personas en el hogar RESIDENTTiene internet (0=No 1=Si) INTERNETTiene TV (0=No 1=Si) TVTiene video (0=No 1=Si) VIDEOTiene computadora (0=No 1=Si) PCTiene teleacutefono (0=No 1=Si) TELEFONO

25

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 26: ESTADISTICA APLICADA.doc

Tabla Datos a usar en los ejemplos

Ndeg EDAD ECIVIL DIRECCN INGRESOS CATING EDUC EMPLEO CATEMP GEacuteNERO RESIDENT INTERNET TV VIacuteDEO PC TELEF1 55 1 12 7200 300 1 23 3 m 5 0 1 1 0 02 56 0 29 15300 400 1 35 3 h 1 0 1 1 0 03 28 1 9 2800 200 3 4 1 m 9 0 1 1 0 04 24 1 4 2600 200 4 0 1 h 3 0 1 1 1 05 25 1 2 2300 100 2 5 2 h 5 1 1 1 1 06 45 0 9 7600 400 3 13 2 h 1 1 1 1 0 07 44 1 17 14400 400 2 23 3 h 2 0 1 1 1 18 46 1 20 7500 400 1 29 3 h 4 0 1 1 0 09 41 0 10 2600 200 1 8 2 h 2 9 1 1 0 010 29 0 4 1900 100 2 10 2 m 3 0 1 1 0 011 34 0 0 8900 400 3 12 2 h 3 0 1 1 0 112 55 0 17 7200 300 3 2 1 m 1 0 1 1 0 013 28 0 9 5500 300 4 1 1 h 1 9 1 1 1 014 21 1 2 2000 100 3 0 1 m 7 0 1 1 1 115 55 0 8 28300 400 3 11 2 m 1 0 1 1 1 116 35 0 8 7000 300 3 9 2 h 1 1 1 1 1 017 45 0 4 4800 200 2 7 2 m 1 0 1 1 0 018 21 0 1 3700 200 3 0 1 h 3 0 1 1 1 019 32 0 0 2800 200 1 2 1 m 4 0 1 1 0 020 42 0 9 10900 400 3 20 3 m 1 1 1 1 1 021 40 1 12 11700 400 2 19 3 m 4 0 1 1 0 022 36 0 6 3900 200 2 0 1 m 7 0 1 1 0 023 42 1 13 5300 300 2 6 2 h 5 0 1 1 1 024 65 1 17 4200 200 2 24 3 h 2 0 1 1 0 025 52 1 5 8300 400 1 24 3 h 4 0 1 1 0 026 51 1 17 14800 400 4 10 2 h 3 0 1 1 1 127 44 1 1 2900 200 2 5 2 h 2 0 1 1 0 028 26 0 6 2800 200 4 1 1 m 1 1 1 1 1 029 41 1 19 7000 300 2 17 3 m 3 0 1 1 1 030 49 0 11 4000 200 1 8 2 h 4 0 1 1 1 031 64 0 36 10200 400 3 22 3 m 1 0 1 1 0 0

26

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 27: ESTADISTICA APLICADA.doc

32 39 0 8 6000 300 4 11 2 h 2 1 1 1 1 133 53 0 8 7800 400 2 17 3 h 1 0 1 1 0 034 38 1 17 4300 200 3 11 2 m 3 1 1 1 0 135 46 1 6 3100 200 1 15 3 m 2 0 1 1 0 036 58 0 2 6000 300 4 1 1 h 1 0 1 1 1 037 25 0 0 5800 300 3 4 1 m 1 1 1 1 1 138 57 0 28 9200 400 2 25 3 m 3 0 1 1 1 039 47 0 21 4800 200 1 23 3 h 1 0 1 1 0 040 21 0 0 1300 100 3 0 1 m 5 0 1 1 0 041 45 1 21 6700 300 1 20 3 m 2 0 1 1 0 142 56 0 7 21300 400 4 30 3 m 1 0 1 1 1 043 24 0 2 1900 100 2 0 1 h 1 0 1 1 0 144 41 0 13 5900 300 3 17 3 h 1 1 1 1 0 045 22 0 0 4500 200 4 0 1 m 3 0 1 1 1 046 54 1 9 3500 200 2 7 2 h 2 1 1 1 0 047 49 0 0 9400 400 2 17 3 m 3 0 1 1 0 048 49 0 12 3500 200 1 4 1 h 1 0 1 1 0 049 51 0 0 4700 200 5 3 1 m 1 0 1 1 1 150 58 1 10 87300 400 2 34 3 m 2 0 1 1 0 0

27

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 28: ESTADISTICA APLICADA.doc

22 Ingresando al SPSSPara ingresar al SPSS se tiene que hacer doble clic en el icono de mismo y nos presenta el primer cuadro de diaacutelogo que es el siguiente en la que podemos seleccionar la opcioacuten apropiada para nuestro ejemplo salimos de este cuadro de dialogo con cancelar

Enseguida nos muestra la pantalla completa del SPSS

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 29: ESTADISTICA APLICADA.doc

22 Creacioacuten de variables Escribimos los nombres de las variables en la columna Nombre de la pantalla SPSS como se muestra en el siguiente grafico

Enseguida definimos el tipo de dato en la Columna Tipo

29

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 30: ESTADISTICA APLICADA.doc

El siguiente pasa es completar con las columnas Anchura Decimales y Etiqueta

Para definir la columna Valores hacemos la celda de la columna Valores y la fila Ecivil

Hacemos clic en hellip y mostraraacute el siguiente cuadro de dialogo donde completamos los valores 0 = soltero y 1 casado asiacute como se muestra a continuacioacuten

30

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 31: ESTADISTICA APLICADA.doc

De la misma manera completamos los valores para todas las variables

Finalmente la vista de variables del SPPP debe verse como en la siguiente figura

23 Definicioacuten de las variables Cuando se abre SPSS aparece la matriz de datos vaciacutea indicando en ese caso que no hay ninguacuten fichero seleccionado para trabajar con eacutel es en esta situacioacuten en la que debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos de SPSS A esa situacioacuten tambieacuten se puede llegar despueacutes de haber trabajado con SPSS sin maacutes que desplegar el menuacute Archivo y elegir de eacutel la opcioacuten Nuevo y dentro de ella datos (Archivo10487741048774Nuevo10487741048774Datos) lo que haraacute que se elimine el fichero activo y se deje limpia la matriz de datos Ahora cada columna seraacute una nueva variable en potencia hasta que sea definida en cuyo caso pasaraacute a ser una variable en la nueva matriz de datos

231 El nombre de las variables Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable que se estaacute definiendo y se escribe el nombre que deseemos que tenga con un maacuteximo de 64 caracteres sin espacios en blanco empezando siempre por una letra o con el caraacutecter y no terminando con un punto Los caracteres que formen el nombre deben ser cualquier letra o diacutegito o los signos $_(eacuteste uacuteltimo no es recomendable como uacuteltimo caraacutecter)

31

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 32: ESTADISTICA APLICADA.doc

232 El tipo de las variables

Una vez escrito el nombre de la variable si se pincha en la casilla correspondiente al tipo de variable (o en cualquier otro sitio) apareceraacute para dicha variable ldquonumeacutericordquo en la columna Tipo un 8 en la columna Anchura y un 2 en la columna Decimales Esto es lo que SPSS ofrece por defecto para esa variable Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha sobre el pequentildeo recuadro gris situado en dicha casilla aparece entonces una ventana como la de la Figura en ella se puede definir el tipo de la variable de entre los que aparecen numeacuterico cadena fecha etc El formato de la ventana es muy simple a la izquierda aparecen los diferentes tipos que pueden tener las variables y a la derecha aparece el tamantildeo o caracteriacutesticas particulares de cada tipo que tambieacuten son definibles asiacute en la figura el tipo es numeacuterico y la variable tendraacute una anchura total de 8 caracteres dos de los cuales son decimales esto es lo que por defecto coloca SPSS Pero describamos los diferentes tipos

El tipo Numeacuterico es para una variable cuyos valores son nuacutemeros Los valores se muestran en el formato numeacuterico estaacutendar utilizando como delimitador decimal el especificado en la Configuracioacuten Regional del Panel de control de Windows El tipo Coma define una variable numeacuterica cuyos valores se muestran con la coma de separacioacuten de miles y con un punto como separador de la parte decimal El tipo Punto define una variable numeacuterica cuyos valores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal El tipo Notacioacuten cientiacutefica define una variable numeacuterica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez El exponente puede ir precedido de E o D con un signo opcional o por el signo solamente Por ejemplo 123 123E2 123D2 123E+2 o incluso 123+2 El tipo Fecha define una variable numeacuterica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj Para ello habraacute que seleccionar un tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo fecha Se pueden introducir las fechas utilizando como delimitadores barras guiones puntos comas o espacios en blanco El tipo Doacutelar sirve para definir una variable numeacuterica (con diferentes formatos) cuyos valores contienen un signo de doacutelar y una coma para la separacioacuten de los miles Moneda personalizada sirve para definir una variable numeacuterica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestantildea Moneda del cuadro de diaacutelogo Opciones dentro del menuacute Edicioacuten Los caracteres definidos en la moneda personalizada no pueden emplearse para la introduccioacuten de datos pero siacute los mostraraacute el Editor de Datos Por uacuteltimo el tipo Cadena define una variable cuyos valores no son numeacutericos y por ello no se utilizan en los caacutelculos Pueden contener cualesquiera caracteres hasta la longitud definida

32

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 33: ESTADISTICA APLICADA.doc

Por uacuteltimo la anchura y nuacutemero de decimales se pueden cambiar igualmente en las columnas Anchura y Decimales de la vista de variables

233 Las etiquetas de las variables

Generalmente el nombre de las variables suele tener pocos caracteres lo que hace que dicho nombre sea en muchos casos un acroacutenimo de difiacutecil traduccioacuten para el que no lo ha escrito (asiacute no es faacutecil de adivinar que con el nombre ACR124 estoy representando a la variable aclaramiento de creatinina en el primer diacutea de seguimiento en orina de 24h) por ello se suele poner una etiqueta de variable a la variable que la identifique de una manera maacutes precisa y que nos permita reconocerla cuando se presentan los resultados Esa etiqueta puede ser como maacuteximo de 130 caracteres Pero no soacutelo se puede poner una etiqueta general para la variable sino que en las variables que sean cualitativas y cuyas categoriacuteas suelen estar representadas por coacutedigos numeacutericos pueden establecerse etiquetas de valor que permitan identificar a las categoriacuteas con ellas (hacieacutendolas maacutes explicativas) en vez de con los coacutedigos numeacutericos Estas etiquetas pueden ser de hasta 60 caracteres Estas etiquetas no son viables para variables de cadena de maacutes de 8 caracteres de amplitud

234 Los datos faltantes (valores perdidos) Se produce un dato faltante cuando la informacioacuten de una variable de un individuo no existe ello puede ser debido a varias causas a que tal informacioacuten se ha perdido a que por las caracteriacutesticas particulares del individuo no puede existir o a que el individuo no ha querido proporcionar dicha informacioacuten Cuando para una variable existen datos faltantes frecuentemente se escoge un coacutedigo para representarlos debiendo proporcionarle tal coacutedigo a SPSS para que eacutel no los incluya en los anaacutelisis posteriores a esta representacioacuten de los datos faltantes se le denomina datos faltantes del usuario para distinguirlos de los datos faltantes del sistema (que se consiguen sin maacutes que dejar en blanco el espacio reservado para ellos donde si la variable es numeacuterica SPSS colocaraacute una ldquocomardquo para identificarlos) No obstante estas reglas tienen excepciones en las variables de cadena no existen datos faltantes del sistema puesto que el blanco lo interpreta SPSS como un valor tampoco se pueden definir datos faltantes del usuario en las variables de cadena de longitud superior a 8 caracteres Es importante que el usuario sepa que la identificacioacuten de datos faltantes es crucial pues si no se identifican estos seraacuten empleados con los valores que tengan dando lugar a resultados erroacuteneos Los datos faltantes (valores perdidos) del usuario se especifican pinchando sobre la casilla correspondiente de la columna Perdidos en la vista de variables y volviendo a pinchar sobre el pequentildeo recuadro gris que aparece en dicha casilla se despliega entonces una ventana

33

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 34: ESTADISTICA APLICADA.doc

Como se ve hay tres formas de indicar la presencia de datos faltantes La primera es la de indicar que no existen datos faltantes o perdidos empleando la opcioacuten No hay valores perdidos esta es la opcioacuten que de oficio ofrece SPSS indicando que no hay datos faltantes por parte del usuario pudiendo haber datos faltantes del sistema sin maacutes que hayamos dejado en blanco el espacio oportuno La segunda manera de identificar los valores que representan a los datos faltantes es presentarlos como Valores perdidos discretos indicando con ello que son valores aislados los que representaraacuten a los datos faltantes habiendo hasta tres posibilidades para ello Es posible tambieacuten que los datos faltantes esteacuten representados por valores que aparezcan seguidos de manera que sea maacutes faacutecil identificarlos a traveacutes de un maacuteximo y un miacutenimo quedando caracterizados como datos faltantes todos los que estaacuten en medio Esto es lo que permite hacer la uacuteltima opcioacuten Rango maacutes un valor perdido discreto opcional en la que ademaacutes tenemos la posibilidad de indicar un valor perdido discreto adicional Pulsando el botoacuten Aceptar volveremos a la vista de variables

24 Grabacioacuten y Edicioacuten de datos Una vez que el usuario ha definido las variables de su fichero de datos tendraacute una rejilla en la que por columnas apareceraacuten dichas variables con el nombre de cada una de ellas Es claro que tal rejilla estaraacute vaciacutea y que el siguiente paso seraacute el rellenarla a base de grabar la informacioacuten de los diferentes casos (que aparecen en el Editor de Datos por filas) Por ello lo primero que explicaremos es coacutemo se graban los datos Desde luego que antes de la grabacioacuten de casos se deberiacutea conocer coacutemo se mueve uno dentro de la rejilla de datos El movimiento maacutes simple es desplazar el cursor mediante el ratoacuten a la posicioacuten deseada y pinchar en ella con el botoacuten izquierdo Otras formas maacutes lentas es usando las teclas de flechas en las cuatro direcciones que funcionan como ellas indican

25 Introduccioacuten de los datos por casillas por filas y por columnas La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una variable columna con un caso fila) pinchando en ella con el botoacuten izquierdo del ratoacuten y escribir el valor deseado seguido de la tecla Intro Tras ello el cursor apareceraacute en la casilla inmediatamente debajo Evidentemente esto nos permitiraacute la grabacioacuten de los datos por columnas (o variables) cuando lleguemos al final de una columna pasamos al principio de la siguiente Sin embargo esta forma de grabar los datos no es la maacutes comuacuten para proceder a la grabacioacuten de un fichero de datos

La forma maacutes comuacuten es grabar los datos por filas es decir por casos Para ello se coloca el cursor en la casilla maacutes a la izquierda de una fila (de un caso) y se introduce el dato correspondiente a esa casilla seguido de la pulsacioacuten de la tecla de flecha hacia la derecha o pulsando la tecla Tab Obseacutervese que si se pulsa la tecla Intro el cursor bajaraacute una fila abajo con lo que estaraacute fuera del caso habiendo que volver a eacutel mediante la tecla hacia arriba lo que alarga claramente la grabacioacuten Cuando uno haya grabado un caso puede saltar al siguiente pulsando la tecla Intro y asiacute apareceraacute al final del nuevo caso tras lo cual

34

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 35: ESTADISTICA APLICADA.doc

pulsando la tecla Inicio estaraacute colocado en la primera variable del nuevo caso Cuando se procede asiacute SPSS identifica cada caso con un nuacutemero que es interno y que no existe como variable del fichero por lo que si el usuario desea una identificacioacuten para cada caso debe crear y grabar una variable a tal efecto lo cual es conveniente

26 Introduccioacuten de datos al SPSSDepuse de haber definido las variables proseguimos con la introduccioacuten de los datos para cada variable para esto hacemos clic en vista de datos

Y se mostraraacute la pantalla sigueinte

En la pantalla actual tipeamos los datos para cada variable a lfinal la pantalla de la vista de datos debe quedar de la siguiente manera

35

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 36: ESTADISTICA APLICADA.doc

27 Importando datos desde una hoja de caacutelculo

En lugar de escribir todos los datos directamente en el Editor de datos puede leer datos desde aplicaciones como Microsoft Excel

Tambieacuten puede leer encabezados de columnas como nombres de variablesElija en los menuacutes Archivo-Abrir-Datos

Seleccionamos el archivo de Microsoft Excel ejemploxls de la direccioacuten cejemplo de la misma forma en la que se muestra en la siguiente figura

Apareceraacute el cuadro de diaacutelogo Apertura de fuente de datos de Excel que permite especificar si se incluyen los nombres de variables en la hoja de caacutelculo

36

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 37: ESTADISTICA APLICADA.doc

En Excel 5 o posterior tambieacuten se pueden especificar las hojas de caacutelculo que se desea importar

Aseguacuterese de que estaacute activada la opcioacuten Leer nombre de variables de la primera fila de datos Esta opcioacuten lee los encabezados

Si desea importar soacutelo una parte de la hoja de caacutelculo especifique el rango de casillas que se van a importar en el campo Rango

Pulse en Aceptar para leer el archivo de Excel

Los datos apareceraacuten en el Editor de datos con los encabezados de columnas utilizados como nombres de variables

Si utiliza una aplicacioacuten de hojas de caacutelculo distinta Excel y Lotus deberiacutea poder exportar los datos a un formato admitido que a continuacioacuten pueda ser leiacutedo

Luego editamos las variables igual como en el item 22

28 Modificar valores introducidos Cortar Copiar y Pegar La grabacioacuten de datos se acoge a unos tipos de accioacuten que ha familiarizado Windows que son Cortar Copiar y Pegar Estas tres acciones se basan en la seleccioacuten del objeto sobre el que van a ser aplicadas En el caso que nos ocupa el objeto puede ser una casilla varias casillas una fila varias filas una columna o varias columnas una casilla se selecciona sin maacutes que colocarse en ella (pulsando el botoacuten izquierdo del ratoacuten sobre ella o mediante una serie de desplazamientos con las flechas) varias casillas se seleccionan sin maacutes que pinchar con el ratoacuten en una de ellas y arrastrar el mismo (moverlo con el botoacuten izquierdo pulsado) hasta la uacuteltima casilla que deseemos seleccionar apareciendo estas remarcadas para indicar que estaacuten seleccionadas es claro que el arrastrado que hemos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular La forma de seleccionar una fila (caso) es pulsar con el ratoacuten sobre el nuacutemero de caso que le ha asignado SPSS mientras que si se desean seleccionar varios casos consecutivos deberaacute arrastrarse el ratoacuten sobre ellos De manera anaacuteloga la seleccioacuten de una variable se haraacute como en los casos pero pulsando sobre la fila de nombres de las variables Resumiendo supongamos que hemos seleccionado el objeto de nuestras acciones y pasemos a describirlas

La accioacuten de Cortar hace desaparecer el objeto seleccionado que es guardado en el Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten de Copiar mantiene el objeto seleccionado a nuestra vista pero es simultaacuteneamente llevado al Portapapeles para estar disponible en una accioacuten de Pegado La accioacuten Pegar trae desde el Portapapeles el objeto alliacute colocado y lo presenta a partir de la zona seleccionada

37

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 38: ESTADISTICA APLICADA.doc

La forma de invocar esas acciones siempre a partir de un objeto seleccionado es desplegar el menuacute Editar y seleccionar de eacutel la accioacuten deseada Hay una manera alternativa que seriacutea desplegando un llamado menuacute contextual que aparece cuando se pulsa el botoacuten derecho del ratoacuten sobre el objeto seleccionado Cuando se lleva a cabo dicha accioacuten sobre un dato o conjunto de datos seleccionados el menuacute contextual que aparece es como el de la Figura 41 En este menuacute aparecen las acciones antes citadas ademaacutes de la funcioacuten Borrar que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el Portapapeles por lo que no estaraacute disponible para ser pegado La eliminacioacuten tambieacuten se puede llevar a cabo a partir del objeto seleccionado pulsando la tecla Supr

La combinacioacuten de las acciones Cortar Copiar Pegar y Borrar permite llevar a cabo acciones complejas con pocos toques de ratoacuten Asiacute por ejemplo para borrar un conjunto de datos habraacute que seleccionarlos y elegir Borrar y para repetir el mismo dato a partir de una posicioacuten determinada habraacute que copiar el dato en el Portapapeles (accioacuten Copiar) seleccionar la zona en la que se debe repetir el dato y elegir la opcioacuten Pegar

29 Edicioacuten de casos completos Para llevar a cabo las acciones que vamos a describir se necesita seleccionar un caso o un conjunto de casos La seleccioacuten se hace como acabamos de ver en el apartado anterior Como se vio las acciones se llevan a cabo o con el menuacute Edicioacuten o con el menuacute contextual el maacutes coacutemodo

El menuacute contextual que se despliega en la seleccioacuten de casos aparecen las cuatro opciones que apareciacutean para los datos como son Cortar Copiar Pegar y Borrar tales acciones han sido suficientemente explicadas anteriormente por lo que lo uacutenico que diremos aquiacute es que se comportan de manera anaacuteloga a lo visto y el lector ya sabe como funcionan No obstante aparece debajo una accioacuten que es propia de los casos Insertar casos Cuando se selecciona aparece un caso nuevo inmediatamente antes del caso seleccionado en el que toda la informacioacuten estaraacute en blanco esperando para ser rellenada si no lo fuera se entenderiacutea que en ese nuevo caso todas las variables numeacutericas tienen datos faltantes

210 Edicioacuten de variables completas Para llevar a cabo las acciones que vamos a describir se necesita seleccionar una variable o un conjunto de variables La seleccioacuten de una variable se hace pulsando el botoacuten izquierdo sobre el nombre de la misma y asiacute quedaraacute seleccionada Para seleccionar una serie de variables consecutivas bastaraacute con seleccionar la primera y arrastrar el ratoacuten hasta la uacuteltima ese arrastre se puede hacer con el botoacuten izquierdo (en cuyo caso para llevar a cabo las acciones habraacute que desplegar el menuacute Editar o el menuacute Datos) o con el botoacuten

3 FASE DE ANAacuteLISIS DE DATOS

31 Anaacutelisis de Medias de distribucioacuten central medias de dispersioacuten y graacuteficos

Este capiacutetulo describe medidas de resumen sencillas y la influencia del nivel de medida de una variable en los tipos de estadiacutesticos que se deben utilizar Utilizaremos el archivo de datos ejemplosav

Hay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del nivel de medida

Categoacuterica Datos con un nuacutemero limitado de valores o categoriacuteas distintas (por ejemplo geacutenero o estado civil) Tambieacuten se hace referencia a estos datos como datos cualitativos Las variables categoacutericas pueden ser variables de cadena (alfanumeacutericas) o variables

38

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 39: ESTADISTICA APLICADA.doc

numeacutericas que utilizan coacutedigos numeacutericos para representar las categoriacuteas (por ejemplo 0=Solteroa y 1=Casadoa) Hay dos tipos baacutesicos de datos categoacutericos

Nominal Datos categoacutericos en los que las categoriacuteas no tienen un orden inherente Por ejemplo la categoriacutea laboral de ventas no es superior o inferior a la categoriacutea laboral de marketing o investigacioacuten

Ordinal Datos categoacutericos en los que las categoriacuteas tienen un orden con significado pero sin una distancia medible entre las categoriacuteas Por ejemplo hay un orden para los valores alto medio y bajo pero no se puede calcular la distancia entre los valores

Escala Datos medidos en una escala de intervalo o de razoacuten en los que los valores de los datos indican el orden de los valores y la distancia entre ellos Por ejemplo un salario de 72195$ es superior a un salario de 52398$ y la distancia entre ambos valores es 19797$ Tambieacuten se hace referencia a estos datos como datos cuantitativos o continuos

Para los datos categoacutericos la medida de resumen maacutes habitual es el nuacutemero o el porcentaje de casos de cada categoriacutea La moda es la categoriacutea que contiene el mayor nuacutemero de casos Para los datos ordinales la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambieacuten puede ser una medida de resumen uacutetil si hay un gran nuacutemero de categoriacuteas

El procedimiento Frecuencias genera tablas de frecuencias que muestran el nuacutemero y el porcentaje de los casos de cada valor observado de una variable

39

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 40: ESTADISTICA APLICADA.doc

Elija en los menuacutes Analizar-Estadiacutesticos descriptivos-Frecuencias

Seleccione Tiene Internet (Internet) y Tiene TV (tv) y mueacutevalas hasta la lista Variable(s)Pulse en Aceptar para ejecutar el procedimiento

Las tablas de frecuencias aparecen en la ventana Visor Las tablas de frecuencias revelan que soacutelo alrededor del 18 de las personas poseen internet pero todos poseen un televisor (992) Esta puede que no sea una gran revelacioacuten aunque puede ser interesante descubrir algo maacutes acerca del pequentildeo grupo de personas que no poseen televisores

40

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 41: ESTADISTICA APLICADA.doc

Pude visualizar graacuteficamente la informacioacuten en una tabla de frecuencias con un graacutefico de barras o con un graacutefico de sectoresVuelva a abrir el cuadro de diaacutelogo Frecuencias (Las dos variables deben estar seleccionadas auacuten)

Puede utilizar el botoacuten Rellamada de cuadros de diaacutelogo de la barra de herramientas para

regresar raacutepidamente

Pulse en Graacuteficos

41

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 42: ESTADISTICA APLICADA.doc

Pulse en Graacuteficos de barras y a continuacioacuten pulse en Continuar

Pulse en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

Ademaacutes de las tablas de frecuencias la misma informacioacuten aparece ahora en forma de graacuteficos de barras con lo que puede saber observando raacutepidamente que la mayoriacutea de las personas no poseen Internet y en cambio casi todos poseen un televisor

Hay muchas medidas de resumen disponibles para variables de escala incluyendo

42

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 43: ESTADISTICA APLICADA.doc

Medidas de tendencia central Las medidas de tendencia central maacutes comunes son la media (media aritmeacutetica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos)

Medidas de dispersioacuten Los estadiacutesticos que miden la dispersioacuten o variacioacuten en los datos incluyen la desviacioacuten tiacutepica miacutenimo y maacuteximo

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Restablecer para borrar cualquier configuracioacuten anterior

Seleccione Ingresos familiares en miles (ingresos) y mueacutevala hasta la lista Variable(s)

Pulse en Estadiacutesticos

Pulse en Media Mediana Moda Desviacioacuten Tiacutepica Varianza Miacutenimo Maacuteximo Asimetriacutea y Curtosos

Pulse en Continuar

Anule la seleccioacuten (marca) de Mostrar tablas de frecuencias en el cuadro de diaacutelogo principal (Por lo general las tablas de frecuencias no son especialmente uacutetiles para variables de escala ya que debe haber casi tantos valores diferentes como casos en el archivo de datos)

Pulse en Aceptar para ejecutar el procedimiento

43

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 44: ESTADISTICA APLICADA.doc

La tabla Frecuencias Estadiacutesticos aparece en la ventana Visor

En este ejemplo existe una gran diferencia entre la media y la mediana siendo la media en torno a 28000 mayor que la mediana Esto indica que los valores no estaacuten normalmente distribuidos Podemos comprobar visualmente la distribucioacuten con un histograma

44

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 45: ESTADISTICA APLICADA.doc

Vuelva a abrir el cuadro de diaacutelogo Frecuencias

Pulse en Graacuteficos

Pulse en Histograma y Con curva normal

Pulse en Continuar y en Aceptar en el cuadro de diaacutelogo principal para ejecutar el procedimiento

La gran mayoriacutea de casos se agrupan en la parte inferior de la escala estando incluidos la mayoriacutea de ellos por debajo de 100000 Sin embargo hay algunos casos en el rango 500000 e incluso maacutes allaacute (demasiado escasos para que sean visibles sin modificar el histograma) Estos valores demasiado altos para soacutelo unos pocos casos tienen un efecto importante sobre la media y muy escaso o casi nulo sobre la mediana lo que hace que la mediana sea un indicador maacutes exacto de la tendencia central en este ejemplo

45

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 46: ESTADISTICA APLICADA.doc

4 CREACION Y EDICION DE GRAFICOS

Hay una gran variedad de tipos de graacuteficos disponibles y muchos de ellos en dos formatos diferentes

Graacuteficos normales Graacuteficos creados desde el menuacute principal Graacuteficos y graacuteficos creados mediante procedimientos estadiacutesticos

Graacuteficos interactivos Graacuteficos creados desde el submenuacute Interactivos del menuacute Graacuteficos y graacuteficos creados desde las tablas pivote

41 Crear Graacuteficos

En este ejemplo crearemos un graacutefico de sectores simple que muestre cuaacutentos encuestados disponen de servicio de Internet en casaElija en los menuacutes Graacuteficos - Sectores

46

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 47: ESTADISTICA APLICADA.doc

Pulse en Resuacutemenes para grupos de casos y a continuacioacuten pulse en Definir

Ya que deseamos basar el graacutefico en una variable uacutenica hemos seleccionado Resuacutemenes para grupos de casos Los elementos de graacuteficos (barras sectores del graacutefico) tambieacuten se pueden basar en resuacutemenes de variables distintas o en valores de casos individuales del archivo de datos Seleccione Internet como la variable que define los sectores (Definir sectores por)Pulse en Aceptar para crear el graacutefico de sectores

Del graacutefico de sectores se concluye que la mayoriacutea de los encuestados no disponen de servicio de Internet en casa Al observar el graacutefico pareceriacutea que soacutelo un cuarto de los encuestados aproximadamente dispone de servicio de Internet

47

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 48: ESTADISTICA APLICADA.doc

41 Editar graacuteficosPuede editar graacuteficos de diversas formas Con este graacutefico de sectores de muestra podriacuteamos

Antildeadir un tiacutetulo Eliminar la pequentildea categoriacutea de datos perdidos Mostrar porcentajes para las dos categoriacuteas restantes del graacutefico

Lo primero que haremos seraacute antildeadir un tiacutetulo

Pulse dos veces en el graacutefico de sectores para abrirlo en el Editor de graacuteficos

En los menuacutes del Editor de graacuteficos seleccione Graacutefico - Tiacutetulo

48

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 49: ESTADISTICA APLICADA.doc

En Tiacutetulo 1 introduzca Servicio de Internet en casa y a continuacioacuten pulse en Aceptar

Ahora apareceraacute un tiacutetulo descriptivo sobre el graacutefico de sectores

Ahora eliminaremos la pequentildea categoriacutea de datos perdidos Si desea obtener informacioacuten sobre los datos perdidos consulte Tratamiento de los datos perdidos

En los menuacutes del Editor de graacuteficos seleccione Serie ndash Visualizada

49

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 50: ESTADISTICA APLICADA.doc

Desplace Perdido desde la lista Mostrar hasta la lista Omitir y pulse en Aceptar

Se ha eliminado la categoriacutea de datos perdidos del graacutefico de sectores dejando soacutelo dos categoriacuteas

El graacutefico de sectores muestra claramente que la mayoriacutea de los encuestados no dispone de servicio de Internet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categoriacutea No pero puede resultar uacutetil consultar los porcentajes exactos

Pulse dos veces en una de las dos etiquetas de las categoriacuteas (No o Siacute)

Seleccione (marque) Porcentajes

50

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 51: ESTADISTICA APLICADA.doc

Mientras nos encontremos aquiacute movamos las etiquetas de categoriacuteas del exterior al interior del graacutefico de sectores

Pulse en Formato

Seleccione Interior de la lista desplegable

Anule la seleccioacuten (marca) de Etiquetas interiores para eliminar el marco de visualizacioacuten

Pulse en Continuar y a continuacioacuten pulse en Aceptar

Ahora los porcentajes aparecen junto a las etiquetas de categoriacutea y ambos aparecen en el interior de los sectores del graacutefico de sectores

Los porcentajes se basan en las dos categoriacuteas mostradas (816 + 184 = 100) Si vuelve a colocar la categoriacutea que contiene los valores perdidos en el graacutefico de sectores cambiaraacuten los porcentajes

43 Graacuteficos interactivos

Los graacuteficos interactivos se crean seleccionando un tipo de graacutefico en el submenuacute Interactivos del menuacute Graacuteficos

51

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 52: ESTADISTICA APLICADA.doc

Elija en los menuacutes Graacuteficos - Interactivos - Barras

Arrastre y coloque Tiene teleacutefono (telef) (dispone de Teleacutefono) en la lista del eje x (horizontal)

Arrastre y coloque Categoriacutea de ingresos en miles (cating) en la lista Color

Pulse en Aceptar para crear el graacutefico

Advertiraacute que no se trata de un graacutefico particularmente atractivo Esto se debe a que los graacuteficos interactivos tratan de forma distinta las variables categoacutericas y las de escala y Tiene Teleacutefono (telefono) se encuentra definida como variable de escala Ya que se trata realmente de una variable categoacuterica podemos cambiar la definicioacuten de variable en el Editor

52

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 53: ESTADISTICA APLICADA.doc

de datos o simplemente indicar al procedimiento de graacuteficos interactivos que la trate como una variable categoacuterica

Vuelva a abrir el cuadro de diaacutelogo del graacutefico de barras interactivo

Pulse con el botoacuten derecho del ratoacuten en Tiene teleacutefono (telefono) en la lista del eje x (horizontal)

Seleccione Categoacuterica en el menuacute contextual emergente y a continuacioacuten pulse en Aceptar para crear el graacutefico

Ahora el graacutefico de barras agrupadas tiene un aspecto maacutes agradable

53

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 54: ESTADISTICA APLICADA.doc

Aunque puede realizar modificaciones en los graacuteficos interactivos de igual forma que en los graacuteficos normales la edicioacuten de graacuteficos interactivos se ha disentildeado para que sea maacutes directa y sencilla

Pulse dos veces en el graacutefico para activarlo

Los graacuteficos interactivos se activan y editan en su lugar en la ventana Visor (a diferencia de los graacuteficos normales que se abren en una ventana distinta para su edicioacuten

Para cambiar el color de una barra por lo general soacutelo tiene que pulsar en una barra para seleccionarla y a continuacioacuten seleccionar otro color de la paleta Color de relleno en la barra de herramientas vertical Pero en este ejemplo de barras agrupadas los colores se

54

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 55: ESTADISTICA APLICADA.doc

asocian a pares de barras y por eso se cambia el color seleccionando la categoriacutea de barra en la leyenda

Pulse en el cuadrado de color proacuteximo a la categoriacutea 25 - 49 de la leyenda

Pulse en la fecha hacia abajo proacutexima al icono Color de relleno en la barra de herramientas vertical y seleccione un nuevo color

El color se aplica a las dos barras que representan la categoriacutea 25 - 49

55

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 56: ESTADISTICA APLICADA.doc

En este ejemplo no es necesario el texto de las claves que se encuentra bajo la leyenda puesto que el eje de la escala ya tiene la etiqueta Recuentos Para eliminar el texto de las claves

Pulse con el botoacuten derecho del ratoacuten en el texto y seleccione Ocultar la clave en el menuacutecontextual emergente

Ahora el texto de las claves estaacute oculto

44 Creacioacuten de un graacutefico a partir de una tabla pivotePuede crear graacuteficos interactivos a partir de datos contenidos en una tabla pivote

Active (pulse dos veces en) la tabla pivote

Pulse y arrastre el ratoacuten para seleccionar las casillas de datos que desea utilizar en el graacutefico

56

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 57: ESTADISTICA APLICADA.doc

Pulse con el botoacuten derecho del ratoacuten en cualquier punto del aacuterea seleccionada

Seleccione en el menuacute contextual emergente Crear graacutefico - Barras

Se crearaacute un graacutefico interactivo con los datos seleccionados

57

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 58: ESTADISTICA APLICADA.doc

V REGRESIOacuteN Y CORRELACIOacuteN LINEAL SIMPLE CON SPSS

Ejemplo de Regresioacuten Lineal Simple con SPSS 1 En un estudio sobre gastos mensuales (Y) e ingresos econoacutemicos mensuales (X) una muestra de 10 familias dio la siguiente informacioacuten ( en doacutelares USA)X 280 250 350 400 450 500 500 350 550 600Y 250 200 320 370 400 400 450 300 490 550

a) Trazar e interpretar el diagrama de dispersioacutenb) Calcular y analizar el coeficiente de correlacioacuten lineal de Pearsonc) Estimar y comentar la ERP lineal simple de miacutenimos cuadradosd) iquestCuaacutel seraacute el gasto y ahorro de una familia cuyo ingreso sea 300 500 y 700

doacutelares Ademaacutes iquestcuaacutel seriacutea el gasto y ahorro si una familia no tiene ingresos econoacutemicos

Solucioacuten

a) Diagrama de dispersioacutenCreamos las variables e introducimos los datos en SPSS de la siguiente manera

1 Tomado del Fasciacuteculo 7 de Estadiacutestica Descriptiva Con SPSS CENCAP-UNCP-2004

58

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 59: ESTADISTICA APLICADA.doc

Se sigue la secuencia Graacuteficos ndash Dispersioacuten en el menuacute principalSe elige la opcioacuten SimpleSE pulsa el botoacuten Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes) a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y

59

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 60: ESTADISTICA APLICADA.doc

Se pulsa Aceptar

Si se desea mostrar los valores perdidos se pulsa el botoacuten Opciones del cuadro Diagrama de Dispersioacuten simple accediendo al cuadro Opciones en donde se marca la opcioacuten Mostrar los Grupos definidos por los valores perdidos

60

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 61: ESTADISTICA APLICADA.doc

InterpretacioacutenLa nube de puntos y la liacutenea recta creciente sobre ella revelan que existe una relacioacuten lineal creciente significativa entre gastos e ingresos econoacutemicos de las familias

b) Coeficientes de correlacioacuten lineal de PearsonSigue la secuencia Analizar ndash Correlaciones - Bivariadas del menuacute principal

Se elige y se transfieren las variables INGRESOS y GASTOS a la casilla VariablesSe activa la opcioacuten Bilateral de la seccioacuten Pruebas de significacioacuten para evaluar la significacioacuten de dos colas (bilateral) del coeficienteSe activa la opcioacuten Marcar las correlaciones significativas para mostrar la significacioacuten del cociente

Se pulsa aceptar

61

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 62: ESTADISTICA APLICADA.doc

AnaacutelisisEl coeficiente de correlacioacuten lineal de Pearson entre ingresos econoacutemicos y gastos es muy alto (0986) y altamente significativo (plt0001) Este resultado permite afirmar que la correlacioacuten entre estas variables es positiva por tanto la relacioacuten entre gastos e ingresos es lineal y creciente

c) Estimacioacuten de la ERP lineal simpleSe sigue la secuencia Analizar ndash Regresioacuten ndash Lineal

Se eligen y se transfieren las variables INGRESOS a la casilla Independientes y GASTOS a la casilla DependientesSe elige el meacutetodo de regresioacuten lineal Introducir

62

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 63: ESTADISTICA APLICADA.doc

Se pulsa el botoacuten OpcionesSe marca la opcioacuten Incluir constante en la ecuacioacuten para estimar la ordenada en el origen B0 ademaacutes de la pendiente B1

Se pulsa el botoacuten ContinuarSe pulsa el botoacuten EstadiacutesticaSe marcan las opciones Estimaciones y Ajuste del modelo de la seccioacuten Coeficientes de regresioacuten

Se pulsa los botones Continuar y AceptarCuando se desea estimar el modelo si el coeficiente B0 (constante o teacutermino independiente) se desmarca la opcioacuten Incluir constante en la ecuacioacuten del cuadro Regresioacuten lineal OpcionesSi se desea calcular algunas medidas de resumen se pulsa el botoacuten Estadiacutesticas del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Estadiacutesticos donde se marcan las opciones matriz de covarianza y DescriptivosSi se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable se pulsa el botoacuten Opciones del cuadro Regresioacuten lineal ingresando al cuadro Regresioacuten lineal Opciones En este cuadro se marca las opciones excluir casos perdidos seguacuten parejas o Excluir casos seguacuten lista de la seccioacuten Valores perdidos

63

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 64: ESTADISTICA APLICADA.doc

Comentario

En la primera tabla (resumen del modelo) se aprecia el coeficiente de correlacioacuten lineal de Pearson reg el coeficiente de determinacioacuten (R cuadrado) el coeficiente de determinacioacuten corregido a ajustado (R cuadrado corregido) y el error tiacutepico o estaacutendar de la estimacioacuten (error tiacutep de la estimacioacuten)

El coeficiente de correlacioacuten de Pearson es 0986 el coeficiente de determinacioacuten es 0972 y el coeficiente de determinacioacuten corregido es 0986 Estos iacutendices revelan que la correlacioacuten entre las variables es positiva y muy alta casi perfecta y que el 972 de la variabilidad de los gastos se explican por los ingresos (casi total) El error estaacutendar de la estimacioacuten es 19 346

En la segunda tabla (ANOVA) se aprecia el anaacutelisis de varianza (Anaacutelisis Of Variante) Con esta teacutecnica se evaluacutea la significacioacuten estadiacutestica del modelo de regresioacuten esto es se evaluacutea la significacioacuten estadiacutestica de los paraacutemetros B0 y B1 son muy significativos en forma conjunta o simultanea Como Sig = 0 se deduce que el MRLS es altamente significativo (plt0001) es decir los paraacutemetros B0 y B1 son muy significativos en forma conjunta El hecho de decir que son significativos significa que los valores de los paraacutemetros son diferentes de 0 Si Sig gt 005 entonces el modelo no es significativo y por tanto no existe una relacioacuten lineal entre las variables

64

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 65: ESTADISTICA APLICADA.doc

En la tercera tabla (Coeficientes) se observan las estimaciones de los paraacutemetros B0 y B1 y su significacioacuten estadiacutestica individual La estimacioacuten de B0 es -15565 (Constantes o teacutermino independiente) el cual no es significativo ( Sig = 0539) pgt005) La estimacioacuten de B1 es 0919 (INGRESOS) el cual es altamente significativo (Sig = 0000 plt001) Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS seriacutea

Y = -15565 + 0919 X

Es decir

Gastos = -15565 + 0919 Ingresos

Sin embargo como el coeficiente B0 no es significativo se vuelve a correr el programa ajustado un MRLS sin el teacutermino independiente (regresioacuten lineal a traveacutes del origen) Lo resultados son los siguientes

65

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66

Page 66: ESTADISTICA APLICADA.doc

Con estos resultados la estimacioacuten de la ecuacioacuten del MRLS es

Y = 0884 X

Es decir

Gastos = 0884 Ingresos

Como b1gt0 entonces la tendencia lineal es creciente es decir a mayores ingresos econoacutemicos correspondes mayores gastos y a menores ingresos econoacutemicos correspondes menores gastos La recta de regresioacuten corta al eje Y (ingresos) en $ 0(B0 = 0) es decir la recta pasa por el punto (00) por cada doacutelar USA que cambia los ingresos econoacutemicos los gastos cambian en 88 ceacutentimos de doacutelar ($ 088)

d) Pronoacutesticos o predicciones

Si el ingreso de una familia es $ 300 entonces el gasto se obtiene sustituyendo 300 en Gastos = 0884 Ingresos dicho gasto seriacutea $ 26520 El ahorro es el gasto menos el ingreso el cual seriacutea $ 3480

Si el ingreso de una familia es $ 500 entonces el gasto seriacutea $ 442 y el ahorro $ 58

Si el ingreso de una familia es $ 700 entonces el gasto seriacutea $ 6188 y el ahorro 812

Si una familia no tiene ingresos entonces el gasto seriacutea $ 0 y el ahorro $ 0

66