carla rodríguez francisco Álvarez métodos cuantitativos capitulo 9, spss para windows
TRANSCRIPT
• Carla Rodríguez• Francisco Álvarez
Métodos Cuantitativos Capitulo 9, SPSS para Windows
Obtener funciones lineales de las variables independientes
Clasificar individuos en una de las subpoblaciones por los valores de la variable dependiente
(x …, x ), i=1,…n,1i ip
Sea…
La expresión de una función discriminante, D , será:
= + … + + sD 1sB 1X spB pX 0sB
BBBd s0sp1s1is ... xx ipi
Ejemplo: muestra de 132 observaciones de las variables
REAPARIC: Tiempo de reaparición de úlcera (meses) Valores: 4, 8, 12 y 16 meses, codificados como 1, 2, 3 y 4
RESPUEST: Tiempo de respuesta al tratamiento (semanas)
TABACO: El paciente ha dejado de fumar durante tratamiento Valores: Sí o No, codificados como 1 y 2
ALCOHOL: Consumo de alcohol (gramos diarios)
CAFÉ: Consumo de café Valores: 0,…, 9 (de nada a mucho)
ANTIACID: Consumo de antiácidos Valores: 0,…, 9 (de nada a mucho)
•ANALIZAR – CLASIFICAR – DISCRIMINANTE•VARIABLE DE AGRUPACION: REAPARIC (1, 4)•INDEPENDIENTE
Tiempo de RespuestaConsumo de alcoholConsumo de caféConsumo de antiácidosPaciente ha dejado de fumar
•USAR METODO DE INCLUSION POR PASOS•CLASIFICAR
Probabilidades previas: SEGÚN TAMAÑO DE GRUPOSMostrar: RESULTADOS PARA CADA CASO, TABLA RESUMEN
•Continuar•SELECCIONAR
Variable selección: filter_$1•ACEPTAR
Se trata de obtener unas funciones lineales de las variables independientes RESPUEST,
TABACO, ALCOHOL, CAFÉ y ANTIACID de la forma:
= RESPUEST + TABACO + ALCOHOL +
+ CAFÉ + ANTIACID +
sD 1sB 2sB 3sB
4sB 5sB 0sB
Objetivo: predecir el tiempo de reaparición de la sintomatología ulcerosa para cualquier paciente que haya sido sometido
al tratamiento
Para un conjunto de p variables independientesmide las desviaciones totales sin distinguir
grupos, en el espacio p-dimensionalgenerado por los valores dentro de cada gruporespecto a las desviaciones de las p variables.
En cada paso se introduce la variable que minimiza
la Lambda de Wilks
Figura 9.5b
Número de variables seleccionadasen una etapa q
Variable candidata a ser seleccionadaen la etapa siguiente q + 1
Estadístico F de entradaEvalúa la disminución que se produciría
en Lambda de Wilks si la variablecorrespondiente fuera seleccionada
Estadístico F de salidaEvalúa el incremento que se produciría en la Lambda de Wilks si la variable
correspondiente fuera eliminada
Tolerancia, con variables , …, , , …,
= 1 -
1jX
jTol 2jR
es el cuadrado del coeficiente de correlaciónmúltiple entre y las variables , …, , , …,
2jR
jX 1jX1X 1jX pX
1jX1X 1jX pX
Siguiendo con el ejemplo…
Variable de mínimo valor de la Lambda de Wilks
RESPUEST
Mayor que 3.83
<< F que introducir = 119.221>>
Figura 9.5b
Tabla <<Variables no incluidas en el análisis>>
En el siguiente paso, de entre las restantes variables independientes(segundo bloque tabla <<Variables no incluidas en el análisis>>)
Mínimo valor en la columna de Lambda de Wilks ALCOHOL
F de entrada = 121. 93
Mayor que 3.84
Una vez comprobado que ninguna variable puede ser eliminada, el siguiente paso será comprobar si la F de entrada
correspondiente a la variable candidata a ser seleccionada, a la que proporcione el mínimo valor de la Lambda Wilks, es mayor que 3.84
TABACO
F de entrada = 55.571
Mayor que 3.84
Candidata a ser seleccionada en el cuarto paso ANTIACID
F de entrada = 1.284
Menor que 3.84En consecuencia, dado que ninguna variablemás puede ser eliminada o seleccionada,
el proceso finaliza.
Valor Lambda Wilkspara el conjunto de variables seleccionadas
RESPUEST, ALCOHOL, TABACO, = 0.107
s = 1, 2, 3 e i = 1, …, 312 BTABACOBALCOHOLBRESPUESTBd s0is3S2s1is
ii
= RESPUEST + TABACO + ALCOHOL +
+ CAFÉ + ANTIACID +
sD 1sB 2sB 3sB
4sB 5sB 0sB
El valor de la Lambda de Wilks para el conjunto de variables independientes coincide con el correspondiente el conjunto de variables independientes
seleccionadas
Figura 9.5c
Medidas relacionadas con la Lambda de Wilks
Permiten evaluar la información que aportará cada función discriminante
Correlación canónicaDesviaciones de las puntuaciones
discriminantes entre grupos respectoa las desviaciones totales sin distinguir
grupos
AutovalorDesviaciones de las puntuaciones
discriminantes entre grupos respectoa las desviaciones dentro de los
grupos
A partir de las funciones discriminantes tipificadas
Figura 9.5c <<Coeficientes estandarizados de las fun. Discriminantes canónicas>>
Figura 9.5d
Figura 9.5e
• ANALIZAR – CLASIFICAR – DISCRIMINANTE• RESTABLER•VARIABLE DE AGRUPACION: REAPARIC (1, 4)•INDEPENDIENTES
Tiempo de respuestaConsumo de alcoholPaciente ha dejado de fumar
• INTRODUCIR INDEPENDIENTES JUNTAS• CLASIFICAR
Probabilidades previas: según tamaño de gruposMostrar: tabla resumenContinuar
• GUARDARGrupo de pertenencia pronosticadoProbabilidades de pertenencia al grupocontinuar
• ACEPTAR
Figura 9.6
Figura 9.9