regresión en ncss

45
Agente de Ventas • Un gerente desea predecir el rendimiento potencial de agentes de ventas (JOBPER) con base en mediciones en las siguientes variables: AGRESIVIDAD (X1, AG), ENTUSIASMO (X2, EN), AMBICIÓN (X3, AM), HABILIDADES DE COMUNICACIÓN (X4, HC), SIMPATÍA (X5, SI) e INICIATIVA (X6, IN).

Upload: upeap

Post on 25-Jul-2015

3.272 views

Category:

Travel


5 download

TRANSCRIPT

Page 1: RegresióN en Ncss

Agente de Ventas

• Un gerente desea predecir el rendimiento potencial de agentes de ventas (JOBPER) con base en mediciones en las siguientes variables: AGRESIVIDAD (X1, AG), ENTUSIASMO (X2, EN), AMBICIÓN (X3, AM), HABILIDADES DE COMUNICACIÓN (X4, HC), SIMPATÍA (X5, SI) e INICIATIVA (X6, IN).

Page 2: RegresióN en Ncss

JOBPER AG EN AM HC SI IN45 74 29 40 66 93 4765 65 50 64 68 74 4973 71 67 79 81 87 3363 64 44 57 59 85 3783 79 55 76 76 84 3345 56 48 54 59 50 4260 68 41 66 71 69 3773 76 49 65 75 67 4374 83 71 77 76 84 3369 62 44 57 67 81 4366 54 52 67 63 68 3669 61 46 66 64 75 4371 63 56 67 60 64 3570 84 82 68 64 78 3779 78 53 82 84 78 3983 65 49 82 65 55 3875 86 63 79 84 80 4167 61 64 75 60 81 4567 71 45 67 80 86 4852 59 67 64 69 79 5452 71 32 44 48 65 4366 62 51 72 71 81 4355 67 51 60 68 81 3942 65 41 45 55 58 5165 55 41 58 71 76 3568 78 65 73 93 77 4280 76 57 84 85 79 3550 58 43 55 56 84 4087 86 70 81 82 75 3084 83 38 83 69 79 41

Page 3: RegresióN en Ncss

Esta es la hoja de trabajo cuando entras a NCSS.Esta es la hoja de trabajo cuando entras a NCSS.

Puedes entrar en esta pestaña para cambiar el nombre de las variables

C1, C2, C3, … son los nombres de las variables por default.

1, 2, 3, … son el número de casos que estamos analizando.

Page 4: RegresióN en Ncss

Así quedan los nombres de las variables para el ejemplo, donde las variables serán nombradas con números del 1 a 7, en el orden en que se introdujeron:

1=JOBPER

2=AG

3=EN

4=AM

5=HC

6=SI

7=IN

Page 5: RegresióN en Ncss

Esta es la hoja que contiene “Variable Info” y contiene información de las variables.Esta es la hoja que contiene “Variable Info” y contiene información de las variables.

Aquí puedes cambiar el nombre de las variables.

Page 6: RegresióN en Ncss

Después te regresas a la hoja de trabajo “Sheet1” y escribes uno a uno todos los datos o si los tienes en Excel los copias.

Page 7: RegresióN en Ncss

Para correr el modelo de regresión sigues estas instrucciones: Analysis Para correr el modelo de regresión sigues estas instrucciones: Analysis Regression/Correlation Regression/Correlation Multiple Regression Multiple Regression Enter; te aparecerá la ventana Enter; te aparecerá la ventana del lado derecho.del lado derecho.

Page 8: RegresióN en Ncss

Colocamos el cursor en donde está el 1 que indica que la variable JOBPER es por default la variable dependiente, si requieres cambiar la variable estando en esta casilla debes seleccionar Select Variables.

Como no hicimos ningún cambio, nos queda la misma variable por default, si hubiéramos seleccionado EN como variable dependiente, en este recuadro en lugar de 1 aparecería el número 3.

Para este ejemplo está JOBPER como variable dependiente, si otra fuera la variable dependiente, aquí debes cambiarla.

Page 9: RegresióN en Ncss

Ahora colocamos el cursos donde está el 2 que indica que la variable AG es por default la variable independiente, si requieres cambiar la variable o agregar otras, estando en esta casilla debemos seleccionar Select Variables.

Aquí es donde se seleccionan las variables independientes, para este ejemplo seleccionamos AG, EN, AM, HC, SI y IN como variables independientes.

Como seleccionamos de la segunda a la séptima variable (AG, EN, AM, HC, SI, IN) como independientes, en esta casilla aparece 2-7.

Page 10: RegresióN en Ncss

En la pestaña Filter Active puedes cambiar el nivel de significancia para las pruebas de hipótesis, generalmente se utilizan alguno de los siguientes:

• 90% de confianza o 0.10 de significancia.

• 95% de confianza o 0.05 de significancia.

• 99% de confianza o 0.01 de significancia.

Page 11: RegresióN en Ncss

Finalmente se corre el modelo de regresión:

Run Run Run Procedure Run Procedure

Page 12: RegresióN en Ncss

Estos son los resultados que arroja NCSS de la corrida del modelo de regresión.Estos son los resultados que arroja NCSS de la corrida del modelo de regresión.

Page 13: RegresióN en Ncss

Modelo de regresión lineal múltiple ajustado.Modelo de regresión lineal múltiple ajustado.

0.418IN-24SI0.00.072HC-0.859AM0.189EN-0.233AG914.22^

JOBPER

Modelo de regresión lineal múltiple estimado o ajustado.

Page 14: RegresióN en Ncss

Análisis de Varianza para probar la significancia de la regresión

...0:

0:

1

654321

junaparamenosalH

H

j

o

Como el Prob Level=0.00000 es menor al nivel de significancia α=0.05, rechazamos la Ho a favor de H1, por lo tanto el modelo es singificativo, es otras palabras al menos un parámetro βj es diferente a cero o significativo.

Todos los juegos de hipótesis para este problema lo haremos con un nivel de Todos los juegos de hipótesis para este problema lo haremos con un nivel de confianza del 95% que equivale a un nivel de significancia del 5%=0.05=confianza del 95% que equivale a un nivel de significancia del 5%=0.05=αα..

La regla en todo juego de hipótesis, sin importar de qué juego de hipótesis se trate es: La regla en todo juego de hipótesis, sin importar de qué juego de hipótesis se trate es: RECHAZAR LA HIPÓTESIS NULA (HRECHAZAR LA HIPÓTESIS NULA (HOO) A FAVOR DE LA ALTERNATIVA (H) A FAVOR DE LA ALTERNATIVA (H11) si el ) si el

valor P o Prob Level es menor al nivel de significancia valor P o Prob Level es menor al nivel de significancia αα..

Page 15: RegresióN en Ncss

Coeficiente de determinación RR22=0.8484 = 84.84%=0.8484 = 84.84% y coeficiente de determinación ajustado RR22

adjadj=0.8088=80.88=0.8088=80.88. Ambos miden el porcentaje de variación de la variable dependiente (JOBPER) que es explicado por todas las variables independiente.

Page 16: RegresióN en Ncss

Prueba de significancia individual de cada uno de los coeficientes Prueba de significancia individual de cada uno de los coeficientes de regresión (variables independiente).de regresión (variables independiente).

Para ver con cual hipótesis nos quedamos en cada uno de los juegos, debemos comparar el nivel de significancia α=0.05 con el Pro Level, la regla es la misma vista en la significancia del modelo. NCSS nos dice en la penúltima columna si rechazamos o aceptamos la Ho . Podemos observa que en este caso rechazamos la Ho en el juego tres y seis a favor de H1. Por lo tanto podemos concluir que solo AM y IN contribuyen en forma significativa al modelo.

0:

0:

11

1

H

Ho

0:

0:

21

2

H

Ho

0:

0:

31

3

H

Ho

0:

0:

41

4

H

Ho

0:

0:

51

5

H

Ho

0:

0:

61

6

H

Ho

Page 17: RegresióN en Ncss

Intervalos de confianza individuales para los coeficientes de regresiónIntervalos de confianza individuales para los coeficientes de regresión

136.1583.0 3 252.0204.0 5

Intervalos de confianza para β3 (AM) y β5 (SI) al 95% de confianza.

Page 18: RegresióN en Ncss

Prueba F parcial para determinar la contribución de una variable al modeloPrueba F parcial para determinar la contribución de una variable al modelo

Para encontrar estas dos SSR debemos correr en NCSS por separado los dos modelos de regresión (uno con las seis variables independientes y otro con las cinco variables independientes) y en la tabla del análisis de la varianza obtenemos las SSR respectivamente.

Supongamos que tenemos el modelo original con cinco variables independientes:

SIHCAMAG 543210 ENY

Queremos ver la contribución de IN al modelo, la hipótesis correspondiente es:

0:

0:

61

6

H

Ho

Para probar esta hipótesis se necesita:

),,,,,(),,,,,,(),,,,,/( 01234501234560123456 RRR SSSSSS

1 / 3

Page 19: RegresióN en Ncss

Prueba F parcial para determinar la contribución de una variable al modeloPrueba F parcial para determinar la contribución de una variable al modelo

Esta es la contribución a la suma de cuadrados del modelo original (el que tiene 5 variables independientes) al agregar IN.

),,,,,(),,,,,,(),,,,,/( 01234501234560123456 RRR SSSSSS

2 / 3

SSR para el modelo completo, es decir para el modelo con las seis variables independientes.

SSR para el modelo completo, es decir para el modelo con las seis variables independientes.

Modelo con seis variables

Modelo con cinco variables

= 3630.283 – 3503.522 = 126.761

Page 20: RegresióN en Ncss

Prueba F parcial para determinar la contribución de una variable al modeloPrueba F parcial para determinar la contribución de una variable al modelo

Para probar la hipótesis inicial utilizamos el estadístico de prueba F0:

0:

0:

61

6

H

Ho

1 / 3

493.4214.28761.1261/),,,,,/( 0123456

RES

Ro MS

SSF

MSRES

Modelo con seis variables

Buscamos en la al final del libro en la tabla de la distribución F el valor crítico con un grado de libertad en el numerador y 23 en el denominador con un nivel de significancia de 0.05.

28.423,1,05.0 F

Como Fo=4.493 es mayor a rechazamos la hipótesis nula a favor de la hipótesis alternativa, por lo que el parámetro β6 es estadísticamente significativo o en otras palabras la variable IN si contribuye al modelo de regresión, observa que esta conclusión es semejante a la que se obtuvo en las pruebas anteriores.

28.423,1,05.0 F

Page 21: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

Supongamos que queremos establecer un intervalo de confianza del 95% para el puntaje mediopuntaje medio en la variable JOBPERP cuando AG= 79, EN=53, AM=70, HC=68, SI=85 y IN=40.

1 / 23

01''

0

2^

,2

0

^

001''

0

2^

,2

0

^

)()|()( xXXxtyxyExXXxtypnpn

858.71

418.0*40024.0*85072.0*68859.0*70189.0*53233.0*79914.22*1

418.0

024.0

072.0

859.0

189.0

233.0

914.22

4085687053791^

'00

^

xy

Page 22: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

Supongamos que queremos establecer un intervalo de confianza del 95% para el puntaje mediopuntaje medio en la variable JOBPERP cuando AG= 79, EN=53, AM=70, HC=68, SI=85 y IN=40.

2 / 23

069.223,025.0730,

2

05.0,2

tttpn

α = 0.05 el nivel de significancia correspondiente al 95% de confianza

n = tamaño de la muestra o total de casos analizados

P = número de parámetros a estimar, en este caso son 7: β0, β1, β2, β3, β4, β5, β6, β7.

01''

0

2^

,2

0

^

001''

0

2^

,2

0

^

)()|()( xXXxtyxyExXXxtypnpn

Page 23: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

Supongamos que queremos establecer un intervalo de confianza del 95% para el puntaje mediopuntaje medio en la variable JOBPERP cuando AG= 79, EN=53, AM=70, HC=68, SI=85 y IN=40.

3 / 23

01''

0

2^

,2

0

^

001''

0

2^

,2

0

^

)()|()( xXXxtyxyExXXxtypnpn

MSRES

Modelo con seis variables

214.282^

RESMS

Page 24: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

Supongamos que queremos establecer un intervalo de confianza del 95% para el puntaje mediopuntaje medio en la variable JOBPERP cuando AG= 79, EN=53, AM=70, HC=68, SI=85 y IN=40.

4 / 23

01''

0

2^

,2

0

^

001''

0

2^

,2

0

^

)()|()( xXXxtyxyExXXxtypnpn

Para obtener (X’X)-1 seguimos las instrucciones de Excel siguientes:

Page 25: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

5 / 23

Page 26: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

6 / 23

Page 27: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

7 / 23

Page 28: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

8 / 23

Page 29: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

9 / 23

Page 30: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

10 / 23

Page 31: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

11 / 23

Page 32: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

12 / 23

Page 33: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

13 / 23

Page 34: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

14 / 23

Page 35: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

15 / 23

Page 36: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

16 / 23

Page 37: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

17 / 23

Page 38: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

18 / 23

Page 39: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

19 / 23

Page 40: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

20 / 23

De manera semejante obtenemos la multiplicación de x’0 por (X’X)-1 con la función MMULT, x’0 son los valores de la variable independiente que nos proporciona el problema y solo le agregamos al inicio un uno, el tamaño de la matriz x’0(X’X)-1 tiene siempre un renglón y el número total de columnas es igual al número total de columnas de (X’X)-1en este caso es de 1 por 7.

Page 41: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

21 / 23

De manera semejante obtenemos la multiplicación x’0 (X’X)-1 por x0 con la función MMULT, para obtener x’0 (X’X)-1 por x0, es este caso el resultado siempre será un solo número porque x’0 (X’X)-1 tiene un renglón y x0 también solo tiene un renglón por lo que el resultado será de tamaño 1 por 1.

Page 42: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

22 / 23

Page 43: RegresióN en Ncss

Intervalo de confianza de la respuesta media Intervalo de confianza de la respuesta media

Supongamos que queremos establecer un intervalo de confianza del 95% para el puntaje mediopuntaje medio en la variable JOBPERP cuando AG= 79, EN=53, AM=70, HC=68, SI=85 y IN=40.

23 / 23

01''

0

2^

,2

0

^

001''

0

2^

,2

0

^

)()|()( xXXxtyxyExXXxtypnpn

Finalmente ya podemos obtener el intervalo solicitado.

923.75)|(793.67 0 xyE

1368.0*214.28069.2858.71)|(1368.0*214.28069.2858.71 0 xyE

Page 44: RegresióN en Ncss

Intervalo de confianza para una nueva predicción Intervalo de confianza para una nueva predicción

Supongamos que queremos establecer un intervalo de predicción del 95% para la variable JOBPERP cuando AG= 79, EN=53, AM=70, HC=68, SI=85 y IN=40, vemos que el procedimiento es muy semejante al anterior, solo la fórmula cambia de la siguiente manera:

1 / 1

))(1())(1( 01''

0

2^

,2

0

^

001''

0

2^

,2

0

^

xXXxtyyxXXxtypnpn

Con los datos calculados en el ejemplo anterior podemos solo sustituir y hacer las operaciones para obtener el intervalo de predicción solicitado.

)1368.01(214.28069.2858.71)1368.01(214.28069.2858.71 0 y

780.73936.69 0 y

Page 45: RegresióN en Ncss

Análisis de residualesAnálisis de residuales

Normal probability plot para probar normalidad en los residuales.

Gráfica para probar independencia en los residuales.

Gráfica para homogeneidad o o igualdad de varianzas en los residuales.