curso estadistica en r - web viewcurso estadistica en r. ... otro de los miembros también...
TRANSCRIPT
Curso estadistica en REncuesta de presupuestos familiares
La Encuesta de presupuestos familiares (EPF) suministra información anual sobre la naturaleza y destino de los gastos de consumo, así como sobre diversas características relativas a las condiciones de vida de los hogares.
Se leen los datos de ingresos y gastos de hogares del fichero de microdatos de la Encuesta de Presupuestos Familiares de 2014. Base 2006.
library(MicroDatosEs)
## Warning: package 'MicroDatosEs' was built under R version 3.2.4
## Loading required package: memisc
## Warning: package 'memisc' was built under R version 3.2.4
## Loading required package: lattice## Loading required package: MASS## ## Attaching package: 'memisc'## ## The following objects are masked from 'package:stats':## ## contr.sum, contr.treatment, contrasts## ## The following object is masked from 'package:base':## ## as.array## ## Loading required package: Hmisc
## Warning: package 'Hmisc' was built under R version 3.2.4
## Loading required package: survival## Loading required package: Formula
## Warning: package 'Formula' was built under R version 3.2.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 3.2.4
## ## Attaching package: 'Hmisc'## ## The following objects are masked from 'package:memisc':##
## %nin%, html## ## The following objects are masked from 'package:base':## ## format.pval, round.POSIXt, trunc.POSIXt, units
#setwd("//S-00-AA-017/Usuarios/U-06/prf11440/Curso estadistica en R")setwd("~/Curso de estadistica con R")ecpf2014 <- epf.2011.hogares("Fichero de usuario de hogar a2014.txt")str(ecpf2014)
## Data set with 22146 obs. of 191 variables:## $ anoenc : Itvl. item + ms.v. num 2014 2014 2014 2014 2014 ...## $ numero : Itvl. item num 1 2 3 4 5 6 7 8 9 10 ...## $ ccaa : Nmnl. item w/ 19 labels for 1,2,3,... num 10 1 13 1 17 16 12 6 10 12 ...## $ nuts1 : Nmnl. item w/ 7 labels for 1,2,3,... num 5 6 3 6 2 2 1 1 5 1 ...## $ caprov : Nmnl. item w/ 2 labels for 1,6 num 1 6 6 1 1 6 6 6 6 6 ...## $ tamamu : Nmnl. item w/ 5 labels for 1,2,3,... num 1 5 1 1 1 3 2 4 5 5 ...## $ densi : Nmnl. item w/ 3 labels for 1,2,3 num 1 3 1 1 1 1 1 2 3 3 ...## $ clave : Nmnl. item w/ 2 labels for 1,2 num 1 2 2 1 1 2 1 2 1 2 ...## $ clateo : Nmnl. item w/ 2 labels for 1,2 num 2 2 2 1 1 2 2 2 1 2 ...## $ factor : Itvl. item num 1.65e+09 1.43e+09 1.37e+09 7.34e+08 8.12e+07 ...## $ nmiemb : Itvl. item num 3 2 2 5 5 3 2 3 3 3 ...## $ tamano : Nmnl. item w/ 6 labels for 1,2,3,... num 3 2 2 5 5 3 2 3 3 3 ...## $ nmiemsd : Itvl. item num 0 0 0 0 0 0 0 0 0 0 ...## $ nmiemhu : Itvl. item num 0 0 0 0 0 0 0 0 0 0 ...## $ nmiemin : Itvl. item num 0 0 0 0 0 0 0 0 0 0 ...## $ nmiem1 : Itvl. item num 3 2 2 5 4 2 2 2 2 3 ...## $ nmiem2 : Itvl. item num 0 0 0 0 1 1 0 1 1 0 ...## $ nmiem3 : Itvl. item num 0 0 0 1 1 1 0 1 1 0 ...## $ nmiem4 : Itvl. item num 3 2 2 4 4 2 2 2 2 3 ...## $ nmiem5 : Itvl. item num 0 0 0 1 2 1 0 1 1 0 ...## $ nmiem6 : Itvl. item num 3 2 2 4 3 2 2 2 2 3 ...## $ nmiem7 : Itvl. item num 0 0 0 0 0 0 0 0 1 0 ...## $ nmiem8 : Itvl. item num 0 0 0 1 1 1 0 1 0 0 ...## $ nmiem9 : Itvl. item num 0 0 0 2 2 0 0 0 0 0 ...## $ nmiem10 : Itvl. item num 1 1 0 0 0 0 0 0 2 0 ...## $ nmiem11 : Itvl. item num 2 1 1 2 2 2 0 2 0 2 ...## $ nmiem12 : Itvl. item num 0 0 1 0 0 0 2 0 0 1 ...## $ nmiem13 : Itvl. item num 0 0 0 0 0 0 0 0 0 0 ...## $ numacti : Itvl. item num 1 2 0 2 1 2 0 1 2 2 ...
## $ numinacti : Itvl. item num 2 0 2 2 3 0 2 1 0 1 ...## $ numocu : Itvl. item num 1 2 0 2 1 2 0 1 2 2 ...## $ numnocu : Itvl. item num 2 0 2 2 3 0 2 1 0 1 ...## $ numestu : Itvl. item num 0 0 0 2 2 0 0 0 0 0 ...## $ numnoestu : Itvl. item num 3 2 2 2 2 2 2 2 2 3 ...## $ nninosd : Itvl. item num 0 0 0 3 3 1 0 1 1 0 ...## $ nhijosd : Itvl. item num 0 0 0 3 3 1 0 1 1 0 ...## $ uc1 : Itvl. item num 24 17 17 38 36 22 17 22 22 24 ...## $ uc2 : Itvl. item num 20 15 15 30 28 18 15 18 18 20 ...## $ pf2teo : Itvl. item num 2 1 1 4 3 1 1 1 1 2 ...## $ pf2reco : Itvl. item num 2 1 1 4 3 1 1 1 1 2 ...## $ tiphogar1 : Nmnl. item w/ 12 labels for 1,2,3,... num 11 10 5 11 11 7 5 7 7 12 ...## $ tiphogar2 : Nmnl. item w/ 12 labels for 1,2,3,... num 11 10 5 11 11 7 5 7 7 12 ...## $ tiphogar3 : Nmnl. item w/ 12 labels for 1,1,2,... num 10 10 4 8 8 6 4 6 6 10 ...## $ tiphogar4 : Nmnl. item w/ 12 labels for 1,2,3,... num 7 6 5 11 11 9 5 9 9 7 ...## $ tiphogar5 : Nmnl. item w/ 12 labels for 1,2,3,... num 7 6 5 11 11 9 5 9 9 7 ...## $ tiphogar6 : Nmnl. item w/ 10 labels for 1,2,3,... num 4 3 5 7 7 7 5 7 6 10 ...## $ tiphogar7 : Nmnl. item w/ 8 labels for 1,2,3,... num 4 7 3 6 6 4 3 4 4 8 ...## $ tiphogar8 : Nmnl. item w/ 4 labels for 1,2,3,... num 4 4 1 4 4 3 1 3 3 4 ...## $ tiphogar9 : Nmnl. item w/ 6 labels for 1,2,3,... num 3 2 2 5 5 5 2 5 5 3 ...## $ tiphogar10 : Nmnl. item w/ 6 labels for 1,2,3,... num 6 6 3 4 4 4 3 4 4 6 ...## $ tiphogar11 : Nmnl. item w/ 6 labels for 3,4,5,... num 6 6 3 4 4 4 3 4 4 6 ...## $ situocuhog : Nmnl. item w/ 8 labels for 1,2,3,... num -9 -9 8 2 5 2 8 5 2 2 ...## $ situacthog : Nmnl. item w/ 8 labels for 1,2,3,... num -9 -9 8 2 5 2 8 5 2 2 ...## $ nordensp : Itvl. item num 1 1 1 1 1 2 2 1 1 1 ...## $ edadsp : Itvl. item num 29 64 66 53 53 39 74 50 30 58 ...## $ sexosp : Nmnl. item w/ 2 labels for 1,6 num 6 6 1 1 1 1 1 1 6 1 ...## $ paisnacodsp : Nmnl. item w/ 4 labels for 1,2,3,... num 3 1 1 1 1 1 1 1 1 1 ...## $ nacionasp : Nmnl. item w/ 3 labels for 1,2,3 num 2 1 1 1 1 1 1 1 1 1 ...## $ paiscodsp : Nmnl. item w/ 3 labels for 1,2,3 num 2 NA NA NA NA NA NA NA NA NA ...
## $ situressp : Nmnl. item w/ 2 labels for 1,6 num 1 1 1 1 1 1 1 1 1 1 ...## $ ecivillegalsp: Nmnl. item w/ 5 labels for 1,2,3,... num 1 3 2 2 2 2 2 2 1 2 ...## $ nordencosp : Itvl. item num 99 99 2 2 2 1 1 2 2 2 ...## $ unionsp : Nmnl. item w/ 3 labels for 1,2,3 num NA NA 1 1 1 1 1 1 2 1 ...## $ convivenciasp: Nmnl. item w/ 3 labels for 1,2,3 num 3 3 1 1 1 1 1 1 2 1 ...## $ nordenpasp : Itvl. item num 2 99 99 99 99 99 99 99 99 99 ...## $ paispadresp : Nmnl. item w/ 4 labels for 1,2,3,... num 3 1 1 1 1 1 1 1 1 1 ...## $ nordenmasp : Itvl. item num 3 99 99 99 99 99 99 99 99 99 ...## $ paismadresp : Nmnl. item w/ 4 labels for 1,2,3,... num 3 1 1 1 1 1 1 1 1 1 ...## $ estudiossp : Nmnl. item w/ 11 labels for 1,2,3,... num 11 2 2 9 5 6 3 4 7 4 ...## $ estudredsp : Nmnl. item w/ 4 labels for 1,2,3,... num 4 1 1 4 3 4 2 3 4 3 ...## $ situactsp : Nmnl. item w/ 8 labels for 1,2,3,... num 1 1 4 1 1 1 4 1 1 1 ...## $ situredsp : Nmnl. item w/ 2 labels for 1,2 num 1 1 2 1 1 1 2 1 1 1 ...## $ ocusp : Nmnl. item w/ 2 labels for 1,2 num 1 1 2 1 1 1 2 1 1 1 ...## $ jornadasp : Nmnl. item w/ 2 labels for 1,2 num 1 1 NA 1 1 1 NA 1 1 1 ...## $ percepsp : Nmnl. item w/ 2 labels for 1,6 num 1 1 1 1 1 1 1 1 1 1 ...## $ impexacpsp : Itvl. item num -9 -9 1167 5000 1100 ...## $ impuexacpsp : Nmnl. item w/ 2 labels for 1,6 num NA NA NA NA NA NA NA NA NA NA ...## $ interinpsp : Nmnl. item w/ 7 labels for 1,2,3,... num 5 3 3 7 3 3 2 4 3 3 ...## $ impuinterpsp : Nmnl. item w/ 2 labels for 1,6 num NA NA NA NA NA NA NA NA NA NA ...## $ trabajo : Nmnl. item w/ 2 labels for 1,6 num 1 1 1 1 1 1 1 1 1 1 ...## $ ocupa : Nmnl. item w/ 10 labels for 0,1,2,... num 2 1 7 2 7 3 7 3 2 8 ...## $ ocupared : Nmnl. item w/ 5 labels for 1,2,3,... num 2 1 4 2 4 2 4 2 2 4 ...## $ actestb : Nmnl. item w/ 21 labels for 9,A,B,... chr "M" "I" "C" "O" ...## $ actestbred : Nmnl. item w/ 3 labels for 1,2,3 num 3 3 2 3 2 2 2 2 3 3 ...## $ sitprof : Nmnl. item w/ 4 labels for 1,2,3,... num 2 3 1 1 1 1 1 1 2 3 ...## $ sector : Nmnl. item w/ 2 labels for 1,2 num -9 -9 6 1 6 6 6 1 -9 -9 ...
## $ tipocont : Nmnl. item w/ 3 labels for 1,2,3 num -9 -9 1 1 1 1 2 1 -9 -9 ...## $ sitsoci : Nmnl. item w/ 11 labels for 1,2,3,... num 5 5 8 4 1 2 8 4 5 5 ...## $ sitsocire : Nmnl. item w/ 6 labels for 1,2,3,... num 3 3 5 2 1 2 5 2 3 3 ...## $ regten : Nmnl. item w/ 6 labels for 1,2,3,... num 3 1 1 2 1 2 1 1 2 1 ...## $ tipoedif : Nmnl. item w/ 5 labels for 1,2,3,... num 4 2 4 2 4 4 2 4 3 3 ...## $ zonares : Nmnl. item w/ 7 labels for 1,2,3,... num 3 7 3 3 3 3 3 3 3 3 ...## $ tipocasa : Nmnl. item w/ 3 labels for 1,2,3 num 2 2 2 2 2 2 2 2 2 2 ...## $ nhabit : Itvl. item num 4 5 5 7 5 5 4 5 5 5 ...## $ annocon : Nmnl. item w/ 2 labels for 1,6 num 6 6 6 6 1 1 6 1 1 6 ...## $ superf : Itvl. item num 90 120 85 160 89 91 90 80 110 125 ...## $ aguacali : Nmnl. item w/ 2 labels for 1,6 num 1 1 1 1 1 1 1 1 1 1 ...## $ fuenagua : Nmnl. item w/ 6 labels for 1,2,3,... num 1 1 1 2 2 2 3 2 2 3 ...## $ calef : Nmnl. item w/ 2 labels for 1,6 num 6 6 1 1 1 1 6 1 1 1 ...## [list output truncated]
Estimación del gasto de los hogares utilizando las variables:
GASTMON:Importe total del gasto monetario anual del hogar elevado temporal y poblacionalmente. (para el salario en especie se contabiliza sólo el importe del pago realizado por el hogar).
IMPEXAC: Importe exacto de los ingresos mensuales netos totales del hogar.
Definimos el gasto por hogar y estimamos una regresión lineal entre gastos e ingresos
## ## Call:## lm(formula = ecpf2014$GAST ~ ecpf2014$impexac)## ## Residuals:## Min 1Q Median 3Q Max ## -9737.1 -623.1 -198.5 426.2 14583.7 ## ## Coefficients:## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 1.000e+03 1.290e+01 77.52 <2e-16 ***## ecpf2014$impexac 7.130e-01 5.613e-03 127.02 <2e-16 ***## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## ## Residual standard error: 1062 on 22144 degrees of freedom## Multiple R-squared: 0.4215, Adjusted R-squared: 0.4215 ## F-statistic: 1.613e+04 on 1 and 22144 DF, p-value: < 2.2e-16
Realizamos el test de heterocedasticidad de White
## Warning: package 'tseries' was built under R version 3.2.3
## ## White Neural Network Test## ## data: x and y## X-squared = 733.59, df = 2, p-value < 2.2e-16
Seleccionamos el conjunto de las variables explicativas y utilizamos el método fordward para seleccionar el mejor modelo:
## 'data.frame': 22146 obs. of 15 variables:## $ nmiemb : num 3 2 2 5 5 3 2 3 3 3 ...## $ nmiem10 : num 1 1 0 0 0 0 0 0 2 0 ...## $ nmiem11 : num 2 1 1 2 2 2 0 2 0 2 ...## $ nmiem12 : num 0 0 1 0 0 0 2 0 0 1 ...## $ nmiem13 : num 0 0 0 0 0 0 0 0 0 0 ...## $ numacti : num 1 2 0 2 1 2 0 1 2 2 ...## $ numinacti : num 2 0 2 2 3 0 2 1 0 1 ...## $ numocu : num 1 2 0 2 1 2 0 1 2 2 ...## $ numnocu : num 2 0 2 2 3 0 2 1 0 1 ...## $ numestu : num 0 0 0 2 2 0 0 0 0 0 ...## $ numnoestu : num 3 2 2 2 2 2 2 2 2 3 ...## $ tiphogar1 : Factor w/ 12 levels "Una persona de 65 o más años",..: 11 10 5 11 11 7 5 7 7 12 ...## $ situocuhog : Factor w/ 8 levels "El sustentador principal y el cónyugeocupados, al menos otro de los miembros también ocupado",..: NA NA 8 2 5 2 8 5 2 2 ...## $ situacthog : Factor w/ 8 levels "El sustentador principal y el cónyuge activos, al menos otro de los miembros también activo",..: NA NA 8 2 5 2 8 5 2 2 ...## $ ecpf2014.impexac: num 2191 2702 1167 5167 1100 ...
## Warning: package 'leaps' was built under R version 3.2.4
## Warning in leaps.setup(x, y, wt = wt, nbest = nbest, nvmax = nvmax,## force.in = force.in, : 2 linear dependencies found
## Reordering variables and trying again:
## (Intercept) ## 2199.60830 ## nmiemb ## 68.89259 ## nmiem11 ## 150.39439 ## nmiem13 ## -207.45699 ## numinacti ## 245.64795 ## tiphogar1Una persona de 30 a 64 años ## -340.29367 ## tiphogar1Pareja con un hijo menor de 16 años ##
-193.07523 ## situocuhogNingún ocupado en el hogar ## -962.83813 ## situacthogEl sustentador principal o el cónyuge activo, otro de los miembros también activo ## -261.19099 ## numnoestu ## 27.50668
## Warning in leaps.setup(x, y, wt = wt, nbest = nbest, nvmax = nvmax,## force.in = force.in, : 2 linear dependencies found
## Reordering variables and trying again:
## (Intercept) ## 1304.18978 ## nmiem11 ## 190.55392
## numinacti ## 433.17028 ## numocu ## 778.31319 ## tiphogar1Una persona de 30 a 64 años ## -431.29516 ## tiphogar1Pareja con un hijo menor de 16 años ## -114.01739 ## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años ## -235.18192 ## tiphogar1Pareja con al menos un hijo de 16 o más años ## -76.90113 ## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados ## -48.45166 ## numnoestu ## -109.02717
## Warning in leaps.setup(x, y, wt = wt, nbest = nbest, nvmax = nvmax,## force.in = force.in, : 2 linear dependencies found
## Reordering variables and trying again:
## (Intercept) ## 1309.40766 ## nmiem11 ## 198.12087 ## numinacti ## 450.72299 ## numocu ## 743.69648 ## tiphogar1Una persona de 30 a 64 años ## -442.02853 ## tiphogar1Pareja con un hijo menor de 16 años ## -111.73727 ## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años ## -235.82705 ## tiphogar1Pareja con al menos un hijo de 16 o más años ## -53.99281 ## numnocu ## -46.21486 ## numnoestu ## -81.87241
Modelos ANOVA
Estimamos un modelo ANOVA utilizando situacthog.
Situacthog caracteriza los siguiente hogares:
1 El sustentador principal y el cónyuge activos, al menos otro de los miembros también activo
2 El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay)
3 El sustentador principal o el cónyuge activo, otro de los miembros también activo
4 El sustentador principal o el cónyuge activo, al menos otros dos miembros activos
5 El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay)
6 Ni el sustentador principal ni su cónyuge activos, otro miembro activo
7 Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos
8 Ningún activo en el hogar
-9 No consta
## Nmnl. item w/ 8 labels for 1,2,3,... num [1:22146] -9 -9 8 2 5 2 8 5 2 2 ...
## Df Sum Sq Mean Sq F value Pr(>F) ## ecpf2014$situacthog 1 2.002e+08 200217093 103.2 <2e-16 ***## Residuals 22144 4.295e+10 1939679 ## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Warning in replications(paste("~", xx), data = mf): non-factors ignored:## ecpf2014$situacthog
## Tables of effects## ## ecpf2014$situacthog ## ecpf2014$situacthog## -9 ## -174.61 ## El sustentador principal y el cónyuge activos, al menos otro de los miembros también activo ## -11.93 ## El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) ## 4.34 ## El sustentador principal o el cónyuge activo, otro de los miembros también activo
## 20.61 ## El sustentador principal o el cónyuge activo, al menos otros dos miembros activos ## 36.88 ## El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) ## 53.14 ## Ni el sustentador principal ni su cónyuge activos, otro miembro activo ## 69.41 ## Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos ## 85.68 ## Ningún activo en el hogar ## 101.95
Utilizando la función lm, e incluyendo un termino constante.
En R las variables categoricas se definen como factores.
## Analysis of Variance Table## ## Response: ecpf2014$GAST## Df Sum Sq Mean Sq F value## as.factor(ecpf2014$situacthog) 7 3.1069e+09 443837987 235.76## Residuals 17763 3.3440e+10 1882556 ## Pr(>F) ## as.factor(ecpf2014$situacthog) < 2.2e-16 ***## Residuals ## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## ## Call:## lm(formula = ecpf2014$GAST ~ as.factor(ecpf2014$situacthog))## ## Residuals:## Min 1Q Median 3Q Max ## -2786.4 -916.6 -291.0 602.9 15163.9 ## ## Coefficients:## Estimate## (Intercept)
2962.27## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) -175.84## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo -169.71## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos -69.96## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) -376.67## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo -430.30## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 44.69## as.factor(ecpf2014$situacthog)Ningún activo en el hogar -1097.17## Std. Error## (Intercept) 39.89## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) 43.02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 68.28## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 101.52## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 49.07## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo 63.51## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 99.79## as.factor(ecpf2014$situacthog)Ningún activo en el hogar 44.19## t value## (Intercept) 74.258## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge
activos, ninguno de los otros miembros activos (si es que los hay) -4.087## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo -2.485## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos -0.689## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) -7.676## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo -6.776## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 0.448## as.factor(ecpf2014$situacthog)Ningún activo en el hogar -24.827## Pr(>|t|)## (Intercept) < 2e-16## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) 4.39e-05## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 0.0129## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 0.4908## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 1.73e-14## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo 1.28e-11## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 0.6543## as.factor(ecpf2014$situacthog)Ningún activo en el hogar < 2e-16##
## (Intercept) ***## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) ***## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge
activo, otro de los miembros también activo * ## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos ## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) ***## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo ***## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos
## as.factor(ecpf2014$situacthog)Ningún activo en el hogar ***## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1## ## Residual standard error: 1372 on 17763 degrees of freedom## (4375 observations deleted due to missingness)## Multiple R-squared: 0.08501, Adjusted R-squared: 0.08465 ## F-statistic: 235.8 on 7 and 17763 DF, p-value: < 2.2e-16
Partiendo de la base de datos "ecpf2014" preparamos un "Chunk" , con la función lm, utilizando ahora como explicativas la iteración situacthog e ingresos del hogar :
## Analysis of Variance Table## ## Response: ecpf2014$GAST## Df Sum Sq## as.factor(ecpf2014$situacthog) 7 3.1069e+09## ecpf2014$impexac 1 1.2390e+10## as.factor(ecpf2014$situacthog):ecpf2014$impexac 7 5.0244e+07## Residuals 17755 2.0999e+10## Mean Sq F value## as.factor(ecpf2014$situacthog) 4.4384e+08 375.2692## ecpf2014$impexac 1.2390e+10 10476.2225## as.factor(ecpf2014$situacthog):ecpf2014$impexac 7.1777e+06 6.0688## Residuals 1.1827e+06
## Pr(>F) ## as.factor(ecpf2014$situacthog) < 2.2e-16 ***## ecpf2014$impexac < 2.2e-16 ***## as.factor(ecpf2014$situacthog):ecpf2014$impexac 4.283e-07 ***## Residuals ## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## ## Call:## lm(formula = ecpf2014$GAST ~ as.factor(ecpf2014$situacthog) * ## ecpf2014$impexac)## ## Residuals:## Min 1Q Median 3Q Max ## -9823.3 -636.2 -196.5 438.8 14496.5 ## ## Coefficients:## Estimate## (Intercept) 1.305e+03## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) -1.448e+02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 2.115e+02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 5.031e+01## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo -2.192e+01## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 2.123e+02## as.factor(ecpf2014$situacthog)Ningún activo en el hogar -4.798e+02## ecpf2014$impexac 6.550e-01## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 3.608e-02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo:ecpf2014$impexac -2.959e-03## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos:ecpf2014$impexac -1.035e-01## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 7.593e-03## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo:ecpf2014$impexac
-8.069e-02## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos:ecpf2014$impexac -1.082e-01## as.factor(ecpf2014$situacthog)Ningún activo en el hogar:ecpf2014$impexac 7.477e-02## Std. Error## (Intercept) 5.801e+01## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) 6.350e+01## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 1.083e+02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 1.431e+02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 7.141e+01## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo 9.778e+01## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 1.508e+02## as.factor(ecpf2014$situacthog)Ningún activo en el hogar 6.453e+01## ecpf2014$impexac 1.922e-02## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 2.146e-02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo:ecpf2014$impexac 4.133e-02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos:ecpf2014$impexac 4.732e-02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 2.690e-02## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo:ecpf2014$impexac 3.681e-02## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos:ecpf2014$impexac
4.765e-02## as.factor(ecpf2014$situacthog)Ningún activo en el hogar:ecpf2014$impexac 2.551e-02## t value## (Intercept) 22.494## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) -2.280## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 0.543## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 1.478## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 0.704## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo -0.224## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 1.408## as.factor(ecpf2014$situacthog)Ningún activo en el hogar -7.435## ecpf2014$impexac 34.071## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 1.682## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo:ecpf2014$impexac -0.072## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos:ecpf2014$impexac -2.188## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 0.282## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo:ecpf2014$impexac -2.192## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos:ecpf2014$impexac -2.271## as.factor(ecpf2014$situacthog)Ningún activo en el hogar:ecpf2014$impexac
2.931## Pr(>|t|)## (Intercept) < 2e-16## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) 0.02264## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 0.58748## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 0.13935## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 0.48114## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo 0.82267## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 0.15904## as.factor(ecpf2014$situacthog)Ningún activo en el hogar 1.09e-13## ecpf2014$impexac < 2e-16## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 0.09266## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo:ecpf2014$impexac 0.94293## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos:ecpf2014$impexac 0.02868## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 0.77773## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo:ecpf2014$impexac 0.02842## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos:ecpf2014$impexac 0.02313## as.factor(ecpf2014$situacthog)Ningún activo en el hogar:ecpf2014$impexac 0.00338##
## (Intercept) ***## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) * ## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo
## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos
## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay)
## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo
## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos
## as.factor(ecpf2014$situacthog)Ningún activo en el hogar ***## ecpf2014$impexac ***## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac . ## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo:ecpf2014$impexac
## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos:ecpf2014$impexac * ## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac ## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo:ecpf2014$impexac * ## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos:ecpf2014$impexac * ## as.factor(ecpf2014$situacthog)Ningún activo en el hogar:ecpf2014$impexac ** ## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1## ## Residual standard error: 1088 on 17755 degrees of freedom## (4375 observations deleted due to missingness)
## Multiple R-squared: 0.4254, Adjusted R-squared: 0.4249 ## F-statistic: 876.4 on 15 and 17755 DF, p-value: < 2.2e-16
Utilizando la selección de variables del Ejemplo 2.4, vamos a estimar un modelo utilizando la distribución de poisson y un tipo de función vinculo logarítmica.
Definimos como pobres, aquellos hogares que tienen un ingreso percápita inferior al 60% de la mediana.
## 'data.frame': 22146 obs. of 17 variables:## $ nmiemb : num 3 2 2 5 5 3 2 3 3 3 ...## $ nmiem10 : num 1 1 0 0 0 0 0 0 2 0 ...## $ nmiem11 : num 2 1 1 2 2 2 0 2 0 2 ...## $ nmiem12 : num 0 0 1 0 0 0 2 0 0 1 ...## $ nmiem13 : num 0 0 0 0 0 0 0 0 0 0 ...## $ numacti : num 1 2 0 2 1 2 0 1 2 2 ...## $ numinacti : num 2 0 2 2 3 0 2 1 0 1 ...## $ numocu : num 1 2 0 2 1 2 0 1 2 2 ...## $ numnocu : num 2 0 2 2 3 0 2 1 0 1 ...## $ numestu : num 0 0 0 2 2 0 0 0 0 0 ...## $ numnoestu : num 3 2 2 2 2 2 2 2 2 3 ...## $ tiphogar1 : Factor w/ 12 levels "Una persona de 65 o más años",..: 11 10 5 11 11 7 5 7 7 12 ...## $ situocuhog : Factor w/ 8 levels "El sustentador principal y el cónyugeocupados, al menos otro de los miembros también ocupado",..: NA NA 8 2 5 2 8 5 2 2 ...## $ situacthog : Factor w/ 8 levels "El sustentador principal y el cónyuge activos, al menos otro de los miembros también activo",..: NA NA 8 2 5 2 8 5 2 2 ...## $ ecpf2014.impexac: num 2191 2702 1167 5167 1100 ...## $ ingpc : num 730 1351 584 1033 220 ...## $ pobre : num 0 0 0 0 1 0 1 0 0 0 ...
## ## 0 1 ## 17167 4979
Seleccionamos el mejor modelo explicativo del ingreso per capita por el método exahustivo:
## Warning in leaps.setup(x, y, wt = wt, nbest = nbest, nvmax = nvmax,## force.in = force.in, : 2 linear dependencies found
## Reordering variables and trying again:
## (Intercept) ## 1085.7566205 ## nmiemb ## -202.4482883 ## nmiem11 ## 59.8275149 ## nmiem12 ## 96.5363080 ## numacti ## -101.0224460 ## numocu ## 262.9822263 ## tiphogar1Pareja con tres o más hijos menores de 16 años ##
97.1311348 ## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años ## 0.7449329 ## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) ## 76.1584450 ## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados ## 18.3472987
Estimamos un modelo de regresión logistica con las variables antes seleccionadas, y realizamos una métrica para ver los resultados obtenidos.
## ## Call:## glm(formula = datos$pobre ~ nmiemb + nmiem11 + nmiem12 + numinacti + ## numocu + tiphogar1 + situocuhog, family = binomial, data = datos)## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## -4.2262 -0.5534 -0.3793 -0.1508 3.1110 ## ## Coefficients:## Estimate## (Intercept) -4.14848## nmiemb 1.28891## nmiem11 -0.33676## nmiem12 -0.58754## numinacti -0.79681## numocu -1.48083## tiphogar1Una persona de 30 a 64 años 1.48108## tiphogar1Una persona de menos de 30 años 2.12256## tiphogar1Un adulto con niños menores de 16 años 1.63159## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65
años o más 1.11722## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 1.22699## tiphogar1Pareja con un hijo menor de 16 años 1.34991## tiphogar1Pareja con dos hijos menores de 16 años 0.79569## tiphogar1Pareja con tres o más hijos menores de 16 años 0.61444## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 1.61232## tiphogar1Pareja con al menos un hijo de 16 o más años 1.72535## tiphogar1Otros hogares 1.35285## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) -0.49194## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.49830## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.07988## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.69903## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.26688## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.09918## situocuhogNingún ocupado en el hogar 1.11717## Std. Error## (Intercept) 1.33429## nmiemb 0.04341## nmiem11 0.03951## nmiem12 0.05105## numinacti 0.03587## numocu 0.42113## tiphogar1Una persona de 30 a 64 años 0.14901## tiphogar1Una persona de menos de 30 años 0.34829## tiphogar1Un adulto con niños menores de 16 años 0.24203## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65
años o más 0.14376## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 0.14792## tiphogar1Pareja con un hijo menor de 16 años 0.15937## tiphogar1Pareja con dos hijos menores de 16 años 0.17821## tiphogar1Pareja con tres o más hijos menores de 16 años 0.23794## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 0.15520## tiphogar1Pareja con al menos un hijo de 16 o más años 0.16180## tiphogar1Otros hogares 0.17715## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) 0.52622## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.53653## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.40279## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.92194## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.92993## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.58979## situocuhogNingún ocupado en el hogar 1.33299## z value## (Intercept) -3.109## nmiemb 29.688## nmiem11 -8.523## nmiem12 -11.508## numinacti -22.215## numocu -3.516## tiphogar1Una persona de 30 a 64 años 9.940## tiphogar1Una persona de menos de 30 años 6.094## tiphogar1Un adulto con niños menores de 16 años 6.741## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65
años o más 7.771## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 8.295## tiphogar1Pareja con un hijo menor de 16 años 8.470## tiphogar1Pareja con dos hijos menores de 16 años 4.465## tiphogar1Pareja con tres o más hijos menores de 16 años 2.582## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 10.389## tiphogar1Pareja con al menos un hijo de 16 o más años 10.664## tiphogar1Otros hogares 7.637## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) -0.935## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.929## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.198## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.758## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.287## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.168## situocuhogNingún ocupado en el hogar 0.838## Pr(>|z|)## (Intercept) 0.001876## nmiemb < 2e-16## nmiem11 < 2e-16## nmiem12 < 2e-16## numinacti < 2e-16## numocu 0.000438## tiphogar1Una persona de 30 a 64 años < 2e-16## tiphogar1Una persona de menos de 30 años 1.10e-09## tiphogar1Un adulto con niños menores de 16 años 1.57e-11## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65
años o más 7.77e-15## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años < 2e-16## tiphogar1Pareja con un hijo menor de 16 años < 2e-16## tiphogar1Pareja con dos hijos menores de 16 años 8.02e-06## tiphogar1Pareja con tres o más hijos menores de 16 años 0.009812## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años < 2e-16## tiphogar1Pareja con al menos un hijo de 16 o más años < 2e-16## tiphogar1Otros hogares 2.23e-14## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) 0.349860## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.353016## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.842804## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.448318## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.774116## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.866450## situocuhogNingún ocupado en el hogar 0.401981##
## (Intercept) ** ## nmiemb ***## nmiem11 ***## nmiem12 ***## numinacti ***## numocu ***## tiphogar1Una persona de 30 a 64 años ***## tiphogar1Una persona de menos de 30 años ***## tiphogar1Un adulto con niños menores de 16 años ***## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65
años o más ***## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años ***## tiphogar1Pareja con un hijo menor de 16 años ***## tiphogar1Pareja con dos hijos menores de 16 años ***## tiphogar1Pareja con tres o más hijos menores de 16 años ** ## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años ***## tiphogar1Pareja con al menos un hijo de 16 o más años ***## tiphogar1Otros hogares ***## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) ## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado ## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados ## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) ## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado ## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados ## situocuhogNingún ocupado en el hogar
## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1## ## (Dispersion parameter for binomial family taken to be 1)## ## Null deviance: 20672 on 18881 degrees of freedom## Residual deviance: 14639 on 18858 degrees of freedom## (3264 observations deleted due to missingness)## AIC: 14687## ## Number of Fisher Scoring iterations: 5
## ## est3.pred 0 1## 0 13480 2374## 1 930 2098
## [1] 0.8250185
Estimamos ahora un modelo probit
## ## Call:## glm(formula = datos$pobre ~ nmiemb + nmiem11 + nmiem12 + numinacti + ## numocu + tiphogar1 + situocuhog, family = binomial(link = probit), ## data = datos)## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## -5.3451 -0.5795 -0.3749 -0.1085 3.3885 ## ## Coefficients:## Estimate## (Intercept) -2.30258## nmiemb 0.72307## nmiem11 -0.18519## nmiem12 -0.32574## numinacti -0.47497## numocu -0.82202## tiphogar1Una persona de 30 a 64 años 0.74142## tiphogar1Una persona de menos de 30 años 1.16772## tiphogar1Un adulto con niños menores de 16 años 0.90675## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más 0.58391## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 0.64887## tiphogar1Pareja con un hijo menor de 16 años 0.72901## tiphogar1Pareja con dos hijos menores de 16 años 0.40672## tiphogar1Pareja con tres o más hijos menores de 16 años 0.32733## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 0.86505## tiphogar1Pareja con al menos un hijo de 16 o más años 0.96407## tiphogar1Otros hogares 0.76577## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno
de los otros miembros ocupados (si es que los hay) -0.29786## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.22289## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados -0.03300## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.38301## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.12712## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.05515## situocuhogNingún ocupado en el hogar 0.64308## Std. Error## (Intercept) 0.68343## nmiemb 0.02400## nmiem11 0.02233## nmiem12 0.02913## numinacti 0.02064## numocu 0.21636## tiphogar1Una persona de 30 a 64 años 0.07719## tiphogar1Una persona de menos de 30 años 0.21074## tiphogar1Un adulto con niños menores de 16 años 0.13510## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más 0.07128## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 0.07454## tiphogar1Pareja con un hijo menor de 16 años 0.08199## tiphogar1Pareja con dos hijos menores de 16 años 0.09360## tiphogar1Pareja con tres o más hijos menores de 16 años 0.12963## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 0.08163## tiphogar1Pareja con al menos un hijo de 16 o más años 0.08385## tiphogar1Otros hogares 0.09354## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno
de los otros miembros ocupados (si es que los hay) 0.26730## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.27372## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.20946## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.47193## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.47662## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.30409## situocuhogNingún ocupado en el hogar 0.68370## z value## (Intercept) -3.369## nmiemb 30.133## nmiem11 -8.293## nmiem12 -11.183## numinacti -23.015## numocu -3.799## tiphogar1Una persona de 30 a 64 años 9.606## tiphogar1Una persona de menos de 30 años 5.541## tiphogar1Un adulto con niños menores de 16 años 6.712## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más 8.192## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 8.705## tiphogar1Pareja con un hijo menor de 16 años 8.892## tiphogar1Pareja con dos hijos menores de 16 años 4.345## tiphogar1Pareja con tres o más hijos menores de 16 años 2.525## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 10.597## tiphogar1Pareja con al menos un hijo de 16 o más años 11.497## tiphogar1Otros hogares 8.186## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno
de los otros miembros ocupados (si es que los hay) -1.114## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.814## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados -0.158## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.812## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.267## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.181## situocuhogNingún ocupado en el hogar 0.941## Pr(>|z|)## (Intercept) 0.000754## nmiemb < 2e-16## nmiem11 < 2e-16## nmiem12 < 2e-16## numinacti < 2e-16## numocu 0.000145## tiphogar1Una persona de 30 a 64 años < 2e-16## tiphogar1Una persona de menos de 30 años 3.01e-08## tiphogar1Un adulto con niños menores de 16 años 1.92e-11## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más 2.57e-16## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años < 2e-16## tiphogar1Pareja con un hijo menor de 16 años < 2e-16## tiphogar1Pareja con dos hijos menores de 16 años 1.39e-05## tiphogar1Pareja con tres o más hijos menores de 16 años 0.011570## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años < 2e-16## tiphogar1Pareja con al menos un hijo de 16 o más años < 2e-16## tiphogar1Otros hogares 2.69e-16## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno
de los otros miembros ocupados (si es que los hay) 0.265143## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.415474## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.874803## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.417031## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.789695## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.856074## situocuhogNingún ocupado en el hogar 0.346915##
## (Intercept) ***## nmiemb ***## nmiem11 ***## nmiem12 ***## numinacti ***## numocu ***## tiphogar1Una persona de 30 a 64 años ***## tiphogar1Una persona de menos de 30 años ***## tiphogar1Un adulto con niños menores de 16 años ***## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más ***## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años ***## tiphogar1Pareja con un hijo menor de 16 años ***## tiphogar1Pareja con dos hijos menores de 16 años ***## tiphogar1Pareja con tres o más hijos menores de 16 años * ## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años ***## tiphogar1Pareja con al menos un hijo de 16 o más años ***## tiphogar1Otros hogares ***## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno
de los otros miembros ocupados (si es que los hay) ## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado ## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados ## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) ## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado ## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados ## situocuhogNingún ocupado en el hogar
## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1## ## (Dispersion parameter for binomial family taken to be 1)## ## Null deviance: 20672 on 18881 degrees of freedom## Residual deviance: 14671 on 18858 degrees of freedom## (3264 observations deleted due to missingness)## AIC: 14719## ## Number of Fisher Scoring iterations: 5
## ## est4.pred 0 1## 0 13480 2374## 1 930 2098
## [1] 0.8250185
Minería de datos para el Análisis Discriminate Lineas y representación curva ROC
## Call:## lda(y[train] ~ ., data = x[train, ])## ## Prior probabilities of groups:## 0 1 ## 0.7859153 0.2140847 ## ## Group means:## datos1.nmiemb datos1.nmiem11 datos1.nmiem12 datos1.numinacti## 0 2.707856 1.230155 0.5048077 1.012684## 1 3.597446 1.510327 0.2925272 1.051821## datos1.numocu datos1.tiphogar1Una persona de 30 a 64 años## 0 1.0729337 0.02158347## 1 0.7566654 0.01088997## datos1.tiphogar1Una persona de menos de 30 años## 0 0.000306874## 1 0.001877582
## datos1.tiphogar1Un adulto con niños menores de 16 años## 0 0.0007160393## 1 0.0033796470## datos1.tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más## 0 0.15630115## 1 0.08111153## datos1.tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años## 0 0.1689853## 1 0.0781074## datos1.tiphogar1Pareja con un hijo menor de 16 años## 0 0.1059738## 1 0.1182876## datos1.tiphogar1Pareja con dos hijos menores de 16 años## 0 0.1022913## 1 0.1749906## datos1.tiphogar1Pareja con tres o más hijos menores de 16 años## 0 0.01155892## 1 0.05895606## datos1.tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años## 0 0.01125205## 1 0.01051446## datos1.tiphogar1Pareja con al menos un hijo de 16 o más años## 0 0.2436579## 1 0.3368382## datos1.tiphogar1Otros hogares## 0 0.05953355## 1 0.10589561## datos1.situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay)## 0 0.3259002## 1 0.0987608## datos1.situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado## 0 0.02905074## 1 0.02628614## datos1.situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados
## 0 0.006137480## 1 0.003379647## datos1.situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay)## 0 0.2012070## 1 0.4344724## datos1.situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado## 0 0.03641571## 1 0.02703718## datos1.situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados## 0 0.007160393## 1 0.003755163## datos1.situocuhogNingún ocupado en el hogar## 0 0.3654869## 1 0.3980473## ## Coefficients of linear discriminants:## LD1## datos1.nmiemb 1.0385083## datos1.nmiem11 -0.2413016## datos1.nmiem12 -0.4201854## datos1.numinacti -0.6777210## datos1.numocu -0.9817186## datos1.tiphogar1Una persona de 30 a 64 años 0.3044892## datos1.tiphogar1Una persona de menos de 30 años 2.7793322## datos1.tiphogar1Un adulto con niños menores de 16 años 1.2751798## datos1.tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más 0.5287921## datos1.tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 1.0195342
## datos1.tiphogar1Pareja con un hijo menor de 16 años 0.7916490## datos1.tiphogar1Pareja con dos hijos menores de 16 años 0.3262444## datos1.tiphogar1Pareja con tres o más hijos menores de 16 años 0.2290850## datos1.tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 0.5313942## datos1.tiphogar1Pareja con al menos un hijo de 16 o más años 1.1806129## datos1.tiphogar1Otros hogares 0.8704265## datos1.situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) -0.3099479## datos1.situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.1520750## datos1.situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados -0.3110726## datos1.situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.6554938## datos1.situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.1831629## datos1.situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados -0.0918108## datos1.situocuhogNingún ocupado en el hogar 1.1558273
## class posterior.0 posterior.1 LD1## 2 0 0.8482361 0.151763889 0.1746234## 8 0 0.9935300 0.006469987 -1.9550441## 12 0 0.9073864 0.092613581 -0.1861640## 17 0 0.9416812 0.058318805 -0.5072988## 20 0 0.9812731 0.018726918 -1.2639352
## ## 0 1## 0 3902 605## 1 253 572
## [1] 0.8390848
## Warning: package 'ROCR' was built under R version 3.2.5
## Loading required package: gplots
## Warning: package 'gplots' was built under R version 3.2.5
## ## Attaching package: 'gplots'##
## The following object is masked from 'package:stats':## ## lowess
Minería de datos y obtencion de las curvas ROC para el modelo Logit.
## ## pred 0 1## 0 3943 615## 1 251 523
## [1] 0.8375844
K-Nearest Neighbors: Aplicación a Encuesta Gastos de Presupuestos Famliares de España
library(class)# K-Nearest NeighborsPobre=as.factor(y)train=sample(seq(length(y)),length(y)*0.70,replace=FALSE)x$datos1.tiphogar1 <- as.numeric(x$datos1.tiphogar1)x$datos1.situocuhog <- as.numeric(x$datos1.situocuhog)knn.prd=knn1(x[train,1:7],x[-train,1:7],Pobre[train])table(knn.prd,Pobre[-train])
## ## knn.prd 0 1## 0 3947 639## 1 248 498
Arbol de decision
require(tree)
## Loading required package: tree
## Warning: package 'tree' was built under R version 3.2.5
# Selección de variablesexplicativas <- data.frame(datos1$nmiemb,datos1$nmiem11,datos1$nmiem12,datos1$numinacti,datos1$
numocu,datos1$tiphogar1,datos1$situocuhog)y=as.factor(datos1$pobre)datos <- data.frame(explicativas,y) # división de la muestra en entrenamiento y validaciontrain=sample(seq(length(y)),length(y)*0.70,replace=FALSE)Pobreza.tree = tree(y~.,datos,subset=train)summary(Pobreza.tree)
## ## Classification tree:## tree(formula = y ~ ., data = datos, subset = train)## Variables actually used in tree construction:## [1] "datos1.situocuhog" "datos1.nmiemb" ## Number of terminal nodes: 5 ## Residual mean deviance: 0.8397 = 10440 / 12430 ## Misclassification error rate: 0.1939 = 2412 / 12439
plot(Pobreza.tree);text(Pobreza.tree,pretty=0)
Pobreza.tree
## node), split, n, deviance, yval, (yprob)## * denotes terminal node## ## 1) root 12439 12930.0 0 ( 0.78559 0.21441 ) ## 2) datos1.situocuhog: El sustentador principal y el cónyugeocupados, al menos otro de los miembros también ocupado,El sustentador principal y el cónyuge ocupados, ninguno de los otros
miembros ocupados (si es que los hay),El sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados,Ni el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 3905 1989.0 0 ( 0.92958 0.07042 ) *## 3) datos1.situocuhog: El sustentador principal o el cónyuge ocupado, otro de los miembros ocupado,El sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay),Ni el sustentador principal ni su cónyuge ocupado, otro miembro ocupado,Ningún ocupado en el hogar 8534 10130.0 0 ( 0.71971 0.28029 )
## 6) datos1.nmiemb < 2.5 4368 3169.0 0 ( 0.88210 0.11790 ) *## 7) datos1.nmiemb > 2.5 4166 5734.0 0 ( 0.54945 0.45055 ) ## 14) datos1.situocuhog: El sustentador principal o el cónyuge ocupado, otro de los miembros ocupado,Ni el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 768 738.3 0 ( 0.81380 0.18620 ) *## 15) datos1.situocuhog: El sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay),Ningún ocupado en el hogar 3398 4709.0 1 ( 0.48970 0.51030 ) ## 30) datos1.nmiemb < 4.5 2951 4079.0 0 ( 0.53135 0.46865 ) *## 31) datos1.nmiemb > 4.5 447 465.1 1 ( 0.21477 0.78523 ) *
tree.pred=predict(Pobreza.tree,datos[-train,],type="class")summary(tree.pred)
## 0 1 ## 5130 202
with(datos[-train,],table(tree.pred,y))
## y## tree.pred 0 1## 0 4114 1016## 1 45 157
# Mediante validación cruzada se busca el mejor arbol de decisioncv.Pobreza=cv.tree(Pobreza.tree,FUN=prune.misclass)cv.Pobreza
## $size## [1] 5 1## ## $dev## [1] 2411 2580## ## $k## [1] -Inf 63.75## ## $method## [1] "misclass"
## ## attr(,"class")## [1] "prune" "tree.sequence"
plot(cv.Pobreza)
prune.Pobreza=prune.misclass(Pobreza.tree,best=5)plot(prune.Pobreza);text(Pobreza.tree,pretty=0)
tree.pred=predict(prune.Pobreza,datos[-train,],type="class")with(datos[-train,],table(tree.pred,y))
## y## tree.pred 0 1## 0 4114 1016## 1 45 157