curso estadistica en r - web viewcurso estadistica en r. ... otro de los miembros también...

49
Curso estadistica en R Encuesta de presupuestos familiares La Encuesta de presupuestos familiares (EPF) suministra información anual sobre la naturaleza y destino de los gastos de consumo, así como sobre diversas características relativas a las condiciones de vida de los hogares. Se leen los datos de ingresos y gastos de hogares del fichero de microdatos de la Encuesta de Presupuestos Familiares de 2014. Base 2006. library (MicroDatosEs) ## Warning: package 'MicroDatosEs' was built under R version 3.2.4 ## Loading required package: memisc ## Warning: package 'memisc' was built under R version 3.2.4 ## Loading required package: lattice ## Loading required package: MASS ## ## Attaching package: 'memisc' ## ## The following objects are masked from 'package:stats': ## ## contr.sum, contr.treatment, contrasts ## ## The following object is masked from 'package:base': ## ## as.array ## ## Loading required package: Hmisc ## Warning: package 'Hmisc' was built under R version 3.2.4 ## Loading required package: survival ## Loading required package: Formula ## Warning: package 'Formula' was built under R version 3.2.3 ## Loading required package: ggplot2

Upload: trankiet

Post on 31-Jan-2018

223 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

Curso estadistica en REncuesta de presupuestos familiares

La Encuesta de presupuestos familiares (EPF) suministra información anual sobre la naturaleza y destino de los gastos de consumo, así como sobre diversas características relativas a las condiciones de vida de los hogares.

Se leen los datos de ingresos y gastos de hogares del fichero de microdatos de la Encuesta de Presupuestos Familiares de 2014. Base 2006.

library(MicroDatosEs)

## Warning: package 'MicroDatosEs' was built under R version 3.2.4

## Loading required package: memisc

## Warning: package 'memisc' was built under R version 3.2.4

## Loading required package: lattice## Loading required package: MASS## ## Attaching package: 'memisc'## ## The following objects are masked from 'package:stats':## ## contr.sum, contr.treatment, contrasts## ## The following object is masked from 'package:base':## ## as.array## ## Loading required package: Hmisc

## Warning: package 'Hmisc' was built under R version 3.2.4

## Loading required package: survival## Loading required package: Formula

## Warning: package 'Formula' was built under R version 3.2.3

## Loading required package: ggplot2

## Warning: package 'ggplot2' was built under R version 3.2.4

## ## Attaching package: 'Hmisc'## ## The following objects are masked from 'package:memisc':##

Page 2: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## %nin%, html## ## The following objects are masked from 'package:base':## ## format.pval, round.POSIXt, trunc.POSIXt, units

#setwd("//S-00-AA-017/Usuarios/U-06/prf11440/Curso estadistica en R")setwd("~/Curso de estadistica con R")ecpf2014 <- epf.2011.hogares("Fichero de usuario de hogar a2014.txt")str(ecpf2014)

## Data set with 22146 obs. of 191 variables:## $ anoenc : Itvl. item + ms.v. num 2014 2014 2014 2014 2014 ...## $ numero : Itvl. item num 1 2 3 4 5 6 7 8 9 10 ...## $ ccaa : Nmnl. item w/ 19 labels for 1,2,3,... num 10 1 13 1 17 16 12 6 10 12 ...## $ nuts1 : Nmnl. item w/ 7 labels for 1,2,3,... num 5 6 3 6 2 2 1 1 5 1 ...## $ caprov : Nmnl. item w/ 2 labels for 1,6 num 1 6 6 1 1 6 6 6 6 6 ...## $ tamamu : Nmnl. item w/ 5 labels for 1,2,3,... num 1 5 1 1 1 3 2 4 5 5 ...## $ densi : Nmnl. item w/ 3 labels for 1,2,3 num 1 3 1 1 1 1 1 2 3 3 ...## $ clave : Nmnl. item w/ 2 labels for 1,2 num 1 2 2 1 1 2 1 2 1 2 ...## $ clateo : Nmnl. item w/ 2 labels for 1,2 num 2 2 2 1 1 2 2 2 1 2 ...## $ factor : Itvl. item num 1.65e+09 1.43e+09 1.37e+09 7.34e+08 8.12e+07 ...## $ nmiemb : Itvl. item num 3 2 2 5 5 3 2 3 3 3 ...## $ tamano : Nmnl. item w/ 6 labels for 1,2,3,... num 3 2 2 5 5 3 2 3 3 3 ...## $ nmiemsd : Itvl. item num 0 0 0 0 0 0 0 0 0 0 ...## $ nmiemhu : Itvl. item num 0 0 0 0 0 0 0 0 0 0 ...## $ nmiemin : Itvl. item num 0 0 0 0 0 0 0 0 0 0 ...## $ nmiem1 : Itvl. item num 3 2 2 5 4 2 2 2 2 3 ...## $ nmiem2 : Itvl. item num 0 0 0 0 1 1 0 1 1 0 ...## $ nmiem3 : Itvl. item num 0 0 0 1 1 1 0 1 1 0 ...## $ nmiem4 : Itvl. item num 3 2 2 4 4 2 2 2 2 3 ...## $ nmiem5 : Itvl. item num 0 0 0 1 2 1 0 1 1 0 ...## $ nmiem6 : Itvl. item num 3 2 2 4 3 2 2 2 2 3 ...## $ nmiem7 : Itvl. item num 0 0 0 0 0 0 0 0 1 0 ...## $ nmiem8 : Itvl. item num 0 0 0 1 1 1 0 1 0 0 ...## $ nmiem9 : Itvl. item num 0 0 0 2 2 0 0 0 0 0 ...## $ nmiem10 : Itvl. item num 1 1 0 0 0 0 0 0 2 0 ...## $ nmiem11 : Itvl. item num 2 1 1 2 2 2 0 2 0 2 ...## $ nmiem12 : Itvl. item num 0 0 1 0 0 0 2 0 0 1 ...## $ nmiem13 : Itvl. item num 0 0 0 0 0 0 0 0 0 0 ...## $ numacti : Itvl. item num 1 2 0 2 1 2 0 1 2 2 ...

Page 3: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## $ numinacti : Itvl. item num 2 0 2 2 3 0 2 1 0 1 ...## $ numocu : Itvl. item num 1 2 0 2 1 2 0 1 2 2 ...## $ numnocu : Itvl. item num 2 0 2 2 3 0 2 1 0 1 ...## $ numestu : Itvl. item num 0 0 0 2 2 0 0 0 0 0 ...## $ numnoestu : Itvl. item num 3 2 2 2 2 2 2 2 2 3 ...## $ nninosd : Itvl. item num 0 0 0 3 3 1 0 1 1 0 ...## $ nhijosd : Itvl. item num 0 0 0 3 3 1 0 1 1 0 ...## $ uc1 : Itvl. item num 24 17 17 38 36 22 17 22 22 24 ...## $ uc2 : Itvl. item num 20 15 15 30 28 18 15 18 18 20 ...## $ pf2teo : Itvl. item num 2 1 1 4 3 1 1 1 1 2 ...## $ pf2reco : Itvl. item num 2 1 1 4 3 1 1 1 1 2 ...## $ tiphogar1 : Nmnl. item w/ 12 labels for 1,2,3,... num 11 10 5 11 11 7 5 7 7 12 ...## $ tiphogar2 : Nmnl. item w/ 12 labels for 1,2,3,... num 11 10 5 11 11 7 5 7 7 12 ...## $ tiphogar3 : Nmnl. item w/ 12 labels for 1,1,2,... num 10 10 4 8 8 6 4 6 6 10 ...## $ tiphogar4 : Nmnl. item w/ 12 labels for 1,2,3,... num 7 6 5 11 11 9 5 9 9 7 ...## $ tiphogar5 : Nmnl. item w/ 12 labels for 1,2,3,... num 7 6 5 11 11 9 5 9 9 7 ...## $ tiphogar6 : Nmnl. item w/ 10 labels for 1,2,3,... num 4 3 5 7 7 7 5 7 6 10 ...## $ tiphogar7 : Nmnl. item w/ 8 labels for 1,2,3,... num 4 7 3 6 6 4 3 4 4 8 ...## $ tiphogar8 : Nmnl. item w/ 4 labels for 1,2,3,... num 4 4 1 4 4 3 1 3 3 4 ...## $ tiphogar9 : Nmnl. item w/ 6 labels for 1,2,3,... num 3 2 2 5 5 5 2 5 5 3 ...## $ tiphogar10 : Nmnl. item w/ 6 labels for 1,2,3,... num 6 6 3 4 4 4 3 4 4 6 ...## $ tiphogar11 : Nmnl. item w/ 6 labels for 3,4,5,... num 6 6 3 4 4 4 3 4 4 6 ...## $ situocuhog : Nmnl. item w/ 8 labels for 1,2,3,... num -9 -9 8 2 5 2 8 5 2 2 ...## $ situacthog : Nmnl. item w/ 8 labels for 1,2,3,... num -9 -9 8 2 5 2 8 5 2 2 ...## $ nordensp : Itvl. item num 1 1 1 1 1 2 2 1 1 1 ...## $ edadsp : Itvl. item num 29 64 66 53 53 39 74 50 30 58 ...## $ sexosp : Nmnl. item w/ 2 labels for 1,6 num 6 6 1 1 1 1 1 1 6 1 ...## $ paisnacodsp : Nmnl. item w/ 4 labels for 1,2,3,... num 3 1 1 1 1 1 1 1 1 1 ...## $ nacionasp : Nmnl. item w/ 3 labels for 1,2,3 num 2 1 1 1 1 1 1 1 1 1 ...## $ paiscodsp : Nmnl. item w/ 3 labels for 1,2,3 num 2 NA NA NA NA NA NA NA NA NA ...

Page 4: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## $ situressp : Nmnl. item w/ 2 labels for 1,6 num 1 1 1 1 1 1 1 1 1 1 ...## $ ecivillegalsp: Nmnl. item w/ 5 labels for 1,2,3,... num 1 3 2 2 2 2 2 2 1 2 ...## $ nordencosp : Itvl. item num 99 99 2 2 2 1 1 2 2 2 ...## $ unionsp : Nmnl. item w/ 3 labels for 1,2,3 num NA NA 1 1 1 1 1 1 2 1 ...## $ convivenciasp: Nmnl. item w/ 3 labels for 1,2,3 num 3 3 1 1 1 1 1 1 2 1 ...## $ nordenpasp : Itvl. item num 2 99 99 99 99 99 99 99 99 99 ...## $ paispadresp : Nmnl. item w/ 4 labels for 1,2,3,... num 3 1 1 1 1 1 1 1 1 1 ...## $ nordenmasp : Itvl. item num 3 99 99 99 99 99 99 99 99 99 ...## $ paismadresp : Nmnl. item w/ 4 labels for 1,2,3,... num 3 1 1 1 1 1 1 1 1 1 ...## $ estudiossp : Nmnl. item w/ 11 labels for 1,2,3,... num 11 2 2 9 5 6 3 4 7 4 ...## $ estudredsp : Nmnl. item w/ 4 labels for 1,2,3,... num 4 1 1 4 3 4 2 3 4 3 ...## $ situactsp : Nmnl. item w/ 8 labels for 1,2,3,... num 1 1 4 1 1 1 4 1 1 1 ...## $ situredsp : Nmnl. item w/ 2 labels for 1,2 num 1 1 2 1 1 1 2 1 1 1 ...## $ ocusp : Nmnl. item w/ 2 labels for 1,2 num 1 1 2 1 1 1 2 1 1 1 ...## $ jornadasp : Nmnl. item w/ 2 labels for 1,2 num 1 1 NA 1 1 1 NA 1 1 1 ...## $ percepsp : Nmnl. item w/ 2 labels for 1,6 num 1 1 1 1 1 1 1 1 1 1 ...## $ impexacpsp : Itvl. item num -9 -9 1167 5000 1100 ...## $ impuexacpsp : Nmnl. item w/ 2 labels for 1,6 num NA NA NA NA NA NA NA NA NA NA ...## $ interinpsp : Nmnl. item w/ 7 labels for 1,2,3,... num 5 3 3 7 3 3 2 4 3 3 ...## $ impuinterpsp : Nmnl. item w/ 2 labels for 1,6 num NA NA NA NA NA NA NA NA NA NA ...## $ trabajo : Nmnl. item w/ 2 labels for 1,6 num 1 1 1 1 1 1 1 1 1 1 ...## $ ocupa : Nmnl. item w/ 10 labels for 0,1,2,... num 2 1 7 2 7 3 7 3 2 8 ...## $ ocupared : Nmnl. item w/ 5 labels for 1,2,3,... num 2 1 4 2 4 2 4 2 2 4 ...## $ actestb : Nmnl. item w/ 21 labels for 9,A,B,... chr "M" "I" "C" "O" ...## $ actestbred : Nmnl. item w/ 3 labels for 1,2,3 num 3 3 2 3 2 2 2 2 3 3 ...## $ sitprof : Nmnl. item w/ 4 labels for 1,2,3,... num 2 3 1 1 1 1 1 1 2 3 ...## $ sector : Nmnl. item w/ 2 labels for 1,2 num -9 -9 6 1 6 6 6 1 -9 -9 ...

Page 5: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## $ tipocont : Nmnl. item w/ 3 labels for 1,2,3 num -9 -9 1 1 1 1 2 1 -9 -9 ...## $ sitsoci : Nmnl. item w/ 11 labels for 1,2,3,... num 5 5 8 4 1 2 8 4 5 5 ...## $ sitsocire : Nmnl. item w/ 6 labels for 1,2,3,... num 3 3 5 2 1 2 5 2 3 3 ...## $ regten : Nmnl. item w/ 6 labels for 1,2,3,... num 3 1 1 2 1 2 1 1 2 1 ...## $ tipoedif : Nmnl. item w/ 5 labels for 1,2,3,... num 4 2 4 2 4 4 2 4 3 3 ...## $ zonares : Nmnl. item w/ 7 labels for 1,2,3,... num 3 7 3 3 3 3 3 3 3 3 ...## $ tipocasa : Nmnl. item w/ 3 labels for 1,2,3 num 2 2 2 2 2 2 2 2 2 2 ...## $ nhabit : Itvl. item num 4 5 5 7 5 5 4 5 5 5 ...## $ annocon : Nmnl. item w/ 2 labels for 1,6 num 6 6 6 6 1 1 6 1 1 6 ...## $ superf : Itvl. item num 90 120 85 160 89 91 90 80 110 125 ...## $ aguacali : Nmnl. item w/ 2 labels for 1,6 num 1 1 1 1 1 1 1 1 1 1 ...## $ fuenagua : Nmnl. item w/ 6 labels for 1,2,3,... num 1 1 1 2 2 2 3 2 2 3 ...## $ calef : Nmnl. item w/ 2 labels for 1,6 num 6 6 1 1 1 1 6 1 1 1 ...## [list output truncated]

Estimación del gasto de los hogares utilizando las variables:

GASTMON:Importe total del gasto monetario anual del hogar elevado temporal y poblacionalmente. (para el salario en especie se contabiliza sólo el importe del pago realizado por el hogar).

IMPEXAC: Importe exacto de los ingresos mensuales netos totales del hogar.

Definimos el gasto por hogar y estimamos una regresión lineal entre gastos e ingresos

## ## Call:## lm(formula = ecpf2014$GAST ~ ecpf2014$impexac)## ## Residuals:## Min 1Q Median 3Q Max ## -9737.1 -623.1 -198.5 426.2 14583.7 ## ## Coefficients:## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 1.000e+03 1.290e+01 77.52 <2e-16 ***## ecpf2014$impexac 7.130e-01 5.613e-03 127.02 <2e-16 ***## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Page 6: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## ## Residual standard error: 1062 on 22144 degrees of freedom## Multiple R-squared: 0.4215, Adjusted R-squared: 0.4215 ## F-statistic: 1.613e+04 on 1 and 22144 DF, p-value: < 2.2e-16

Realizamos el test de heterocedasticidad de White

## Warning: package 'tseries' was built under R version 3.2.3

## ## White Neural Network Test## ## data: x and y## X-squared = 733.59, df = 2, p-value < 2.2e-16

Seleccionamos el conjunto de las variables explicativas y utilizamos el método fordward para seleccionar el mejor modelo:

## 'data.frame': 22146 obs. of 15 variables:## $ nmiemb : num 3 2 2 5 5 3 2 3 3 3 ...## $ nmiem10 : num 1 1 0 0 0 0 0 0 2 0 ...## $ nmiem11 : num 2 1 1 2 2 2 0 2 0 2 ...## $ nmiem12 : num 0 0 1 0 0 0 2 0 0 1 ...## $ nmiem13 : num 0 0 0 0 0 0 0 0 0 0 ...## $ numacti : num 1 2 0 2 1 2 0 1 2 2 ...## $ numinacti : num 2 0 2 2 3 0 2 1 0 1 ...## $ numocu : num 1 2 0 2 1 2 0 1 2 2 ...## $ numnocu : num 2 0 2 2 3 0 2 1 0 1 ...## $ numestu : num 0 0 0 2 2 0 0 0 0 0 ...## $ numnoestu : num 3 2 2 2 2 2 2 2 2 3 ...## $ tiphogar1 : Factor w/ 12 levels "Una persona de 65 o más años",..: 11 10 5 11 11 7 5 7 7 12 ...## $ situocuhog : Factor w/ 8 levels "El sustentador principal y el cónyugeocupados, al menos otro de los miembros también ocupado",..: NA NA 8 2 5 2 8 5 2 2 ...## $ situacthog : Factor w/ 8 levels "El sustentador principal y el cónyuge activos, al menos otro de los miembros también activo",..: NA NA 8 2 5 2 8 5 2 2 ...## $ ecpf2014.impexac: num 2191 2702 1167 5167 1100 ...

## Warning: package 'leaps' was built under R version 3.2.4

## Warning in leaps.setup(x, y, wt = wt, nbest = nbest, nvmax = nvmax,## force.in = force.in, : 2 linear dependencies found

## Reordering variables and trying again:

Page 7: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## (Intercept) ## 2199.60830 ## nmiemb ## 68.89259 ## nmiem11 ## 150.39439 ## nmiem13 ## -207.45699 ## numinacti ## 245.64795 ## tiphogar1Una persona de 30 a 64 años ## -340.29367 ## tiphogar1Pareja con un hijo menor de 16 años ##

Page 8: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

-193.07523 ## situocuhogNingún ocupado en el hogar ## -962.83813 ## situacthogEl sustentador principal o el cónyuge activo, otro de los miembros también activo ## -261.19099 ## numnoestu ## 27.50668

## Warning in leaps.setup(x, y, wt = wt, nbest = nbest, nvmax = nvmax,## force.in = force.in, : 2 linear dependencies found

## Reordering variables and trying again:

## (Intercept) ## 1304.18978 ## nmiem11 ## 190.55392

Page 9: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## numinacti ## 433.17028 ## numocu ## 778.31319 ## tiphogar1Una persona de 30 a 64 años ## -431.29516 ## tiphogar1Pareja con un hijo menor de 16 años ## -114.01739 ## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años ## -235.18192 ## tiphogar1Pareja con al menos un hijo de 16 o más años ## -76.90113 ## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados ## -48.45166 ## numnoestu ## -109.02717

## Warning in leaps.setup(x, y, wt = wt, nbest = nbest, nvmax = nvmax,## force.in = force.in, : 2 linear dependencies found

## Reordering variables and trying again:

Page 10: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## (Intercept) ## 1309.40766 ## nmiem11 ## 198.12087 ## numinacti ## 450.72299 ## numocu ## 743.69648 ## tiphogar1Una persona de 30 a 64 años ## -442.02853 ## tiphogar1Pareja con un hijo menor de 16 años ## -111.73727 ## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años ## -235.82705 ## tiphogar1Pareja con al menos un hijo de 16 o más años ## -53.99281 ## numnocu ## -46.21486 ## numnoestu ## -81.87241

Modelos ANOVA

Estimamos un modelo ANOVA utilizando situacthog.

Situacthog caracteriza los siguiente hogares:

Page 11: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

1 El sustentador principal y el cónyuge activos, al menos otro de los miembros también activo

2 El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay)

3 El sustentador principal o el cónyuge activo, otro de los miembros también activo

4 El sustentador principal o el cónyuge activo, al menos otros dos miembros activos

5 El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay)

6 Ni el sustentador principal ni su cónyuge activos, otro miembro activo

7 Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos

8 Ningún activo en el hogar

-9 No consta

## Nmnl. item w/ 8 labels for 1,2,3,... num [1:22146] -9 -9 8 2 5 2 8 5 2 2 ...

## Df Sum Sq Mean Sq F value Pr(>F) ## ecpf2014$situacthog 1 2.002e+08 200217093 103.2 <2e-16 ***## Residuals 22144 4.295e+10 1939679 ## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

## Warning in replications(paste("~", xx), data = mf): non-factors ignored:## ecpf2014$situacthog

## Tables of effects## ## ecpf2014$situacthog ## ecpf2014$situacthog## -9 ## -174.61 ## El sustentador principal y el cónyuge activos, al menos otro de los miembros también activo ## -11.93 ## El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) ## 4.34 ## El sustentador principal o el cónyuge activo, otro de los miembros también activo

Page 12: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## 20.61 ## El sustentador principal o el cónyuge activo, al menos otros dos miembros activos ## 36.88 ## El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) ## 53.14 ## Ni el sustentador principal ni su cónyuge activos, otro miembro activo ## 69.41 ## Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos ## 85.68 ## Ningún activo en el hogar ## 101.95

Utilizando la función lm, e incluyendo un termino constante.

En R las variables categoricas se definen como factores.

## Analysis of Variance Table## ## Response: ecpf2014$GAST## Df Sum Sq Mean Sq F value## as.factor(ecpf2014$situacthog) 7 3.1069e+09 443837987 235.76## Residuals 17763 3.3440e+10 1882556 ## Pr(>F) ## as.factor(ecpf2014$situacthog) < 2.2e-16 ***## Residuals ## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

## ## Call:## lm(formula = ecpf2014$GAST ~ as.factor(ecpf2014$situacthog))## ## Residuals:## Min 1Q Median 3Q Max ## -2786.4 -916.6 -291.0 602.9 15163.9 ## ## Coefficients:## Estimate## (Intercept)

Page 13: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

2962.27## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) -175.84## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo -169.71## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos -69.96## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) -376.67## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo -430.30## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 44.69## as.factor(ecpf2014$situacthog)Ningún activo en el hogar -1097.17## Std. Error## (Intercept) 39.89## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) 43.02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 68.28## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 101.52## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 49.07## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo 63.51## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 99.79## as.factor(ecpf2014$situacthog)Ningún activo en el hogar 44.19## t value## (Intercept) 74.258## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge

Page 14: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

activos, ninguno de los otros miembros activos (si es que los hay) -4.087## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo -2.485## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos -0.689## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) -7.676## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo -6.776## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 0.448## as.factor(ecpf2014$situacthog)Ningún activo en el hogar -24.827## Pr(>|t|)## (Intercept) < 2e-16## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) 4.39e-05## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 0.0129## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 0.4908## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 1.73e-14## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo 1.28e-11## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 0.6543## as.factor(ecpf2014$situacthog)Ningún activo en el hogar < 2e-16##

## (Intercept) ***## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) ***## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge

Page 15: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

activo, otro de los miembros también activo * ## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos ## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) ***## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo ***## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos

## as.factor(ecpf2014$situacthog)Ningún activo en el hogar ***## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1## ## Residual standard error: 1372 on 17763 degrees of freedom## (4375 observations deleted due to missingness)## Multiple R-squared: 0.08501, Adjusted R-squared: 0.08465 ## F-statistic: 235.8 on 7 and 17763 DF, p-value: < 2.2e-16

Partiendo de la base de datos "ecpf2014" preparamos un "Chunk" , con la función lm, utilizando ahora como explicativas la iteración situacthog e ingresos del hogar :

## Analysis of Variance Table## ## Response: ecpf2014$GAST## Df Sum Sq## as.factor(ecpf2014$situacthog) 7 3.1069e+09## ecpf2014$impexac 1 1.2390e+10## as.factor(ecpf2014$situacthog):ecpf2014$impexac 7 5.0244e+07## Residuals 17755 2.0999e+10## Mean Sq F value## as.factor(ecpf2014$situacthog) 4.4384e+08 375.2692## ecpf2014$impexac 1.2390e+10 10476.2225## as.factor(ecpf2014$situacthog):ecpf2014$impexac 7.1777e+06 6.0688## Residuals 1.1827e+06

## Pr(>F) ## as.factor(ecpf2014$situacthog) < 2.2e-16 ***## ecpf2014$impexac < 2.2e-16 ***## as.factor(ecpf2014$situacthog):ecpf2014$impexac 4.283e-07 ***## Residuals ## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Page 16: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## ## Call:## lm(formula = ecpf2014$GAST ~ as.factor(ecpf2014$situacthog) * ## ecpf2014$impexac)## ## Residuals:## Min 1Q Median 3Q Max ## -9823.3 -636.2 -196.5 438.8 14496.5 ## ## Coefficients:## Estimate## (Intercept) 1.305e+03## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) -1.448e+02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 2.115e+02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 5.031e+01## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo -2.192e+01## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 2.123e+02## as.factor(ecpf2014$situacthog)Ningún activo en el hogar -4.798e+02## ecpf2014$impexac 6.550e-01## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 3.608e-02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo:ecpf2014$impexac -2.959e-03## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos:ecpf2014$impexac -1.035e-01## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 7.593e-03## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo:ecpf2014$impexac

Page 17: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

-8.069e-02## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos:ecpf2014$impexac -1.082e-01## as.factor(ecpf2014$situacthog)Ningún activo en el hogar:ecpf2014$impexac 7.477e-02## Std. Error## (Intercept) 5.801e+01## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) 6.350e+01## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 1.083e+02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 1.431e+02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 7.141e+01## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo 9.778e+01## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 1.508e+02## as.factor(ecpf2014$situacthog)Ningún activo en el hogar 6.453e+01## ecpf2014$impexac 1.922e-02## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 2.146e-02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo:ecpf2014$impexac 4.133e-02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos:ecpf2014$impexac 4.732e-02## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 2.690e-02## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo:ecpf2014$impexac 3.681e-02## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos:ecpf2014$impexac

Page 18: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

4.765e-02## as.factor(ecpf2014$situacthog)Ningún activo en el hogar:ecpf2014$impexac 2.551e-02## t value## (Intercept) 22.494## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) -2.280## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 0.543## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 1.478## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 0.704## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo -0.224## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 1.408## as.factor(ecpf2014$situacthog)Ningún activo en el hogar -7.435## ecpf2014$impexac 34.071## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 1.682## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo:ecpf2014$impexac -0.072## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos:ecpf2014$impexac -2.188## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 0.282## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo:ecpf2014$impexac -2.192## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos:ecpf2014$impexac -2.271## as.factor(ecpf2014$situacthog)Ningún activo en el hogar:ecpf2014$impexac

Page 19: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

2.931## Pr(>|t|)## (Intercept) < 2e-16## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) 0.02264## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo 0.58748## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos 0.13935## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay) 0.48114## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo 0.82267## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos 0.15904## as.factor(ecpf2014$situacthog)Ningún activo en el hogar 1.09e-13## ecpf2014$impexac < 2e-16## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 0.09266## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo:ecpf2014$impexac 0.94293## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos:ecpf2014$impexac 0.02868## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac 0.77773## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo:ecpf2014$impexac 0.02842## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos:ecpf2014$impexac 0.02313## as.factor(ecpf2014$situacthog)Ningún activo en el hogar:ecpf2014$impexac 0.00338##

Page 20: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## (Intercept) ***## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay) * ## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo

## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos

## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay)

## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo

## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos

## as.factor(ecpf2014$situacthog)Ningún activo en el hogar ***## ecpf2014$impexac ***## as.factor(ecpf2014$situacthog)El sustentador principal y el cónyuge activos, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac . ## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, otro de los miembros también activo:ecpf2014$impexac

## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, al menos otros dos miembros activos:ecpf2014$impexac * ## as.factor(ecpf2014$situacthog)El sustentador principal o el cónyuge activo, ninguno de los otros miembros activos (si es que los hay):ecpf2014$impexac ## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, otro miembro activo:ecpf2014$impexac * ## as.factor(ecpf2014$situacthog)Ni el sustentador principal ni su cónyuge activos, al menos otros dos miembros activos:ecpf2014$impexac * ## as.factor(ecpf2014$situacthog)Ningún activo en el hogar:ecpf2014$impexac ** ## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1## ## Residual standard error: 1088 on 17755 degrees of freedom## (4375 observations deleted due to missingness)

Page 21: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## Multiple R-squared: 0.4254, Adjusted R-squared: 0.4249 ## F-statistic: 876.4 on 15 and 17755 DF, p-value: < 2.2e-16

Utilizando la selección de variables del Ejemplo 2.4, vamos a estimar un modelo utilizando la distribución de poisson y un tipo de función vinculo logarítmica.

Definimos como pobres, aquellos hogares que tienen un ingreso percápita inferior al 60% de la mediana.

## 'data.frame': 22146 obs. of 17 variables:## $ nmiemb : num 3 2 2 5 5 3 2 3 3 3 ...## $ nmiem10 : num 1 1 0 0 0 0 0 0 2 0 ...## $ nmiem11 : num 2 1 1 2 2 2 0 2 0 2 ...## $ nmiem12 : num 0 0 1 0 0 0 2 0 0 1 ...## $ nmiem13 : num 0 0 0 0 0 0 0 0 0 0 ...## $ numacti : num 1 2 0 2 1 2 0 1 2 2 ...## $ numinacti : num 2 0 2 2 3 0 2 1 0 1 ...## $ numocu : num 1 2 0 2 1 2 0 1 2 2 ...## $ numnocu : num 2 0 2 2 3 0 2 1 0 1 ...## $ numestu : num 0 0 0 2 2 0 0 0 0 0 ...## $ numnoestu : num 3 2 2 2 2 2 2 2 2 3 ...## $ tiphogar1 : Factor w/ 12 levels "Una persona de 65 o más años",..: 11 10 5 11 11 7 5 7 7 12 ...## $ situocuhog : Factor w/ 8 levels "El sustentador principal y el cónyugeocupados, al menos otro de los miembros también ocupado",..: NA NA 8 2 5 2 8 5 2 2 ...## $ situacthog : Factor w/ 8 levels "El sustentador principal y el cónyuge activos, al menos otro de los miembros también activo",..: NA NA 8 2 5 2 8 5 2 2 ...## $ ecpf2014.impexac: num 2191 2702 1167 5167 1100 ...## $ ingpc : num 730 1351 584 1033 220 ...## $ pobre : num 0 0 0 0 1 0 1 0 0 0 ...

## ## 0 1 ## 17167 4979

Seleccionamos el mejor modelo explicativo del ingreso per capita por el método exahustivo:

## Warning in leaps.setup(x, y, wt = wt, nbest = nbest, nvmax = nvmax,## force.in = force.in, : 2 linear dependencies found

## Reordering variables and trying again:

Page 22: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## (Intercept) ## 1085.7566205 ## nmiemb ## -202.4482883 ## nmiem11 ## 59.8275149 ## nmiem12 ## 96.5363080 ## numacti ## -101.0224460 ## numocu ## 262.9822263 ## tiphogar1Pareja con tres o más hijos menores de 16 años ##

Page 23: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

97.1311348 ## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años ## 0.7449329 ## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) ## 76.1584450 ## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados ## 18.3472987

Estimamos un modelo de regresión logistica con las variables antes seleccionadas, y realizamos una métrica para ver los resultados obtenidos.

## ## Call:## glm(formula = datos$pobre ~ nmiemb + nmiem11 + nmiem12 + numinacti + ## numocu + tiphogar1 + situocuhog, family = binomial, data = datos)## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## -4.2262 -0.5534 -0.3793 -0.1508 3.1110 ## ## Coefficients:## Estimate## (Intercept) -4.14848## nmiemb 1.28891## nmiem11 -0.33676## nmiem12 -0.58754## numinacti -0.79681## numocu -1.48083## tiphogar1Una persona de 30 a 64 años 1.48108## tiphogar1Una persona de menos de 30 años 2.12256## tiphogar1Un adulto con niños menores de 16 años 1.63159## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65

Page 24: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

años o más 1.11722## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 1.22699## tiphogar1Pareja con un hijo menor de 16 años 1.34991## tiphogar1Pareja con dos hijos menores de 16 años 0.79569## tiphogar1Pareja con tres o más hijos menores de 16 años 0.61444## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 1.61232## tiphogar1Pareja con al menos un hijo de 16 o más años 1.72535## tiphogar1Otros hogares 1.35285## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) -0.49194## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.49830## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.07988## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.69903## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.26688## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.09918## situocuhogNingún ocupado en el hogar 1.11717## Std. Error## (Intercept) 1.33429## nmiemb 0.04341## nmiem11 0.03951## nmiem12 0.05105## numinacti 0.03587## numocu 0.42113## tiphogar1Una persona de 30 a 64 años 0.14901## tiphogar1Una persona de menos de 30 años 0.34829## tiphogar1Un adulto con niños menores de 16 años 0.24203## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65

Page 25: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

años o más 0.14376## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 0.14792## tiphogar1Pareja con un hijo menor de 16 años 0.15937## tiphogar1Pareja con dos hijos menores de 16 años 0.17821## tiphogar1Pareja con tres o más hijos menores de 16 años 0.23794## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 0.15520## tiphogar1Pareja con al menos un hijo de 16 o más años 0.16180## tiphogar1Otros hogares 0.17715## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) 0.52622## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.53653## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.40279## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.92194## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.92993## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.58979## situocuhogNingún ocupado en el hogar 1.33299## z value## (Intercept) -3.109## nmiemb 29.688## nmiem11 -8.523## nmiem12 -11.508## numinacti -22.215## numocu -3.516## tiphogar1Una persona de 30 a 64 años 9.940## tiphogar1Una persona de menos de 30 años 6.094## tiphogar1Un adulto con niños menores de 16 años 6.741## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65

Page 26: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

años o más 7.771## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 8.295## tiphogar1Pareja con un hijo menor de 16 años 8.470## tiphogar1Pareja con dos hijos menores de 16 años 4.465## tiphogar1Pareja con tres o más hijos menores de 16 años 2.582## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 10.389## tiphogar1Pareja con al menos un hijo de 16 o más años 10.664## tiphogar1Otros hogares 7.637## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) -0.935## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.929## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.198## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.758## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.287## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.168## situocuhogNingún ocupado en el hogar 0.838## Pr(>|z|)## (Intercept) 0.001876## nmiemb < 2e-16## nmiem11 < 2e-16## nmiem12 < 2e-16## numinacti < 2e-16## numocu 0.000438## tiphogar1Una persona de 30 a 64 años < 2e-16## tiphogar1Una persona de menos de 30 años 1.10e-09## tiphogar1Un adulto con niños menores de 16 años 1.57e-11## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65

Page 27: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

años o más 7.77e-15## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años < 2e-16## tiphogar1Pareja con un hijo menor de 16 años < 2e-16## tiphogar1Pareja con dos hijos menores de 16 años 8.02e-06## tiphogar1Pareja con tres o más hijos menores de 16 años 0.009812## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años < 2e-16## tiphogar1Pareja con al menos un hijo de 16 o más años < 2e-16## tiphogar1Otros hogares 2.23e-14## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) 0.349860## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.353016## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.842804## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.448318## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.774116## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.866450## situocuhogNingún ocupado en el hogar 0.401981##

## (Intercept) ** ## nmiemb ***## nmiem11 ***## nmiem12 ***## numinacti ***## numocu ***## tiphogar1Una persona de 30 a 64 años ***## tiphogar1Una persona de menos de 30 años ***## tiphogar1Un adulto con niños menores de 16 años ***## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65

Page 28: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

años o más ***## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años ***## tiphogar1Pareja con un hijo menor de 16 años ***## tiphogar1Pareja con dos hijos menores de 16 años ***## tiphogar1Pareja con tres o más hijos menores de 16 años ** ## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años ***## tiphogar1Pareja con al menos un hijo de 16 o más años ***## tiphogar1Otros hogares ***## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) ## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado ## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados ## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) ## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado ## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados ## situocuhogNingún ocupado en el hogar

## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1## ## (Dispersion parameter for binomial family taken to be 1)## ## Null deviance: 20672 on 18881 degrees of freedom## Residual deviance: 14639 on 18858 degrees of freedom## (3264 observations deleted due to missingness)## AIC: 14687## ## Number of Fisher Scoring iterations: 5

## ## est3.pred 0 1## 0 13480 2374## 1 930 2098

## [1] 0.8250185

Estimamos ahora un modelo probit

Page 29: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## ## Call:## glm(formula = datos$pobre ~ nmiemb + nmiem11 + nmiem12 + numinacti + ## numocu + tiphogar1 + situocuhog, family = binomial(link = probit), ## data = datos)## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## -5.3451 -0.5795 -0.3749 -0.1085 3.3885 ## ## Coefficients:## Estimate## (Intercept) -2.30258## nmiemb 0.72307## nmiem11 -0.18519## nmiem12 -0.32574## numinacti -0.47497## numocu -0.82202## tiphogar1Una persona de 30 a 64 años 0.74142## tiphogar1Una persona de menos de 30 años 1.16772## tiphogar1Un adulto con niños menores de 16 años 0.90675## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más 0.58391## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 0.64887## tiphogar1Pareja con un hijo menor de 16 años 0.72901## tiphogar1Pareja con dos hijos menores de 16 años 0.40672## tiphogar1Pareja con tres o más hijos menores de 16 años 0.32733## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 0.86505## tiphogar1Pareja con al menos un hijo de 16 o más años 0.96407## tiphogar1Otros hogares 0.76577## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno

Page 30: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

de los otros miembros ocupados (si es que los hay) -0.29786## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.22289## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados -0.03300## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.38301## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.12712## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.05515## situocuhogNingún ocupado en el hogar 0.64308## Std. Error## (Intercept) 0.68343## nmiemb 0.02400## nmiem11 0.02233## nmiem12 0.02913## numinacti 0.02064## numocu 0.21636## tiphogar1Una persona de 30 a 64 años 0.07719## tiphogar1Una persona de menos de 30 años 0.21074## tiphogar1Un adulto con niños menores de 16 años 0.13510## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más 0.07128## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 0.07454## tiphogar1Pareja con un hijo menor de 16 años 0.08199## tiphogar1Pareja con dos hijos menores de 16 años 0.09360## tiphogar1Pareja con tres o más hijos menores de 16 años 0.12963## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 0.08163## tiphogar1Pareja con al menos un hijo de 16 o más años 0.08385## tiphogar1Otros hogares 0.09354## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno

Page 31: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

de los otros miembros ocupados (si es que los hay) 0.26730## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.27372## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.20946## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.47193## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.47662## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.30409## situocuhogNingún ocupado en el hogar 0.68370## z value## (Intercept) -3.369## nmiemb 30.133## nmiem11 -8.293## nmiem12 -11.183## numinacti -23.015## numocu -3.799## tiphogar1Una persona de 30 a 64 años 9.606## tiphogar1Una persona de menos de 30 años 5.541## tiphogar1Un adulto con niños menores de 16 años 6.712## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más 8.192## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 8.705## tiphogar1Pareja con un hijo menor de 16 años 8.892## tiphogar1Pareja con dos hijos menores de 16 años 4.345## tiphogar1Pareja con tres o más hijos menores de 16 años 2.525## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 10.597## tiphogar1Pareja con al menos un hijo de 16 o más años 11.497## tiphogar1Otros hogares 8.186## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno

Page 32: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

de los otros miembros ocupados (si es que los hay) -1.114## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.814## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados -0.158## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.812## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.267## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.181## situocuhogNingún ocupado en el hogar 0.941## Pr(>|z|)## (Intercept) 0.000754## nmiemb < 2e-16## nmiem11 < 2e-16## nmiem12 < 2e-16## numinacti < 2e-16## numocu 0.000145## tiphogar1Una persona de 30 a 64 años < 2e-16## tiphogar1Una persona de menos de 30 años 3.01e-08## tiphogar1Un adulto con niños menores de 16 años 1.92e-11## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más 2.57e-16## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años < 2e-16## tiphogar1Pareja con un hijo menor de 16 años < 2e-16## tiphogar1Pareja con dos hijos menores de 16 años 1.39e-05## tiphogar1Pareja con tres o más hijos menores de 16 años 0.011570## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años < 2e-16## tiphogar1Pareja con al menos un hijo de 16 o más años < 2e-16## tiphogar1Otros hogares 2.69e-16## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno

Page 33: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

de los otros miembros ocupados (si es que los hay) 0.265143## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.415474## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados 0.874803## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.417031## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.789695## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 0.856074## situocuhogNingún ocupado en el hogar 0.346915##

## (Intercept) ***## nmiemb ***## nmiem11 ***## nmiem12 ***## numinacti ***## numocu ***## tiphogar1Una persona de 30 a 64 años ***## tiphogar1Una persona de menos de 30 años ***## tiphogar1Un adulto con niños menores de 16 años ***## tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más ***## tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años ***## tiphogar1Pareja con un hijo menor de 16 años ***## tiphogar1Pareja con dos hijos menores de 16 años ***## tiphogar1Pareja con tres o más hijos menores de 16 años * ## tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años ***## tiphogar1Pareja con al menos un hijo de 16 o más años ***## tiphogar1Otros hogares ***## situocuhogEl sustentador principal y el cónyuge ocupados, ninguno

Page 34: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

de los otros miembros ocupados (si es que los hay) ## situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado ## situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados ## situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) ## situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado ## situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados ## situocuhogNingún ocupado en el hogar

## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1## ## (Dispersion parameter for binomial family taken to be 1)## ## Null deviance: 20672 on 18881 degrees of freedom## Residual deviance: 14671 on 18858 degrees of freedom## (3264 observations deleted due to missingness)## AIC: 14719## ## Number of Fisher Scoring iterations: 5

## ## est4.pred 0 1## 0 13480 2374## 1 930 2098

## [1] 0.8250185

Minería de datos para el Análisis Discriminate Lineas y representación curva ROC

## Call:## lda(y[train] ~ ., data = x[train, ])## ## Prior probabilities of groups:## 0 1 ## 0.7859153 0.2140847 ## ## Group means:## datos1.nmiemb datos1.nmiem11 datos1.nmiem12 datos1.numinacti## 0 2.707856 1.230155 0.5048077 1.012684## 1 3.597446 1.510327 0.2925272 1.051821## datos1.numocu datos1.tiphogar1Una persona de 30 a 64 años## 0 1.0729337 0.02158347## 1 0.7566654 0.01088997## datos1.tiphogar1Una persona de menos de 30 años## 0 0.000306874## 1 0.001877582

Page 35: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## datos1.tiphogar1Un adulto con niños menores de 16 años## 0 0.0007160393## 1 0.0033796470## datos1.tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más## 0 0.15630115## 1 0.08111153## datos1.tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años## 0 0.1689853## 1 0.0781074## datos1.tiphogar1Pareja con un hijo menor de 16 años## 0 0.1059738## 1 0.1182876## datos1.tiphogar1Pareja con dos hijos menores de 16 años## 0 0.1022913## 1 0.1749906## datos1.tiphogar1Pareja con tres o más hijos menores de 16 años## 0 0.01155892## 1 0.05895606## datos1.tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años## 0 0.01125205## 1 0.01051446## datos1.tiphogar1Pareja con al menos un hijo de 16 o más años## 0 0.2436579## 1 0.3368382## datos1.tiphogar1Otros hogares## 0 0.05953355## 1 0.10589561## datos1.situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay)## 0 0.3259002## 1 0.0987608## datos1.situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado## 0 0.02905074## 1 0.02628614## datos1.situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados

Page 36: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## 0 0.006137480## 1 0.003379647## datos1.situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay)## 0 0.2012070## 1 0.4344724## datos1.situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado## 0 0.03641571## 1 0.02703718## datos1.situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados## 0 0.007160393## 1 0.003755163## datos1.situocuhogNingún ocupado en el hogar## 0 0.3654869## 1 0.3980473## ## Coefficients of linear discriminants:## LD1## datos1.nmiemb 1.0385083## datos1.nmiem11 -0.2413016## datos1.nmiem12 -0.4201854## datos1.numinacti -0.6777210## datos1.numocu -0.9817186## datos1.tiphogar1Una persona de 30 a 64 años 0.3044892## datos1.tiphogar1Una persona de menos de 30 años 2.7793322## datos1.tiphogar1Un adulto con niños menores de 16 años 1.2751798## datos1.tiphogar1Pareja sin hijos teniendo al menos uno de los miembros 65 años o más 0.5287921## datos1.tiphogar1Pareja sin hijos teniendo los dos miembros menos de 65 años 1.0195342

Page 37: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## datos1.tiphogar1Pareja con un hijo menor de 16 años 0.7916490## datos1.tiphogar1Pareja con dos hijos menores de 16 años 0.3262444## datos1.tiphogar1Pareja con tres o más hijos menores de 16 años 0.2290850## datos1.tiphogar1Padre o madre solo, con al menos un hijo de 16 o más años 0.5313942## datos1.tiphogar1Pareja con al menos un hijo de 16 o más años 1.1806129## datos1.tiphogar1Otros hogares 0.8704265## datos1.situocuhogEl sustentador principal y el cónyuge ocupados, ninguno de los otros miembros ocupados (si es que los hay) -0.3099479## datos1.situocuhogEl sustentador principal o el cónyuge ocupado, otro de los miembros ocupado 0.1520750## datos1.situocuhogEl sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados -0.3110726## datos1.situocuhogEl sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay) 0.6554938## datos1.situocuhogNi el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 0.1831629## datos1.situocuhogNi el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados -0.0918108## datos1.situocuhogNingún ocupado en el hogar 1.1558273

## class posterior.0 posterior.1 LD1## 2 0 0.8482361 0.151763889 0.1746234## 8 0 0.9935300 0.006469987 -1.9550441## 12 0 0.9073864 0.092613581 -0.1861640## 17 0 0.9416812 0.058318805 -0.5072988## 20 0 0.9812731 0.018726918 -1.2639352

## ## 0 1## 0 3902 605## 1 253 572

## [1] 0.8390848

## Warning: package 'ROCR' was built under R version 3.2.5

## Loading required package: gplots

## Warning: package 'gplots' was built under R version 3.2.5

## ## Attaching package: 'gplots'##

Page 38: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## The following object is masked from 'package:stats':## ## lowess

Minería de datos y obtencion de las curvas ROC para el modelo Logit.

## ## pred 0 1## 0 3943 615## 1 251 523

## [1] 0.8375844

Page 39: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

K-Nearest Neighbors: Aplicación a Encuesta Gastos de Presupuestos Famliares de España

library(class)# K-Nearest NeighborsPobre=as.factor(y)train=sample(seq(length(y)),length(y)*0.70,replace=FALSE)x$datos1.tiphogar1 <- as.numeric(x$datos1.tiphogar1)x$datos1.situocuhog <- as.numeric(x$datos1.situocuhog)knn.prd=knn1(x[train,1:7],x[-train,1:7],Pobre[train])table(knn.prd,Pobre[-train])

## ## knn.prd 0 1## 0 3947 639## 1 248 498

Arbol de decision

require(tree)

## Loading required package: tree

## Warning: package 'tree' was built under R version 3.2.5

# Selección de variablesexplicativas <- data.frame(datos1$nmiemb,datos1$nmiem11,datos1$nmiem12,datos1$numinacti,datos1$

Page 40: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

numocu,datos1$tiphogar1,datos1$situocuhog)y=as.factor(datos1$pobre)datos <- data.frame(explicativas,y) # división de la muestra en entrenamiento y validaciontrain=sample(seq(length(y)),length(y)*0.70,replace=FALSE)Pobreza.tree = tree(y~.,datos,subset=train)summary(Pobreza.tree)

## ## Classification tree:## tree(formula = y ~ ., data = datos, subset = train)## Variables actually used in tree construction:## [1] "datos1.situocuhog" "datos1.nmiemb" ## Number of terminal nodes: 5 ## Residual mean deviance: 0.8397 = 10440 / 12430 ## Misclassification error rate: 0.1939 = 2412 / 12439

plot(Pobreza.tree);text(Pobreza.tree,pretty=0)

Pobreza.tree

## node), split, n, deviance, yval, (yprob)## * denotes terminal node## ## 1) root 12439 12930.0 0 ( 0.78559 0.21441 ) ## 2) datos1.situocuhog: El sustentador principal y el cónyugeocupados, al menos otro de los miembros también ocupado,El sustentador principal y el cónyuge ocupados, ninguno de los otros

Page 41: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

miembros ocupados (si es que los hay),El sustentador principal o el cónyugeocupado, al menos otros dos miembros ocupados,Ni el sustentador principal ni su cónyuge ocupados, al menos otros dos miembros ocupados 3905 1989.0 0 ( 0.92958 0.07042 ) *## 3) datos1.situocuhog: El sustentador principal o el cónyuge ocupado, otro de los miembros ocupado,El sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay),Ni el sustentador principal ni su cónyuge ocupado, otro miembro ocupado,Ningún ocupado en el hogar 8534 10130.0 0 ( 0.71971 0.28029 )

## 6) datos1.nmiemb < 2.5 4368 3169.0 0 ( 0.88210 0.11790 ) *## 7) datos1.nmiemb > 2.5 4166 5734.0 0 ( 0.54945 0.45055 ) ## 14) datos1.situocuhog: El sustentador principal o el cónyuge ocupado, otro de los miembros ocupado,Ni el sustentador principal ni su cónyuge ocupado, otro miembro ocupado 768 738.3 0 ( 0.81380 0.18620 ) *## 15) datos1.situocuhog: El sustentador principal o el cónyugeocupado, ninguno de los otros miembros ocupado (si es que los hay),Ningún ocupado en el hogar 3398 4709.0 1 ( 0.48970 0.51030 ) ## 30) datos1.nmiemb < 4.5 2951 4079.0 0 ( 0.53135 0.46865 ) *## 31) datos1.nmiemb > 4.5 447 465.1 1 ( 0.21477 0.78523 ) *

tree.pred=predict(Pobreza.tree,datos[-train,],type="class")summary(tree.pred)

## 0 1 ## 5130 202

with(datos[-train,],table(tree.pred,y))

## y## tree.pred 0 1## 0 4114 1016## 1 45 157

# Mediante validación cruzada se busca el mejor arbol de decisioncv.Pobreza=cv.tree(Pobreza.tree,FUN=prune.misclass)cv.Pobreza

## $size## [1] 5 1## ## $dev## [1] 2411 2580## ## $k## [1] -Inf 63.75## ## $method## [1] "misclass"

Page 42: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

## ## attr(,"class")## [1] "prune" "tree.sequence"

plot(cv.Pobreza)

prune.Pobreza=prune.misclass(Pobreza.tree,best=5)plot(prune.Pobreza);text(Pobreza.tree,pretty=0)

Page 43: Curso estadistica en R -    Web viewCurso estadistica en R. ... otro de los miembros también activo 5.874e+01## as.factor(ecpf2014$situacthog) El sustentador principal o el

tree.pred=predict(prune.Pobreza,datos[-train,],type="class")with(datos[-train,],table(tree.pred,y))

## y## tree.pred 0 1## 0 4114 1016## 1 45 157