figura 26. matriz de diagrama de dispersión para el modelo
TRANSCRIPT
112
La matriz con los gráficos se presenta a continuación:
Figura 26. Matriz de diagrama de dispersión para el modelo Stepwise. Datos: ASE03RLM.
113
5.2 Análisis gráfico de residuales.
Comandos:
Modelos -> Añadir las estadísticas de las observaciones a los datos…
Al mostrar la ventana se debe oprimir Correcto.
5.3 Supuestos de varianzas homogéneas
Comandos:
Gráficas -> Diagrama de Dispersión
Se deben de seleccionar como variable x: Fitted y como variable Y: rstudent.
114
Figura 27. Gráfica de Supuestos de varianzas homogéneas. Datos: ASE03RLM.
5.4 Para crear una variable “tiempo” en los datos cargados se deben de ejecutar los
siguientes comandos:
Datos -> Modificar variable de los datos activos -> Add observations numbers to data set
Gráficos -> Diagramas de Dispersión…
115
Se deben de seleccionar como variable x: ObsNumber y como variable Y:
rstudent.
Figura 28. Gráfico para detectar independencia de los errores. Datos: ASE03RLM
116
5.5 Gráficas básicas de diagnósticos.
Comandos:
Modelos -> Gráficas -> Gráficas de básica de diagnósticos
Figura 29. Gráficas básicas de Diagnósticos. Datos: ASE03RLM.
5.6 Test de Normalidad.
Para aplicar este test en R commander el usuario deberá escribir en la ventana
de instrucciones la siguiente línea de comando:
shapiro.test(ASE03RLM$LinearModel.4.rstudent)
donde:
shapiro.test: es el comando en R para realizar el test de
normalidad.
ASE03RLM: nombre de los datos activos, para este
ejercicio
LinearModel.4.rstudent: nombre de las observaciones para los errores
studentized.
117
Nota: Es importante colocar el signo $ entre los datos y la columna de los residuos
estudentizados; el mismo sirve para referenciar la columna dentro de los datos.
Una vez escrito el comando en la ventana de instrucciones se debe de mandar a
ejecutar; solo con seleccionar la línea o simplemente dejar el cursor parado en la misma
y oprimir ejecutar.
Los resultados serán mostrados en la ventana de resultados.
Figura 30.Resultados de la Prueba de Normalidad. Datos: ASE03RLM.
5.7 Prueba de Breush – Pagan para heterocedasticidad
Comandos:
Modelos -> Diagnósticos numéricos -> Prueba de Breush – Pagan para heterocedasticidad..
118
En la ventana de Prueba de Breush-Pagan debe ser seleccionado el estadístico
del contraste: (Studenttized), formula de la varianza: Valores ajustados (Fitted values);
seleccionar la variable para ser enviada a la formula; finalmente presionar Correcto.
Figura 31.Resultados de la Prueba de Breusch-Pagan. Datos: ASE03RLM.
5.8 Prueba de Durbin-Watson para autocorrelación
Comandos:
Modelos -> Diagnósticos numéricos -> Prueba de Durbin-Watson para autocorrelación
En la ventana de Prueba de Durbin-Watson se deja seleccionado la hipótesis
alternativa 0rho ; seguidamente presionar Correcto.
119
Figura 32. Resultados de la Prueba de Durbin-Watson. Datos: ASE03RLM.
120
Capítulo 5. Conclusiones
Las principales conclusiones y recomendaciones de esta investigación son
mostradas a continuación:
La aplicación de R-Commander en esta investigación permite analizar el
funcionamiento y concluir que es una Interfaz Gráfica de Usuario (GUI) de
fácil instalación en donde el usuario requiere de acceso a Internet; en cuanto
al despliegue de menús muestra diferentes métodos estadísticos, permitiendo
el análisis gráfico con diferentes opciones desde gráficos básicos
(histogramas, tortas, tallos y hojas, medias, entre otros), hasta gráficos en
tercera dimensión, básicos de diagnósticos, entre otros.
R-Commander permite al usuario guardar en distintos formatos las
instrucciones para volverlas a ejecutar.
R-Commander es una interfaz amigable, ya que permite acceder a muchas
capacidades del entorno estadístico R, permitiendo al usuario complementar
y ampliar la aplicación de métodos estadísticos mediante el uso de este
lenguaje.
Las variables asociadas al sector forestal del país, se cuantifican en 65
variables distribuidas principalmente en la Industria de Aglomerado y
Contrachapado; las pruebas de Rcmdr se efectuaron principalmente en la
Industria de Aserrío por ser la base de datos disponible más completa.
Las variables recabadas producto del aprovechamiento forestal del país,
pueden ser analizadas aplicándoles diferentes métodos estadísticos como:
estadística descriptiva, prueba de hipótesis, análisis de regresión lineal
simple y múltiple, análisis de la varianza, entre otros. Estos análisis serán
más confiables al ser implementado el nuevo Sistema Nacional de
Información Estadística Forestal (SNIEF) de recolección de datos
provenientes del aprovechamiento forestal.
121
Bibliografía
Gujarati Damodar N. Econometria. (2003). Mc. Graw Hill. México DF.M, edición.
Hays William. (1998).Statistics. New York. Holt, Rinehart and Winston, Inc. Fourth
edition.
Mendenhall Willian y Terry Sincich. (1877). Probabilidad y Estadística para Ingeniería
y Ciencias. Printice-Hall Hispanoamérica, SA. Impreso en México.
Montgomery, Douglas. (1991). Diseño y Análisis de Experimentos. Grupo Editorial
Iberoamericano. México DF.
Neter John, Kurtner Michael, Nachtsheim Christofher, and Wasserman Willian. (1996).
Applied Linear Regression Models. Richard D, Irwing INC. Library of Congress
Catalogin-in-Publication Data. Third Edition.
Overton, W. S., and Stehman S. V. (1995), “The Horvitz-Thompson Theorem as a
Unifying perspective for Probability Sampling: With examples From Natural Resources
Sampling,” The American Statistician, August 1995, Vol. 49, No. 3.
Pardo Merino Antonio, Ruiz Díaz, Miguel Ángel. SPSS 11 Guía para el Análisis de
Datos. Editora: Concepción Fernández Madrid.
Winship C., and Radbill L. (1994), “Sampling Weights and Regression Analysis.
Sociological Methods and Research,” Vol. 23 No. 2, November
Fox Jhon . The R Commander: A Basic-Statistics GUI for R. Sin fecha consultado de
World Wide Web:
http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/
122
Fox Jhon McMaster University Journal of Statistical Software (2005). The R
Commander: A Basics-Statistics Graphical User Interface to R., Volume 14, Issue 9. Sin
fecha consultado de World Wide Web:
http://www.jstatsoft.org/v14/i09/v14i09.pdf
35 JAIIO Simposio JLS 2006. Aplicación del Software Estadístico R para la enseñanza
de la Regresión. Sin fecha consultado de World Wide Web:
http://rrii.sgp.gov.ar/index.php?option=com_docman&task=doc_view&gid=7727&Item
id=46
Departament of statistics and mathematics of the WU Wien, Austria. The
Comprehensive R Archive Networtk. Sin fecha consultado de World Wide Web:
http://cran.r-project.org/
Rcmdr: R Commander. Sin fecha consultado de World Wide Web:
http://cran.rproject.org/src/contrib/Descriptions/Rcmdr.html
Emmanuel Paradis. R para principiantes. Sin fecha consultado de World Wide Web:
http://cran.rproject.org/doc/contrib/rdebuts_es.pdf
123
APÉNDICES
124
APÉNDICE
Planillas de captura de la Información Forestal
125
Planilla Aserrío
126
127
Planilla Industria de Machihembradora, Carpintería, Mueblería, Depósitos y Afines.
128
129
Planilla Industria Tableros Contrachapados
Ministerio del Ambiente. Dirección General de Bosques
Sistema Nacional de información Estadísticas Forestales
Registro de Información Estadística de la Industria de Tableros Contrachapados.
Identificación. No. Autorización o Permiso:
Fecha de emisión: Duración hasta: RIF:
01. Fecha de recolección de la Información Geográfica y datos sobre la Empresa Mes Año Estado Municipio DEA Área Adm. Sector Parroquia
Nombre del Beneficiario CI RIF Dirección Empresa Teléfono Fax Correo electrónico
02. Datos de Carácter Administrativo P E R S O N A L
ADMINISTRATIVO OBREROS
Nº EMPLEADOS
SUELDO MENSUAL
PROMEDIO Nº
EMPLEADAS
SUELDO MENSUAL
PROMEDIO
Nº OBREROS
SALARIO MENSUAL
PROMEDIO
Nº OBRERA
S
SALARIO MENSUAL
PROMEDIO
VALOR DE LA VENTA BRUTA
MES 21) REPRESENTANTE
03. Procedencia de la Madera en Rola. Pais/Estado Pais/Estado Pais/Estado Pais/Estado Pais/Estado Pais/Estado
Ciudad Ciudad Ciudad Ciudad Ciudad Ciudad
Volumen (m3) Volumen (m3) Volumen (m3) Volumen (m3) Volumen (m3) Volumen (m3)
130
Ministerio del Ambiente.
Dirección General de Bosques Sistema Nacional de información
Estadísticas Forestales
Registro Operacional de Información Estadística La Industria de Tableros Contrachapados
Identificación. No. Autorización o Permiso :
Fecha de emisión: Duración hasta: RIF:
04. Destino del Producto Manufacturado. Pais/estado Pais/estado Pais/estado Pais/estado Pais/estado Pais/estado
Ciudad Ciudad Ciudad Ciudad Ciudad Ciudad
Volumen Volumen Volumen Volumen Volumen Volumen
05. Movimiento Mensual de la Madera en Rola.
Existencias mes anterior
Entradas mes actual Procesadas
Vendidas Otras
salidas Saldo
Especie Rola s
m 3 Rolas m 3 Rolas
m 3 Rolas
m 3
Rolas
m 3
Rolas
m 3
Precio de compra de
rolas. Bs./ m3
06. Producción a Nivel de Prensa. CONTRACHAPADO PANELFORTE OTRO Especie
4 mm 8mm mm
mm
mm
mm
mm
mm
mm
mm
mm
131
Ministerio del Ambiente.
Dirección General de Bosques Sistema Nacional de información
Estadísticas Forestales
Registro Operacional de Información Estadística La Industria de Tableros Contrachapados
Identificación. No. Autorización o Permiso:
Fecha de emisión: Duración hasta: RIF:
07. Venta del Producto. CONTRACHAPADO PANELFORTE OTRO
Cantidad Cantidad Cantidad
Especie Espesor
(mm) Bs./m 2 m2 Bs. Espesor
(mm) Bs./m2
m2 Bs.
Espesor
(mm) Bs./m2
m2 Bs.
09. Medias del producto acabado. 08. Cantidad en m del producto acabado (Producción del mes)
Ancho(mm)
Largo(mm) Espesor(mm)
Ancho(mm)
Largo(mm)
Espesor(mm) Contrachapado
Panforte.
Tripa.
Compuesto
132
Planilla Industria Tableros y Aglomerados.
Ministerio del Ambiente. Dirección General de Bosques
Sistema Nacional de información Estadísticas Forestales
Registro de Información Estadística de la Industria de Tableros y Aglomerados
Identificación. No. Autorización o Permiso:
Fecha de emisión: Duración hasta: RIF:
02. Fecha de recolección de la Información Geográfica y datos sobre la Empresa Mes Año Estado Municipio DEA Área Adm. Sector Parroquia
Nombre del Beneficiario CI RIF Dirección Empresa Teléfono Fax Correo electrónico
03. Datos Administrativos y de la producción. PERSONAL
ADMINISTRATIVO OBRERO Numero de empleados
Monto Mensual
Numero de empleadas
Monto Mensual
Numero de obreros
Monto semana
Numero de obreras
Monto semana
CAPACIDAD DE PRODUCCION INSTALADA (m3) UTILIZADA (m3) Días efectivos trabajo / mes:
Horas efectivas de trabajo / mes:
03. Movimiento de Madera en Rola (Volumen Real). Existencia
mes anterior. Entradas
mes actual Procesadas Vendidas Otras
salidas Saldo
ESPECIE Procedencia Rolas m3 Rolas m3
Rolas m3
Rolas m3
Rolas m3
Rolas m3
133
04. Dimensiones de las partículas (3D) mm. 05. Cantidad de Producto Acabado / mes (m3)
Tableros de partículas: Cara Tableros Mixtos:
Aglomerados:
Alma Otros:
06. Producción Mensual en Prensa (m2).
AGLOMERADOS (Espesor)
MIXTOS (Espesor)
Especie
07. Medidas del Producto Acabado 08. Destino de la Producción.
Aglomerados Mixtas
Aglomerados Ancho
(m) Largo(
m) Espesor
(mm)
Especies Mcdo. Nal. Export. Mcdo. Nal. Export.
08. Ventas del producto. AGLOMERADOS MIXTOS
ESPECIE Espesor
(mm) Valor Unitario
Bs. / m2 Cantidad
m2 Bs.
Espesor (mm)
Valor Unitario
Bs. / m2 Cantidad
m 2 Bs.
Otros Espesor
(mm) Valor Unitario
Bs. / m2 Cantidad
m2 Bs.
134
Planilla Carbón Vegetal
REPÚBLICA BOLIVARIANA DE VENEZUELA Identification
MINISTERIO DEL AMBIENTE REGISTRO DE INFORMACION ESTADISTICA DE LA
INDUSTRIAS DEL CARBON VEGETAL No. Autorizacion o Permiso:
DIRECCION GENERAL DE BOSQUES SISTEMA NACIONAL DE INFORMACION
ESTADISTICA FORESTAL Fecha de Emision:
Duracion hasta:
RIF:
DATOS DE LA EMPRESA
4) NOMBRE O RAZON SOCIAL 5) REPRESENTANTE LEGAL 6) C.I. N.o: 7) NUMERO DE PERMISO
8) DIRECCION 9)TELEFONO 10) TELEX/FAX
11) UBICACION GEOGRAFICA: a) ENTIDAD FEDERAL b) MUNICIPIO c) PARROQUIA
DATOS DEL PERSONAL 12) PERSONAL ADMINISTRATIVO 13) PERSONAL OBRERO
a) NUMERO EMPLEADOS
b) MONTO MENSUAL
c) NUMERO EMPLEADAS d) MONTO MENSUAL
a) NUMERO OBREROS
b) MONTO SEMANA
c) NUMERO OBRERAS
d) MONTO SEMANA
INFORMACION SOBRE LA PRODUCCION
14) CAPACIDAD INSTALADA
15) CAPACIDAD UTILIZADA
16) VALOR BRUTO PRODUCCION 17)TIPOS DE HORNOS 18) No. DE HORNOS
a) COLMENA b)METALICO C) OTRO
a) AUTORIZADOS b) FUNCIONARIO
135
PROCEDENCIA DE LA MATERIA PRIMA
21) RESERVA FORESTAL
26) VOLUMEN 27)
19) PAÍS 20)ESTADO Y TERRENOS BALDIOS
22) FUNDO PARTICULAR 23)TERRENOS I.A.N.
24)TERRENOS
C.V.G. 25) ESPECIES
APROVECHADAS
Kg. TM
REND/ESP/KG.
MOVIMIENTO MENSUAL DE LA MATERIA PRIMA Y PRODUCTOS (Kg. O TM)
29) Existencia 30) Entradas 31) SALIDAS DEL MES 33) MOVIMIENTO DEL PRODUCTO
28) ESPECIES mes anterior mes actual a) Procesada b)Vendida c) otras sal. 32)SALDO
a) Existencia. b)Prod.
c) salida
d) Destino
e) Saldos
136
APÉNDICE 2
Comandos de R para ejecutar diferentes Métodos Estadísticos.
137
1. Estadísticas Descriptivas
# Programa de Estadística Descriptiva # Datos: ASE01. Base de datos del Sistema Nacional de Información de # # Estadísticas forestales (SNIEF); Aserrio año 2003 # Variable MESES (1,2,...,12); NRO_OBRE:número de obreros promedio por # industria;SAL_SEM:salario semanal
# Cargar los datos. Nombre: ASE01 (delimitado por comas) ASEO1 <- read.table("C:/Documents and Settings/WindowsXP/Mis documentos/TESIS 2007/DATOS/ESTD.DESCRIP/ASE01.csv", header=TRUE, sep=";", na.strings="NA", dec=".", strip.white=TRUE)
# Visualizar los Datos showData(ASEO1, placement='-20+200', font=getRcmdr('logFont'), maxwidth=80, maxheight=30)
# Cálculo de las Estadísticas descriptivas summary(ASEO1) numSummary(ASEO1[,c("NRO_OBRE", "SAL_SEM")], statistics=c("mean","sd"))
# Convertir la variable mes en un factor ASEO1$MESESF <- as.factor(ASEO1$MESES)
# Grafica de las medias plotMeans(ASE01$NRO_OBRE, ASE01$MESESF, error.bars="se") dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/MEDIAS.pdf", width=5.0, height=5.0, pointsize=10)
# Estadística descriptiva clasificada por grupos numSummary(ASEO1[,c("NRO_OBRE", "SAL_SEM")], groups=ASEO1$MESESF, statistics=c("mean", "sd"))
# Histogramas Hist(ASEO1$NRO_OBRE, scale="frequency", breaks="Sturges", col="darkgray") dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/HISTOGRAMA.pdf", width=5.0, height=5.0, pointsize=10)
# Gráficos de tallos y hojas stem.leaf(ASEO1$NRO_OBRE)
# Diagrama de caja boxplot(ASE01$NRO_OBRE, ylab="NRO_OBRE") dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/DIAGRAMA-CAJA.pdf", width=5.0, height=5.0, pointsize=10)
138
2. Prueba de Hipótesis para una media
# Programa Prueba de hipótesis para una media # Datos: ASE01. Base de datos del Sistema Nacional de Información de # Estadísticas forestales (SNIEF). Aserrio año 2003 # Variable MESES (1,2,...,12); NRO_OBRE:número de obreros promedio por
industria;SAL_SEM:salario semanal
# Cargar los datos. Nombre: ASE01 (delimitado por comas) ASEO1 <- read.table("C:/Documents and Settings/WindowsXP/Mis documentos/TESIS 2007/DATOS/ESTD.DESCRIP/ASE01.csv", header=TRUE, sep=";", na.strings="NA", dec=".", strip.white=TRUE)
# Calculo de una nueva variable: SAL_MEN: salario mensual ASE01$SAL_MEN <- with(ASE01, SAL_SEM*4)
# Visualizar los datos showData(ASE01, placement='-20+200', font=getRcmdr('logFont'), maxwidth=80, maxheight=30)
# Probar la hipótesis planteda t.test(ASE01$SAL_MEN, alternative='less', mu=250000, conf.level=.95)
3. Prueba de hipótesis para dos medias
# Programa Prueba de hipótesis para una media # Datos: ASE01. Base de datos del Sistema Nacional de Información de # Estadísticas forestales (SNIEF). Aserrio año 2003 # Variable MESES (1,2,...,12); NRO_OBRE:número de obreros promedio por # industria;SAL_SEM:salario semanal
# Cargar los datos. Nombre: ASE01 (delimitado por comas) ASEO1 <- read.table("C:/Documents and Settings/WindowsXP/Mis documentos/TESIS 2007/DATOS/ESTD.DESCRIP/ASE01.csv", header=TRUE, sep=";", na.strings="NA", dec=".", strip.white=TRUE)
# Calculo de una nueva variable: SAL_MEN: salario mensual ASE01$SAL_MEN <- with(ASE01, SAL_SEM*4)
# Convertir variable numérica a factor MESES a MESESF ASE01$MESESF <- as.factor(ASE01$MESES)
# Segmentar variable numérica MESES A SEMESTRE ASE01$SEMESTRE <- bin.var(ASE01$MESES, bins=2, method='intervals', labels=FALSE)
# Visualizar los datos showData(ASE01, placement='-20+200', font=getRcmdr('logFont'), maxwidth=80, maxheight=30)
139
# Prueba de Hipótesis para diferencia de medias t.test(SAL_MEN~SEMESTRE, alternative='two.sided', conf.level=.95, var.equal=FALSE, data=ASE01)
4. Análisis de Regresión Lineal Simple. Datos:ASE03RLS
#Programa Análisis de Regresión Simple # Datos: ASE03RLS.Base de datos del Sistema Nacional de Información de # Estadísticas forestales (SNIEF); Aserrio año 2003 # Variables: Meses: MESES, Código de industria:COD_INDUST, # Volumen de madera procesada en mtrs cubicos:SAL_PROCM, # Número de empleados: PERAD_NEMP, # Monto total devengado por el personal administrativo al # mes: PERAD_MMES, Numero de obreros: PEROB_NOBR, # Monto total devengado por los obreros en la ultima semana # del mes: PEROB_MSEM, Dias efectivos de Aserrio al mes: # DIAEFEMES
# CARGAR LOS DATOS ASE03RLS <- sqlQuery(channel = 1, select * from [Hoja1$])
#VISUALIZAR LOS DATOS showData(ASE03RLS, placement='-20+200', font=getRcmdr('logFont'), maxwidth=80, maxheight=30)
#ANÁLISIS DE CORRELACION cor.test(ASE03RLS$PEROB_NOBR, ASE03RLS$SAL_PROCM, alternative="two.sided", method="pearson")
# DIAGRAMAS DE DISPERSIÓN scatterplot(PEROB_NOBR~SAL_PROCM, reg.line=FALSE, smooth=FALSE, labels=FALSE, boxplots=FALSE, span =0.5, data=ASE03RLS) dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/DISPERSION.pdf", width=5.0, height=5.0, pointsize=10)
# ECUACION DE REGRESION Reglinsimple.ASE03 <- lm(SAL_PROCM ~ PEROB_NOBR -1, data=ASE03RLS) summary(Reglinsimple.ASE03)
# AÑADIR ESTADISTICA A LOS DATOS ASE03RLS$Reglinsimple.ASE03.fitted <- fitted(Reglinsimple.ASE03) ASE03RLS$Reglinsimple.ASE03.residuals <- residuals(Reglinsimple.ASE03) ASE03RLS$Reglinsimple.ASE03.rstudent <- rstudent(Reglinsimple.ASE03) ASE03RLS$Reglinsimple.ASE03.hatvalues <- hatvalues(Reglinsimple.ASE03) ASE03RLS$Reglinsimple.ASE03.cooks.distance <- cooks.distance(Reglinsimple.ASE03) ASE03RLS$obsNumber <- 1:nrow(ASE03RLS)
# SUPUESTOS DE NORMALIDAD qq.plot(ASE03RLS$Reglinsimple.ASE03.rstudent, dist= "norm", labels=FALSE) dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/SUPUESTO DE NORMALIDAD.pdf", width=5.0, height=5.0, pointsize=10)
140
# SUPUESTOS DE VARIANZAS HOMOGENEAS scatterplot(Reglinsimple.ASE03.rstudent~Reglinsimple.ASE03.fitted, reg.line=FALSE, smooth=FALSE, labels=FALSE, boxplots=FALSE, span =0.5, data=ASE03RLS) dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/SUPUESTOS VARIANZAS HOMOGENEAS.pdf", width=5.0, height=5.0, pointsize=10)
# CREAR VARIABLE TIEMPO ASE03RLS$ObsNumber <- 1:80
# GRÁFICO PARA DETECTAR INDEPENDENCIA DE LOS ERRORES scatterplot(Reglinsimple.ASE03.rstudent~ObsNumber, reg.line=FALSE, smooth=FALSE, labels=FALSE, boxplots=FALSE, span =0.5, data=ASE03RLS) dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/INDEPENDENCIA DE ERRORES.pdf", width=5.0, height=5.0, pointsize=10)
# GRÁFICA BÁSICA DE DIAGNOSTICOS par(mfrow=c(2,2)) plot(Reglinsimple.ASE03) par(mfrow=c(1,1)) dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/DIAGNOSTICO.pdf", width=5.0, height=5.0, pointsize=10)
# PRUEBA DE BREUSH-PAGAN bptest(SAL_PROCM ~ PEROB_NOBR - 1, varformula = ~ fitted.values(Reglinsimple.ASE03), studentize=TRUE, data=ASE03RLS)
# PRUEBA DE DURBIN-WATSON dwtest(SAL_PROCM ~ PEROB_NOBR - 1, alternative="greater", data=ASE03RLS)
5. Análisis de Regresión Múltiple
#Programa Análisis de Regresión Multiple # Datos: ASE03RLM.Base de datos del Sistema Nacional de Información de # Estadísticas forestales (SNIEF); Aserrio año 2003 # Variables: Meses: MESES, Código de industria:COD_INDUST, # Volumen de madera procesada en mtrs cubicos:SAL_PROCM, # Número de empleados: PERAD_NEMP, # Monto total devengado por el personal administrativo al # mes: PERAD_MMES, Numero de obreros: PEROB_NOBR, # Monto total devengado por los obreros en la ultima semana # del mes: PEROB_MSEM, Dias efectivos de Aserrio al mes: # DIAEFEMES
141
# Cargar los datos. Nombre:ASE03RLM ASE03RLM <- read.table("C:/Documents and Settings/WindowsXP/Mis documentos/ASE03RLM.csv", header=TRUE, sep=";", na.strings="NA", dec=",", strip.white=TRUE)
# Modelo lineal LinearModel.1 <- lm(SAL_PROCM ~ DIAEFEMES + PERAD_MMES + PERAD_NEMP + PEROB_MSEM + PEROB_NOBR -1, data=ASE03RLM) summary(LinearModel.1)
# Calculo de los coeficientes de correlación cor(ASE03RLM[,c("DIAEFEMES","MESES","PERAD_MMES","PERAD_NEMP","PEROB_MSEM","PEROB_NOBR","SAL_PROCM")], use="complete.obs")
# Regresión paso a paso (Stepwise); para descartar variables no relevantes para el modelo. step(LinearModel.1)
# Calculo de los coeficientes de correclación, determinación y tabla ANOVA LinearModel.2 <- lm(SAL_PROCM ~ DIAEFEMES + PERAD_MMES + PEROB_NOBR - 1, data=ASE03RLM) summary(LinearModel.2)
# Analisis de residuales scatterplot.matrix(~DIAEFEMES+PERAD_MMES+PEROB_NOBR+SAL_PROCM, reg.line=lm, smooth=FALSE, span=0.5, diagonal = 'qqplot', data=ASE03RLM) dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/DISPERSION STEPWISE.pdf", width=5.0, height=5.0, pointsize=10)
# Agregar estadísticas observacionales a los datos ASE03RLM$LinearModel.2.fitted <- fitted(LinearModel.2) ASE03RLM$LinearModel.2.residuals <- residuals(LinearModel.2) ASE03RLM$LinearModel.2.rstudent <- rstudent(LinearModel.2) ASE03RLM$LinearModel.2.hatvalues <- hatvalues(LinearModel.2) ASE03RLM$LinearModel.2.cooks.distance <- cooks.distance(LinearModel.2) ASE03RLM$obsNumber <- 1:nrow(ASE03RLM)
# Supuestos de varianzas homogeneas scatterplot(LinearModel.2.rstudent~LinearModel.2.fitted, reg.line=FALSE, smooth=FALSE, labels=FALSE, boxplots=FALSE, span =0.5, data=ASE03RLM) dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/VARIANZAS HOMOGENEAS.pdf", width=5.0, height=5.0, pointsize=10)
# CREAR UNA VARIABLE TIEMPO ASE03RLM$ObsNumber <- 1:80
142
# Gráfico para detectar independencia de los errores scatterplot(LinearModel.2.rstudent~ObsNumber, reg.line=FALSE, smooth=FALSE, labels=FALSE, boxplots=FALSE, span =0.5, data=ASE03RLM) dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/INDEPENDENCIA DE LOS ERRORES.pdf", width=5.0, height=5.0, pointsize=10)
# Gráficas básicas de diagnosticos par(mfrow=c(2,2)) plot(LinearModel.2) par(mfrow=c(1,1)) dev.print(pdf, file="C:/Documents and Settings/WindowsXP/Mis documentos/BASICA DIAGNOSTICO.pdf", width=5.0, height=5.0, pointsize=10)
# Test de Normalidad shapiro.test(ASE03RLM$LinearModel.2.rstudent)
# Prueba de Breush-Pagan bptest(SAL_PROCM ~ DIAEFEMES + PERAD_MMES + PEROB_NOBR - 1, varformula = ~ fitted.values(LinearModel.2), studentize=TRUE, data=ASE03RLM)
# Prueba de Durbin-Watson dwtest(SAL_PROCM ~ DIAEFEMES + PERAD_MMES + PEROB_NOBR - 1, alternative="greater", data=ASE03RLM)
# Gráfico de tres variables scatter3d(ASE03RLM$DIAEFEMES, ASE03RLM$SAL_PROCM, ASE03RLM$PEROB_NOBR, fit="linear", residuals=TRUE, bg="white", axis.scales=TRUE, grid=TRUE, ellipsoid=FALSE, xlab="DIAEFEMES", ylab="SAL_PROCM", zlab="PEROB_NOBR") rgl.snapshot("C:/Documents and Settings/WindowsXP/Mis documentos/3D.png")
This document was created with Win2PDF available at http://www.win2pdf.com.The unregistered version of Win2PDF is for evaluation or non-commercial use only.This page will not be added after purchasing Win2PDF.