manual estadistico (1).pdf

Upload: carlos-isla-riffo

Post on 06-Jul-2018

247 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 Manual Estadistico (1).pdf

    1/276

    Manual Estad́ıstico — Taller I — 

    Alumnos.  Franco Barrientos - Jorge De La Cerda - Cesar Maripangui - Fernando Neira Profesor.  Luis Figueroa 

    Santiago, Chile

    2012

  • 8/18/2019 Manual Estadistico (1).pdf

    2/276

    Índice general

    Introducción 7

    1. Diseño y análisis de encuesta 91.1. Investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.3. Evaluación del marco teórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    1.4. Definición del tipo de investigación a realizar . . . . . . . . . . . . . . . . . . . . . . . 111.5. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.6. Diseño experimental de investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.7. Investigación no experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.8. Redacción y análisis de ́ıtems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    1.8.1. Definición de constructo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.8.2. Construcción provisional del cuestionario . . . . . . . . . . . . . . . . . . . . . 181.8.3. Formato de respuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.8.4. Redacción de ́ıtems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.8.5. Cuantificación de las respuestas . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.8.6. Análisis de ́ıtems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    1.8.7. Análisis de opciones incorrectas de respuesta . . . . . . . . . . . . . . . . . . . 211.8.8. Corrección de los efectos del azar . . . . . . . . . . . . . . . . . . . . . . . . . . 211.9. Modelo clásico y concepto de fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    1.9.1. Fiabilidad del test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.9.2. Formas paralelas de un test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.9.3. Coeficiente de fiabilidad de formas paralelas . . . . . . . . . . . . . . . . . . . . 231.9.4. Coeficiente de fiabilidad de n  formas paralelas . . . . . . . . . . . . . . . . . . . 231.9.5. Fiabilidad como correlación entre formas paralelas . . . . . . . . . . . . . . . . 241.9.6. Fiabilidad como estabilidad temporal (Test-retest) . . . . . . . . . . . . . . . . 241.9.7. Método de dos mitades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241.9.8. Coeficiente  α  de Cronbach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

    1.9.9. Error t́ıpico o estándar de medida . . . . . . . . . . . . . . . . . . . . . . . . . 251.10. Validez del test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.10.1. Validez de contenido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.10.2. Validez de constructo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.10.3. Validez de criterio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

    1.11. Tabla de resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281.12. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    2. Estad́ıstica No Paramétrica 31

    1

  • 8/18/2019 Manual Estadistico (1).pdf

    3/276

    2.1. Conceptos previos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.1.1. Clasificación de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.1.2. Estad́ısticos de orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.1.3. Test de Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

    2.2. Caso de una muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.2.1. Prueba de rachas o de series aleatorias . . . . . . . . . . . . . . . . . . . . . . . 33

    2.2.2. Prueba Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.2.3. Prueba del Signo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362.2.4. Prueba de Wilcoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382.2.5. Prueba Chi-Cuadrado (χ2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.2.6. Prueba de Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . . . . . . . . . 402.2.7. Prueba de Shapiro-Wilk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    2.3. Caso de dos muestras correlacionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.3.1. Prueba del Signo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422.3.2. Prueba de rangos asignados de Wilcoxon . . . . . . . . . . . . . . . . . . . . . 432.3.3. Prueba de cambio de McNemar . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    2.4. Caso de dos muestras independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

    2.4.1. Prueba de Wald-Wolfowitz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452.4.2. Prueba de Wilcoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462.4.3. Prueba de Mann-Whitney . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472.4.4. Prueba de Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . . . . . . . . . 492.4.5. Prueba de Siegel Tuckey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

    2.5. Caso de k   muestras correlacionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.5.1. Prueba Q  de Cochran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.5.2. Prueba de Friedman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

    2.6. Caso de k  muestras independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532.6.1. Prueba H   de Kruskal-Wallis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    2.7. Correlación de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    2.7.1. Coeficiente de correlación  rs  de Spearman . . . . . . . . . . . . . . . . . . . . . 542.7.2. Coeficiente de correlación  τ   de Kendall . . . . . . . . . . . . . . . . . . . . . . 562.7.3. Coeficiente de concordancia W   de Kendall . . . . . . . . . . . . . . . . . . . . . 572.7.4. La estad́ıstica de Kappa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    2.8. Tabla de Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 602.8.1. Caso de una Muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 602.8.2. Caso de dos muestras correlacionadas . . . . . . . . . . . . . . . . . . . . . . . 602.8.3. Caso de k  muestras correlacionadas . . . . . . . . . . . . . . . . . . . . . . . . . 602.8.4. Caso de dos muestras Independientes . . . . . . . . . . . . . . . . . . . . . . . . 612.8.5. Caso de k  mustras independientes . . . . . . . . . . . . . . . . . . . . . . . . . 612.8.6. Correlacíon de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

    2.9. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

    3. Técnicas de Muestreo 643.1. Definiciones Básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

    3.1.1. Observaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653.2. Sesgos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    3.2.1. Sesgos de selección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663.2.2. Sesgos de medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    3.3. Tipos de diseño muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    2

  • 8/18/2019 Manual Estadistico (1).pdf

    4/276

    3.3.1. Muestreo Aleatorio Simple (m.a.s) . . . . . . . . . . . . . . . . . . . . . . . . . 673.3.2. Proporciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683.3.3. Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683.3.4. Estimación del tamaño de la muestra . . . . . . . . . . . . . . . . . . . . . . . 693.3.5. Muestreo con distinta probabilidad de seleccíon . . . . . . . . . . . . . . . . . . 703.3.6. Estimadores para muestreo usando información Auxiliar . . . . . . . . . . . . . 71

    3.3.7. Muestreo Estratificado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.3.8. Muestreo por conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 743.3.9. Diseño en más de dos etapas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 763.3.10. Tecnicas de remuestreo y replicas . . . . . . . . . . . . . . . . . . . . . . . . . . 78

    3.4. Tabla de Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 913.5. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

    4. Métodos Multivariantes 944.1. Análisis descriptivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

    4.1.1. Aplicaciones de Técnicas Multivariadas . . . . . . . . . . . . . . . . . . . . . . 954.2. Técnicas multivariadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

    4.2.1. Representación gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 964.3. Comparación de muestras provenientes de poblaciones normales . . . . . . . . . . . . . 964.3.1. Distribucíon Normal Multivariada . . . . . . . . . . . . . . . . . . . . . . . . . 964.3.2. Distribucíon Wishart . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 974.3.3. Test T 2 de Hotelling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 974.3.4. Test de homogeneidad para K-poblaciones . . . . . . . . . . . . . . . . . . . . . 984.3.5. Inferencia sobre un vector de medias . . . . . . . . . . . . . . . . . . . . . . . . 984.3.6. Inferencia sobre una matriz de Var-Cov . . . . . . . . . . . . . . . . . . . . . . 994.3.7. Test Λ de Wilks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 994.3.8. Dócima de Bartlett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

    4.4. Componentes principales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

    4.4.1. Cálculo y selección de componentes . . . . . . . . . . . . . . . . . . . . . . . . . 1014.4.2. Propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1014.4.3. Selección del número de componentes . . . . . . . . . . . . . . . . . . . . . . . 1014.4.4. Interpretación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1024.4.5. Representación Gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

    4.5. Análisis factorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1024.5.1. Modelo Factorial Ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1034.5.2. Estimación de cargas y comunalidades . . . . . . . . . . . . . . . . . . . . . . . 1044.5.3. Rotaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

    4.6. Análisis de discriminantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1064.7. Análisis multivariado de la varianza (MANOVA) . . . . . . . . . . . . . . . . . . . . . 107

    4.7.1. Modelo con un Factor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1074.7.2. Modelo con dos Factores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1084.8. Análisis de correlación canónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1094.9. Análisis de correspondencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

    4.9.1. Tabla de Contingencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1104.9.2. Tabla de contingencia múltiple o matriz de Burt . . . . . . . . . . . . . . . . . 1104.9.3. La Matriz de Frecuencias Condicionadas por Filas R  o columnas  S    . . . . . . 110

    4.10. Análisis de conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1114.10.1. Complicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

    3

  • 8/18/2019 Manual Estadistico (1).pdf

    5/276

    4.10.2. Criterios de Similitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1114.10.3. Distancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1114.10.4. Criterios basados en los Coeficientes de Correlación . . . . . . . . . . . . . . . 1124.10.5. Métodos de Clasificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

    4.11. Análisis CHAID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1144.11.1. Supuestos del Análisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

    4.11.2. Procedimiento del Análisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1144.12. Regresión loǵıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1154.13. Estudios de segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1154.14. Tabla de Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1174.15. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

    5. Modelos Lineales 1205.1. Modelo clásico de regresión lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

    5.1.1. Supuestos del Modelo Clásico de Regresión Lineal . . . . . . . . . . . . . . . . 1215.1.2. Métodos de Estimación de Parámetros . . . . . . . . . . . . . . . . . . . . . . . 1215.1.3. Análisis de Influencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

    5.1.4. Análisis de los Supuestos del Modelo Clásico de Regresión Lineal . . . . . . . . 1265.2. Selección del modelo y predicción de valores . . . . . . . . . . . . . . . . . . . . . . . . 1315.2.1. Coeficiente de Determinación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1315.2.2. Análisis de Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1325.2.3. Estimación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

    5.3. Regresión loǵıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1345.3.1. Estimación de Parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

    5.4. Regresión de Cox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1365.4.1. Estimación de  β    . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

    5.5. Regresión Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1375.5.1. Variable offset o de exposición: . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

    5.6. Tabla de Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1385.6.1. Análisis de Supuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1385.6.2. Caracteŕıstica de los modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

    5.7. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

    6. Diseño y Análisis de Experimentos 1426.1. Conceptos previos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

    6.1.1. Metodoloǵıa básica para el análisis del diseño de experimentos . . . . . . . . . 1426.2. Dócimas aproximadas y su potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1436.3. Diseño de experimentos con un factor . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

    6.3.1. Método de Comparaciones Múltiples . . . . . . . . . . . . . . . . . . . . . . . . 1456.4. Modelo de componentes de la varianza o modelo aleatorio . . . . . . . . . . . . . . . . 1476.5. Diseño de bloques aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1486.6. Diseño de cuadrado latino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1496.7. Diseño de cuadrado grecolatino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1516.8. Diseño de rectángulo latino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1526.9. Diseño de recambio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1536.10. Determinación de los estimadores de la varianza . . . . . . . . . . . . . . . . . . . . . 1546.11. Diseño de experimentos multifactoriales . . . . . . . . . . . . . . . . . . . . . . . . . . 154

    6.11.1. Diseño con dos factores fijos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

    4

  • 8/18/2019 Manual Estadistico (1).pdf

    6/276

    6.11.2. Diseño con dos factores aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . 1566.11.3. Diseño mixtos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

    6.12. Diseños factoriales con bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1586.13. Diseños anidados o jerárquicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1596.14. Diseños anidados y cruzados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

    6.14.1. Diseños con tres factores anidados y uno cruzado . . . . . . . . . . . . . . . . . 161

    6.15. Diseños de parcelas divididas (SPLIT PLOT) . . . . . . . . . . . . . . . . . . . . . . . 1626.16. Diseño factorial 2k . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

    6.16.1. Generalización del diseño 2k . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1656.17. Diseño factorial 3k . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1656.18. Análisis de covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

    6.18.1. Análisis de la Covarianza Unifactorial . . . . . . . . . . . . . . . . . . . . . . . 1676.19. Métodos alternativos para determinar efectos y significación de los factores . . . . . . 169

    6.19.1. Método de Yates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1696.19.2. Gráfico en papel logaŕıtmico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1706.19.3. Análisis de medias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

    6.20. Técnicas para abaratar costos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

    6.20.1. Técnicas de confusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1716.20.2. Diseños Fraccionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

    6.21. Método de Taguchi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1726.22. Métodos y diseño de superficie de respuesta (MSR) . . . . . . . . . . . . . . . . . . . . 1736.23. Método de la máxima pendiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

    6.23.1. Algoritmo del camino de la Máxima Pendiente . . . . . . . . . . . . . . . . . . 1746.24. Tabla de Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1756.25. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

    7. Series Cronoĺogicas 1787.1. Procesos Estocásticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

    7.2. Técnicas de suavizamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1827.2.1. Medias Móviles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1827.2.2. Alisado Exponencial Simple (AES) . . . . . . . . . . . . . . . . . . . . . . . . . 1827.2.3. Alisado Exponencial Doble (AED) . . . . . . . . . . . . . . . . . . . . . . . . . 1827.2.4. Alisado Exponencial Doble de Holt-Winter . . . . . . . . . . . . . . . . . . . . 1837.2.5. Intervalo de confianza para ŷt   en el AES y AED . . . . . . . . . . . . . . . . . 183

    7.3. Enfoques en análisis de series de tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . 1837.3.1. Enfoque Clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1837.3.2. Enfoque Box-Jenkins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1867.3.3. Análisis Espectral o enfoque Ingenieril . . . . . . . . . . . . . . . . . . . . . . . 195

    7.4. Otros enfoques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197

    7.4.1. Modelos Heteroscedasticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1977.4.2. Análisis Bayesiano de una Serie de Tiempo . . . . . . . . . . . . . . . . . . . . 1987.5. Tabla de Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

    7.5.1. Enfoque Box-Jenkins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2007.5.2. Estimación de parámetros modelos Box-Jenkins . . . . . . . . . . . . . . . . . . 201

    7.6. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202

    8. Simulación Estad́ıstica 2048.1. Generación de números Pseudos-Aleatorios . . . . . . . . . . . . . . . . . . . . . . . . 204

    5

  • 8/18/2019 Manual Estadistico (1).pdf

    7/276

    8.2. Generación de variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2068.3. Integrales mediante números aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . 2108.4. El proceso de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211

    8.4.1. Teoŕıa de Colas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2138.4.2. Métodos de Monte Carlo con Cadenas de Markov . . . . . . . . . . . . . . . . . 216

    8.5. Tabla de Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220

    8.6. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

    Comentario Final 223

    Aplicaciones 22510.1. No Paramétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22510.2. Técnicas de Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22810.3. Simulación Estad́ıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23310.4. Series Cronológicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23810.5. Modelos Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24110.6. Diseño de Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24510.7. Técnicas Multivariadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24710.8. Diseño y Análisis de Encuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250

    Anexo 25611.1. TABLA A. Distribución Chi-Cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . 25611.2. TABLA B. Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25711.3. TABLA C. Distribución T-Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25811.4. TABLA D. Prueba U de Mann-Whitney . . . . . . . . . . . . . . . . . . . . . . . . . . 25911.5. TABLA E. Distribución Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26011.6. TABLA F. Wald-Wolfowitz de valores cŕıticos para prueba de rachas . . . . . . . . . . 26611.7. TABLA G. Signos rankeados de Wilcoxon . . . . . . . . . . . . . . . . . . . . . . . . . 26711.8. TABLA H. Para diferencias de Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . . 269

    11.9. TABLA I. Para dos muestras de Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . 26911.10.TABLA J. Para dos muestras de Kolmogorov-Smirnov (Bidireccional) . . . . . . . . . 27011.11.TABLA K. Friedman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27111.12.TABLA L. Kruskal-Wallis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27211.13.TABLA M. Coeficiente de correlación de Spearman . . . . . . . . . . . . . . . . . . . . 27311.14.TABLA N. Coeficiente de correlación de Kendall . . . . . . . . . . . . . . . . . . . . . 27311.15.TABLA O. Coeficiente de concordancia de Kendall . . . . . . . . . . . . . . . . . . . . 27411.16.TABLA P. Coeficientes de Shapiro-Wilk . . . . . . . . . . . . . . . . . . . . . . . . . . 27411.17.TABLA Q. Valores cŕıticos de Shapiro-Wilk . . . . . . . . . . . . . . . . . . . . . . . . 275

    6

  • 8/18/2019 Manual Estadistico (1).pdf

    8/276

    Introducción

    La estad́ıstica es una disciplina que se entiende como una forma de pensamientos para la re-solución de problemas cotidianos o cient́ıficos, proporciona instrumentos para la toma de decisionescuando prevalecen condiciones de riesgo e incertidumbre.

    En nuestros d́ıas ésta se ha convertido en un método efectivo para describir con exactitudlos valores de datos económicos, poĺıticos, sociales, psicológicos, biológicos, f́ısicos, entre otras, y sir-

    ve como herramienta para relacionar y analizar dichos datos. Respecto a esto se comprende que laestad́ıstica abarca una gran cantidad de actividades, lo que desprende una cantidad extensa de temáti-cas importantes en todas las áreas de la investigación, las cuales dependen de la situación a la que seenfrenta y de los conceptos asociada a ésta.

    El presente manual tiene como objetivo dar a conocer ĺıneas del conocimiento estad́ıstico im-portantes para el desarrollo de la recolección, calificación y análisis de datos, para ası́ hacer inferenciascientı́ficas sobre éstos, además se darán a entender relaciones que existen entre las temáticas a abordarpara complementar en el desarrollo de cada una de estas.

    Las áreas que se presentaŕan siguen una estructura la que se inicia con la disciplina de  Dise˜ noy an´ alisis de encuestas , Caṕıtulo 1, ésta temática engloba la metodoloǵıa a seguir de un investigadorrespecto a un estudio, la cual en su metodoloǵıa generaliza el uso de las otras temáticas a analizar,posteriormente se aborda en la Estadı́stica no paramétrica , Capı́tulo 2, en el cual una vez profundizadola temática anterior, se presenta esta disciplina la que puede ser utilizada para contrastar dócimas sinprevia información de la población, es muy importante para cualquier tipo de área que se aborde enesta linea de conocimientos estadı́sticos, y respecto a lo expuesto en el capitulo 1, es importante en elmomento de validar las hipótesis. Ya explicado esto se interiorizará el conocimiento con las   Técnicas de muestreo, Capı́tulo 3, una vez desarrollado los temas anteriores se puede deducir una necesidad seanalizar poblaciones a trav́es de un grupo reducido de estas, sea por costo, tiempo o actualización deinformación, en esta disciplina se enseñarán diferentes técnicas para aśı tener una representación de

    una muestra respecto a la población. Estas técnicas son fundamentales para los estudios en diseño yanálisis de encuestas (como el ver en que poblaci ón se basará el estudio), también se pueden utilizardócimas de Estad́ıstica no paramétrica para comprobar aleatoriedad o comportamientos de la pobla-ción. En general, es un piso fundamental para llevar acabo estudios sobre una poblaci ón. ede ahorrarcostos y alcanzar una mayor cantidad de análisis.

    Siguiendo la ĺınea del conocimiento estad́ıstico, se ahondará en los   Métodos multivariante s,Caṕıtulo 4, los cuales son herramientas de la estad́ıstica que tienen como por objetivo reducir dimen-

    7

  • 8/18/2019 Manual Estadistico (1).pdf

    9/276

    sionalidad, calificar, discriminar y agrupar observaciones, en lo cual estos pueden utilizar técnicas demuestreo u ocupar dócimas de estad́ıstica no paramétrica. Son de gran importancia para hacer estudioscon los objetivos propuestos, como en el caso hacer un estudio de asignaci ón de un crédito bancario,aglomerar grupos de individuos para luego hacer inferencias sobre estas, entre otras, como el análisisde varianza o anova, la cual se relaciona de forma directa con el capitulo de modelos lineales y diseñode experimentos en donde se explicará su relación de interés con las temáticas expuestas. De esto se

    puede desprender los   Modelos lineales , Caṕıtulo 5, la que es una herramienta estad́ıstica para poderestudiar el comportamiento de una variable dependiente a través de variables independientes, con estose puede formular un modelo de regresión lineal el cuál se trabaja bajo ciertos supuestos, los cuales sicumplen pueden un modelo eficiente en relación a una investigación. En esta temática se profundiza elcomo funcionan y se relaciona con lo métodos multivariantes para los análisis de anova, ya que estosson base para entenderlos. Un investigador puede utilizar esta herramienta para poder encontrar unmodelo en el cuál las variables o tratamientos que se definan expliquen una variable de interés. Estosdan un entendimiento base para  Dise˜ no de experimentos , Caṕıtulo 6, en esta temática se aborda delleno los diferentes diseños experimentales que un investigador puede definir para poder analizarlos yver si influyen en su variable respuesta, es esencial entender la base del capitulo de modelos lineales,ya que estos se relacionan en gran importancia con los supuestos y desarrollos de los distintos diseños

    experimentales.

    Una rama distinta a las demás es  Series cronol´ ogicas , Caṕıtulo 7, en la cual esta disciplina dela estadı́stica se preocupa de estudiar observaciones medidas en un instante de tiempo, la cual formulaun modelo que se puede ajustar a estos datos de forma tal que se pueda predecir o retropredecirvalores a lo largo del tiempo. Estos pueden ser comparados con los modelos de regresión lineal con lasalvedad de que estos modelos son más estáticos con respecto a la series de tiempo. Es importante queen modelos lineales, análisis de anova, diseños de experimentos y series cronológicas, pueden ocupardócimas de estad́ıstica no paramétrica para ver como se comportan sus residuos o como distribuyen,para aśı ver si cumplen o no con los supuestos. También se hace un alcance en que las series cro-nológicas pueden ser ocupadas para analizar los residuos en modelos lineales. Es una herramienta

    importante para un investigador que este llevando a acabo un estudio a través del tiempo. Por último,se dará término a esta ĺınea del conocimiento estadı́stico con   Simulaci´ on Estadı́stica , Caṕıtulo 8, laque se puede relacionar con cualquiera de los ya expuestos, ya que la simulaci ón estadı́stica es unmétodo que diseña algún modelo o cálculo de un sistema real y obtener resultados a trav́es de esteen unión con el software que se ocupe. Esta puede ser una herramienta provechosa para el investi-gador con respecto a su estudio, ya que puede ahorrar costos y alcanzar una mayor cantidad de análisis.

    Las ramas se profundizarán en el desarrollo de cada capı́tulo de forma que no se dificulte elaprendizaje para llevarlas a la práctica.

    8

  • 8/18/2019 Manual Estadistico (1).pdf

    10/276

    Caṕıtulo 1

    Diseño y análisis de encuesta

    El diseño y análisis de encuesta entrega una pauta de los pasos a seguir en una investigaci ón,desde la creación de una idea, hasta la elaboración de un instrumento que sea lo suficientemente con-fiable para poder entregar una respuesta satisfactoria a cierto problema de interés.

    El análisis de encuesta consiste en tratar de explicar tanto los enfoques experimentales comolos no experimentales, el cuantitativo y el cualitativo, abarcar desde la concepci ón de la idea de lainvestigación y el desarrollo del marco teórico hasta la formulación de hipótesis, la elección del diseñode investigación, la elaboración del instrumento de recolección de datos y del reporte de investigación.

    1.1. Investigación

    Las investigaciones se originan en ideas las cuales pueden provenir de distintas fuentes y la

    calidad de dichas ideas no está necesariamente relacionadas con la fuente de donde provengan. Fre-cuentemente las ideas son vagas y deben ser traducidas en problemas más concretos de investigación,para lo cual se requiere una revisión bibliográfica de la idea. Las buenas ideas deben alentar al inves-tigador, ser novedosas y servir para la elaboración de teorı́as y la resolución de problemas.

    1.2. Planteamiento del problema

    El planteamiento del problema es afinar y estructurar la idea de investigación, desarrollandotres elementos:

    a) Objetivos de la investigación.

    b) Preguntas de la investigación.

    c) Justificacíon de esta.

    Los tres elementos deben ser capaces de guiar a una investigación concreta y con posibilidad de pruebaempı́rica.

    9

  • 8/18/2019 Manual Estadistico (1).pdf

    11/276

    Los objetivos y preguntas de investigación deben ser congruentes entre śı e ir en la mismadirección. Los objetivos establecen que pretende la investigación y las preguntas nos dicen qué res-puestas deben encontrarse mediante la investigación.

    Finalmente, la justificación nos indica por qué debe hacerse la investigación.

    Los criterios principales para evaluar el valor potencial de una investigaci ón son: conveniencia,relevancia social, implicaciones prácticas, valor teórico y utilidad metodológica. Además debe anali-zarse la viabilidad de la investigación y sus posibles consecuencias.

    El planteamiento de un problema de investigación cient́ıfico no puede incluir juicios morales oestéticos. Pero debe cuestionarse si es o no ético llevarlo a cabo.

    1.3. Evaluación del marco teórico

    Cuando se tiene planteado el problema de estudio, es decir ya contamos con los objetivos ypreguntas de la investigación, y además se ha evaluado su relevancia y factibilidad, el siguiente pasoconsiste en sustentar el marco teórico del estudio.

    El marco teórico se integra con las teoŕıas, enfoques teórico, estudios y antecedentes generalesque se refieren al problema de investigación. Para elaborar el marco teórico es necesario detectar,obtener y consultar la literatura y otros documentos pertinentes para el problema de investigación,aśı como extraer y recopilar de ello la información de interés. La revisión de la literatura puede ini-ciarse manualmente o acudiendo a un banco de datos al que se tiene acceso por computaci ón.

    La construcción del marco teórico depende de lo que se encuentre en la revisión de la literatura:

    a) Que existe una teoŕıa completamente desarrollada que se aplica al problema de investigación.

    b) Que hay varias teorı́as que se aplican en el problema de investigación.

    c) Que hay generalizaciones emṕıricas que se aplican a dicho problema.

    d) Que solamente existen gúıas no estudiadas e ideas vagamente relacionadas con el problema deinvestigación.

    En cada caso vaŕıa la estrategia para construir el marco teórico.

    El marco teórico cumple diversas funciones dentro de una investigación, entre las cuales des-tacan las siguientes:

    1. Ayuda a prevenir errores que se han cometido en otros estudios.

    2. Orienta sobre cómo habrá de llevarse a cabo el estudio. En efecto, al acudir a los antecedentes,se puede dar cuenta de cómo ha sido tratado un problema espećıfico de investigación.

    3. Ampĺıa el horizonte del estudio y gúıa al investigador para que éste se centre en su problemaevitando desviaciones del planteamiento original.

    10

  • 8/18/2019 Manual Estadistico (1).pdf

    12/276

    4. Conduce al establecimiento de hipótesis o afirmaciones que más tarde habrán de someterse aprueba en la realidad.

    5. Inspira nuevas ĺıneas y áreas de investigación.

    6. Provee de un marco de referencia para interpretar los resultados del estudio.

    Con el propósito de evaluar la teoŕıa de nuestro marco teórico podemos aplicar cinco criterios:

    a) Capacidad de descripción, explicación y predicción.

    b) Consistencia lógica.

    c) Perspectiva.

    d) Fructificación.

    e) Parsimonia.

    El marco teórico orientará el rumbo de las etapas subsecuentes del proceso de investigación.

    1.4. Definición del tipo de investigación a realizarUna vez que se ha efectuado la revisión de la literatura y se afinó el planteamiento del pro-

    blema, se debe pensar qué alcance tendrá la investigación: exploratorio, descriptivo, correlacional oexplicativo. Es decir, ¿hasta dónde (en términos de conocimiento) es posible que llegue el estudio?

    Ningún tipo de estudio es superior a los demás, todos son significativos y valiosos. La diferenciapara elegir uno u otro tipo de investigación reside en el grado de conocimiento respecto al tema quese va a estudiar y los objetivos.

    Los estudios exploratorios tienen por objeto esencial examinar un tópico desconocido o pocoestudiado. Esta clase de investigaciones sirven para desarrollar métodos a utilizar en estudios másprofundos.

    Los estudios descriptivos sirven para analizar cómo es y se manifiesta un fenómeno y sus com-ponentes (e.g. cuántas personas ven un programa de televisión y por qué lo ven).

    Los estudios correlacionales pretenden ver cómo se relacionan o vinculan diversos fenómenosentre sı́.

    Los estudios explicativos buscan encontrar las razones o causas que provocan ciertos fen ómenos.

    Una misma investigación puede abarcar fines exploratorios, en su inicio y terminar siendodescriptiva, correlacional y hasta explicativa; todo según los objetivos del investigador.

    11

  • 8/18/2019 Manual Estadistico (1).pdf

    13/276

    1.5. Hipótesis

    Las hipótesis son proposiciones tentativas acerca de la relación entre dos o más variables yse apoyan en conocimientos organizados y sistemáticos. Las hipótesis contienen variables, estas sonpropiedades cuya variación pueden ser medidas.

    Las hipótesis surgen normalmente del planteamiento del problema y la revisión de la literatura,y algunas veces de teorı́as. Las hipótesis deben referirse a una situación real. Las variables contenidastienen que ser precisas, concretas y poder observarse en la realidad, la relación entre las variables debeser clara, verośımil y medible. Asimismo, las hipótesis deben estar vinculadas con técnicas disponiblespara probarlas.

    Las hipótesis se clasifican en:

    a) Hipótesis de investigación.

    b) Hipótesis nulas.

    c) Hipótesis alternativas.

    A su vez, las hipótesis de investigación se clasifican de la siguiente manera:

    1. Hipótesis descriptivas del valor de variables que se van a observar en un contexto.

    2.

    12

  • 8/18/2019 Manual Estadistico (1).pdf

    14/276

    3.

    4.

    Puesto que las hipótesis nulas y las alternativas se derivan a las hipótesis de investigación, pueden

    clasificarse del mismo modo pero con los elementos que las caracterizan.

    Las hipótesis estadı́sticas se clasifican en:

    a) Hipótesis estadı́sticas de estimación.

    b) Hipótesis estadı́sticas de correlación.

    c) Hipótesis estadı́sticas de las diferencias de los grupos.

    13

  • 8/18/2019 Manual Estadistico (1).pdf

    15/276

    En una investigación puede formularse una o varias hipótesis de distintos tipos. Las hipótesis se con-trastan contra la realidad para aceptarse o rechazarse en un contexto determinado.

    La formulación de hipótesis va acompañada de las definiciones conceptuales y operacionales delas variables contenidas dentro de las hipt́esis.

    Hay investigaciones que no pueden formular hipótesis por que el fenómeno a estudiar es des-conocido o se carece de la información para establecerlas (pero ello solo ocurre en los estudios explo-ratorios y algunos estudios descriptivos).

    1.6. Diseño experimental de investigación

    Una vez que se ha definido el tipo de estudio a realizar y se han definido las hip ótesis de inves-tigación, el investigador debe concebir una manera práctica y concreta para responder a las preguntasde investigación, esto implica seleccionar un tipo de diseño y aplicarlo al tipo de estudio.

    En su aceptación más general, un experimento consiste en aplicar un est́ımulo a un individuo ogrupo de individuos y ver el efecto de este est́ımulo en alguna(s) variable(s). Los experimentos se reali-zan en condiciones de mayor o menor control. El máximo se alcanza en los “experimentos verdaderos”.

    Deducimos que un estı́mulo afecta cuando observamos diferencias (en las variables que supues-tamente serian afectadas), entre un grupo al que se le administro dicho est́ımulo y el grupo al que nose le administro, siendo ambos iguales en todo excepto en esto último.

    Para lograr el control o la validez interna de los grupos se le administro los est́ımulos y a otro

    no. A veces graduamos la cantidad del estı́mulo que se administra, es decir, a distintos grupos (seme- jantes) les administramos diferentes grados del est́ımulo para observar si provocan efectos distintos.

    La asignación de azar es (normalmente), el método preferible para lograr que los grupos delexperimento sean comparables (semejantes).

    Existen diversos factores o fuentes que pueden hacer que nos confundamos y ya no sepamos sila presencia de una variable independiente o tratamiento experimental tiene o no un verdadero efecto,se trata de explicaciones rivales a las explicación de que la(s) variable independiente(s) afecta o no ala(s) variable(s) dependiente (s).

    A estas explicaciones rivales se les conoce como fuentes de invalidación interna, por que atentancontra la validez interna de un experimento. La validez tiene que ver con la calidad del experimento yse logra cuando hay control, cuando los grupos difieren entre sı́ solamente en la exposición a la variableindependiente.

    14

  • 8/18/2019 Manual Estadistico (1).pdf

    16/276

    Hay nueve fuentes de invalidación interna:

    1. Historia: Son antecedentes que ocurren durante el desarrollo del experimento que afectan a lavariable dependiente y pueden confundir los resultados experimentales.

    2. Maduración: Son procesos internos de los participantes que opera como consecuencia del tiempoy que afectan los resultados del experimento, como el cansancio, hambre, aburrición, aumento

    de edad.3. Inestabilidad: Poca o nula confiabilidad de las mediciones, fluctuaciones en las personas selec-

    cionadas o componentes del experimento, o inestabilidad autonorma de mediciones repetidasaparentemente “equivalentes”.

    4. Administración de pruebas: Se refiere al efecto que puede tener la aplicación de una prueba sobrelas puntuaciones de pruebas subconsecuentes.

    5. Instrumentación: Esta fuente hace referencia a cambios en los instrumentos de medición o en losobservadores participantes que pueden producir variaciones en los resultados que se obtengan.

    6. Regresión estadı́stica: Esta fuente se refiere a un efecto provocado por una tendencia de sujetosseleccionados sobre la base de puntuaciones extrema.

    7. Selección: Esta puede presentarse como resultado de elegir a los sujetos para los grupos delexperimento, de tal manera que los grupos no sean equiparables, es decir si no se seleccionanlos sujetos para los grupos asegurándose la equivalencia de éstos, la selección puede resultartendenciosa.

    8. Mortalidad: Esta fuente se refiere a diferencias en la pérdida de participantes entre los gruposque se comparan.

    9. Interaccíon entre selección y maduración: Se trata de un efecto de maduraci ón que no es igualen los grupos del experimento, debido a algún factor de selección.

    Los diseños experimentales se pueden clasificar en:

    a) Puros.

    b) Pre-experimental.

    c) Cuasi-experimental.

    Los experimentos puros son aquellos que manipulan las variables independientes para ver sus efectossobre variables dependientes, la variable independiente es la que se considera como supuesta causa enuna relación entre variables, es la condición antecedente, y al efecto provocado por dicha causa se ledenomina variable dependiente (consecuente), el investigador hace variar la variable independientes,es decir, da distintos valores a esta variable para posteriormente analizar cómo cambia la variabledependiente.

    Los estudios pre-experimentales se llaman aśı, porque su grado de control es mı́nimo, consisteen administrar un est́ımulo o tratamiento a un grupo, y después aplicar una medición en una o másvariables para observar cual es el nivel del grupo en estas variables.

    Los diseños cuasi-experimental también manipulan deliberadamente al menos una variable in-dependiente para ver su efecto y relación con una o más variables dependientes, solamente que difierende los diseños puros en el grado de seguridad o confiabilidad que pueda tenerse sobre la equivalencia

    15

  • 8/18/2019 Manual Estadistico (1).pdf

    17/276

    inicial de los grupos, en estos diseños los sujetos no son asignados al azar a los grupos ni emparejados,sino que dichos grupos ya estaban formados antes del experimento, son grupos intactos (la razón porla que surgen y la manera como se forman fueron independientes o aparte del experimento).

    Los experimentos que hacen equivalentes a los grupos y que se mantienen en esta equivalen-cia durante el desarrollo de aquéllos, controlan las fuentes de invalidación interna. Lograr la validez

    interna es el objetivo metodológico y principal en todo experimento. Una vez que se consigue es idealalcanzar validez externa (posibilidad de generalizar los resultados de la población, otros experimentosy situaciones no experimentales).

    Hay dos contextos en donde pueden realizarse los experimentos: el laboratorio, y el campo.

    En los cuasiexperimentos alcanzar validez interna en medida en que se demuestran la equiva-lencia inicial de los grupos participantes y la equivalencia en el proceso de experimentación.

    Los experimentos “verdaderos” constituyen estudios explicativos, los pre-experimentos bási-camente son estudios exploratorios y descriptivos; los cuasiexperimentales son (fundamentalmente),correlaciones aunque pueden llegar a ser explicativos.

    1.7. Investigación no experimental

    La investigación no experimental es la que se realiza sin manipular deliberadamente las varia-bles independientes, se basa en variables que ya ocurrieron o se dieron en la realidad sin la intervencióndirecta del investigador. Es un enfoque retrospectivo.

    Es conocida también como investigación expost-efecto (los hechos y variables ya ocurrieron) yobserva variables y relaciones entre éstas en su contexto natural.

    16

  • 8/18/2019 Manual Estadistico (1).pdf

    18/276

    Los diseños no experimentales se dividen de la siguiente manera:

    Los diseños transeccionales realizan observaciones en un momento único en el tiempo. Cuando midenvariables de manera individual y reportan esas mediciones son descriptivos. Cuando describen rela-ciones entre variables son correlacionales y si establecen procesos de causalidad entre variables soncorrelacionales/ causales.

    Los diseños longitudinales realizan observaciones en dos o más momentos o puntos en el tiem-po. Si estudian a una población son diseños de tendencia, si analizan a una subpoblación o grupoespećıfico son diseños de análisis evolutivo de grupo y si estudian a los mismos sujetos son dise ños depanel.

    La investigación no experimental posee un control menos riguroso que la experimental y enaquella es más complicado inferir relaciones causales. Pero la investigación no experimental es másnatural y cercana a la realidad cotidiana.

    El tipo de diseño a elegir se encuentra condicionado por el problema a investigar, el contextoque rodea a la investigación, el tipo de estudio a efectuar y las hip ótesis formuladas.

    1.8. Redacción y análisis de ı́tems

    Ahora bien siguiendo con los conceptos que conllevan a una investigación, para la mediciónde caracteŕısticas f́ısicas (por ejemplo, el peso, la altura, etc.), existen, instrumentos tangibles parapoder medirlas, en el caso de caracteŕısticas psicológicas (nivel de atención, postura hacia el consumode drogas, etc.) no existen instrumentos de medición que entreguen resultados de forma precisa, di-chas caracteŕısticas representan constructos que se deben medir mediante instrumentos diseñados demanera espećıfica, dichos instrumentos son los test, cuestionarios o inventarios. Por el contrario a losinstrumentos que miden longitud, que entregan una medida precisa, la bondad de un test no se puedepresuponer, mas bien siempre se está mejorando.

    17

  • 8/18/2019 Manual Estadistico (1).pdf

    19/276

    Un cuestionario estará formado por una serie de elementos o ı́tems a los que cada individuoque se somete a la prueba deberá responder. Luego de cuantificar las respuestas de cada individuo, seasignan puntuaciones a esa persona con respecto al constructo o atributo que se pretende medir. Unapuntuación indica el grado de asociación de la persona con el atributo.

    1.8.1. Definición de constructo

    Como primer paso, es necesario dar una definición operacional del constructo o rasgo que sequiere medir, que es un concepto, pero que tiene un sentido adicional, el cual fue inventado o adoptadode una manera deliberada y consciente para un propósito en especial.

    1.8.2. Construcción provisional del cuestionario

    De lo anterior debemos ser capaces de establecer un conjunto de ı́tems que representen lasconductas mediante las que se manifiestan los componentes del constructo.

    En relación a la construcción de los ı́tems existen dos temas a tener en cuenta:  El formatode respuesta y las normas de redacción de los ı́tems.

    1.8.3. Formato de respuesta

    En los test de rendimiento óptimo (pruebas de rendimiento, inteligencia) se desea medir elrendimiento máximo de cada persona ante una serie de preguntas. Usualmente, el formato de respuestade estos ı́tems se ajusta a uno de los siguientes formatos:

    a) Eleccíon Binaria: De dos alternativas, se elige la correcta (Verdadero o Falso).

    b) Eleccíon Múltiple: Entre más de dos alternativas se elige la correcta. Este formato es el másutilizado por la objetividad.

    c) Emparejamiento: Se basa en encontrar parejas entre dos conjuntos de conceptos.

    A trav́es de las pruebas de rendimiento t́ıpico se desea reflejar el comportamiento ordinario de laspersonas. El objetivo de esta evaluación es tomar alguna opinión, actitud o rasgo de personalidad. Elformato de respuesta de estas pruebas se ajusta a alguno de los siguientes:

    a) Opción Binaria: La persona manifiesta si está de acuerdo o en desacuerdo con alguna afirmacíon.

    b) Categoŕıas Ordenadas: Acá se establecen más de dos opciones, en donde la persona es capazde matizar su respuesta. Por lo general, estas categoŕıas se ordenan desde: “Muy de Acuerdo”,hasta “Muy en Desacuerdo”, pasando por opciones intermedias, con una categorı́a al centro que

    indica neutralidad con respecto al tema.

    c) Adjetivos Bipolares: Tambíen conocido como “diferencial semántico”, se caracteriza por estarformado por pares de adjetivos opuestos.

    18

  • 8/18/2019 Manual Estadistico (1).pdf

    20/276

    1.8.4. Redaccíon de ı́tems

    Algunas recomendaciones para la redacción de ı́tems en pruebas de rendimiento óptimo son:

    La idea principal del ı́tem debe estar en el enunciado.

    Evitar conocimientos excesivamente triviales o excesivamente rebuscados.

    No encadenar unos ı́tems con otros.

    Anticipar la dificultad e incluir preguntas de todo rango de dificultad (casi siempre conviene máspreguntas de dificultad media).

    Evitar el uso de negaciones, y en caso de incluirlas, subrayarlas, evitar también errores grama-ticales y ortográficos.

    Si la prueba es corta, se necesitaŕıa mayor cantidad de opciones “distractoras”, mientras que si laprueba es más larga, con dos distractores es suficiente.

    Además se deben evitar las opciones del tipo “todas las anteriores son correctas” o “ninguna

    de las anteriores es correcta”, aśı también se debe balancear la posición de la opción correcta, paraque no se sitúe siempre en la misma opción.

    Tambíen se debe tener en cuenta la dificultad para crear las alternativas incorrectas, dondeestas no deben ser absurdas ni que se puedan eliminar con cierto grado de sentido com ún. El estable-cimiento de alternativas múltiples exige un conocimiento claro de lo que se desea evaluar como de laspersonas a las que va dirigida la prueba.

    En relación a las pruebas de rendimiento t́ıpico se propone lo siguiente:

    Deben ser relevantes.

    Contenido claro, evitando generalidad.

    Se debe minimizar la posibilidad de deseabilidad social (responder pensando en lo que dirán losdemás).

    1.8.5. Cuantificacíon de las respuestas

    Luego de establecer el formato de respuesta más adecuado, es preciso decidir cómo se puedencuantificar los posibles resultados. En general, para los ı́tems de rendimiento óptimo se asigna 1 si esacierto y 0 si es error, aśı el puntaje directo será el número de ı́tems que el sujeto acierte.

    Por otro lado, las pruebas de rendimiento t́ıpico requieren cuantificar las posibles respuestastomando en cuenta que la alternativa con mayor valor indique mayor nivel de rasgo u opinión.

    Por ejemplo, si es una categoŕıa con opción binaria se puede cuantificar con 1 el acuerdoy 2 el desacuerdo o viceversa. Mientras que si el formato es de “n” categoŕıas ordenadas, éstas secuantificaran desde 1 hasta n, tomando en cuenta la dirección de la afirmación.

    19

  • 8/18/2019 Manual Estadistico (1).pdf

    21/276

    1.8.6. Análisis de ı́tems

    Los ı́tems se han formulado para que midan el constructo, o rasgo que se desea evaluar. Luegoel grado en que cada ı́tem es “bueno” es algo que se puede comprobar estadı́sticamente si se definenciertos indicadores, el ı́ndice de dificultad, el ı́ndice de homogeneidad y el ı́ndice de validez.

    Para esto, luego de aplicar la prueba a una muestra de sujetos y cuantificadas las respuestas,se forma una matriz de datos.

    ÍtemsSujeto 1 2   . . . j . . . n   X

    1   a11   a12   . . . a1 j   . . . a1n...i ai1   ai2   . . . aij   . . . ain...N aN 1   aN 2   . . . aNj   . . . aNa

    Donde  aij   indica el valor de la respuesta del sujeto  i  en el ı́tem  j. Luego al sumar por filas se puedeobtener las puntuaciones directas (X) de los sujetos en el total del test.

    1.8.6.1.   Índice de dificultad

    Sirve para cuantificar el grado de dificultad de cada ı́tem, por lo que solo tiene sentido en lostest de rendimiento óptimo.

    Este ı́ndice para un ı́tem  j  es el siguiente:

    D j  =  A jN  j

    =  Número de personas que acertaron el ı́tem  j 

    Total de personas que lo trataron de resolver

    La interpretación de este ı́ndice es que mientras más cercano a cero, más dif́ıcil resulto este ı́tem,mientras que cuando es más cercano a 1 este ı́tem resultó más fácil.

    1.8.6.2.   Índice de homogeneidad

    Llamado también ı́ndice de discriminación de un ı́tem, se define como la correlación de Pearsonentre las puntuaciones de los  N   sujetos en el ı́tem  j  con las puntuaciones (X).

    H  j  = r jX 

    Este ı́ndice mide el grado en que el ı́tem  j  está midiendo lo mismo que la prueba. Los ı́tems con bajoH  j  indican que están midiendo algo diferente que la prueba en conjunto.

    Si un test tiene poca cantidad de ı́tems, resulta más apropiado ocupar el ı́ndice de homogeneidadcorregido r j(X − j), este ı́ndice se calcula como la correlación de los puntajes del ı́tem con la puntuacióntotal del test luego de restarle el total de las puntuaciones del ı́tem que se quiere obtener.

    20

  • 8/18/2019 Manual Estadistico (1).pdf

    22/276

    1.8.6.3.   Índice de Validez

    Se puede también correlacionar los puntajes de un ı́tem  j  con lo que obtengan los  N   sujetosbajo un criterio de validación externa al test (Y), luego se define el ı́ndice de validez como:

    V  j  = r jY 

    (Y), en este caso es una medida diferente para reflejar el mismo rasgo, por lo que si el test est á mi-diendo lo que se desea, este ı́ndice será alto.

    Los ı́tems que tengan un  V  j  cercano a cero, es conveniente sacarlos de la prueba, ya que noestán aportando a medir el rasgo que se pretende medir.

    1.8.7. Análisis de opciones incorrectas de respuesta

    Muy en relación con el análisis de ı́tems, se encuentra el tema del estudio de los patronesde respuesta, que se han dado a las diferentes alternativas de cada ı́tem. Para un ı́tem concreto de

    una prueba de rendimiento óptimo, lo ideal es que la alternativa seleccionada en mayor medida seala correcta; cada una de las alternativas incorrectas del ı́tem debe también ser seleccionada por unnúmero de personas que, aun siendo inferior al que selecciona la alternativa correcta, ratifique comoadecuadas (como bien planteadas) dichas alternativas incorrectas.

    1.8.8. Corrección de los efectos del azar

    En los test de opción múltiple, donde se debe seleccionar una sola alternativa, se puede sobre-estimar el puntaje de una persona por el hecho que ésta conteste algunas preguntas al azar, entoncesse necesita establecer un procedimiento para descontar los aciertos producidos por el azar  Aa.

    Luego, se puede estimar el número de aciertos al azar, el cual está determinado por:

    Aa =  1

    nE 

    Donde E corresponde a la cantidad de ı́tems erróneos.

    1.9. Modelo clásico y concepto de fiabilidad

    En el área de la psicoloǵıa, no es posible medir aptitudes, actitudes, etc., por lo cual se cons-

    truyen test para poder entregar alguna medición del comportamiento de cierta persona.

    Como se vio anteriormente, los resultados de los test se pueden cuantificar, obteniéndose unpuntaje para cada persona (X). Pero la duda que surge es que si dicho puntaje puede medir efectiva-mente el rasgo, por esto, la teoŕıa clásica de los test propone un modelo formal, llamado modelo linealclásico, el cual, bajo ciertos supuestos es capaz de determinar el grado en que un test informa sobrecierto rasgo.

    21

  • 8/18/2019 Manual Estadistico (1).pdf

    23/276

    Supuestos

    El modelo de puntuación verdadera se basa en un primer supuesto:

    a)   X  = V   + E   donde  V  es el puntaje verdadero de la persona y  E  es un error de medición.

    b)   V   = E (X ) es decir, el puntaje verdadero es igual al valor esperado de las puntuaciones emṕıricas.

    c)   ρV E  = 0 es decir, la correlación entre el puntaje verdadero y el error de medición es nula.

    d)   ρE jE k  = 0 es decir, que si se conocen los errores de medición en un sujeto para dos test distintos,no existe correlación entre ellos.

    e)   ρE jV k   = 0 es decir, que el error de medición en un test no está correlacionado con el puntajeverdadero en otro test para un individuo.

    1.9.1. Fiabilidad del test

    Se entiende por fiabilidad el grado de estabilidad, precisión o consistencia que manifiesta el

    test como instrumento de medición de un rasgo determinado.

    Tradicionalmente, la fiabilidad de un test puede entenderse de tres maneras diferentes:

    1. Aludiendo a la estabilidad temporal de las medidas que proporciona.

    2. Haciendo referencia al grado en que diferentes partes del test miden un rasgo de manera consis-tente.

    3. Enfatizando el grado de equivalencia entre dos formas paralelas.

    1.9.2. Formas paralelas de un test

    Según el modelo clásico, las formas paralelas de un test se definen con las siguientes condiciones:

    a) Un individuo tiene los mismos puntajes verdaderos en ambas formas.

    b) La varianza de los errores de medición es la misma en ambas formas.

    Pero, en la práctica no se conocen los valores de los puntajes verdaderos, solamente conocemos lospuntajes emṕıricos. Se puede constatar que para que dos formas sean paralelas, los puntajes mediosson los mismos, al igual que las varianzas. Al ocupar estad́ıstica inferencial, podemos determinar estomediante los siguientes test:

    a) Test para igualdad de medias.

    H 0 :  µ1 − µ2  = 0   v/s H  1 :  µ1 − µ2 = 0

    El estadı́stico es:

    T   =D̄

    √ N 

    S D∼ tN −1

    Donde  D̄  es el promedio de las diferencias y  S D  la desviación estándar de las diferencias.

    22

  • 8/18/2019 Manual Estadistico (1).pdf

    24/276

    b) Test para igualdad de varianzas.

    H 0  :  σ1 − σ2  = 0   v/s H  1 :  σ1 − σ2 = 0

    El estadı́stico es:

    T   =

     (S 21 −

    S 22)√ 

     −2

    2S 1S 2 1 − r212 ∼ tN −2Donde  r12 es la correlación de Pearson entre  X 1  y  X 2.

    1.9.3. Coeficiente de fiabilidad de formas paralelas

    Se define el coeficiente de fiabilidad como la correlación de los puntajes obtenidos de los sujetosde dos formas paralelas de un test. Es decir, si dos formas de un test pretenden medir un mismo rasgo,se espera una correlación alta entre ambos puntajes emṕıricos para una misma población.

    El coeficiente de correlación de Pearson para datos poblacionales está dado por la siguienteforma:

    ρ12 = ΣX 1X 2

    N σ1σ2=

      σ2vσ2X 

    Esto significa que el ı́ndice de fiabilidad es el cociente entre la variación de los puntajes verdaderos y lavariación de los puntajes emṕıricos. Dicho coeficiente asume valores entre 0 y 1, ya que las varianzasson siempre positivas.

    1.9.4. Coeficiente de fiabilidad de  n   formas paralelas

    Supongamos que se tienen  n  formas paralelas para medir un aspecto psicológico determinado.Por lo visto anteriormente, estas  n  formas tendrán la misma varianza empı́rica, al igual que las corre-laciones entre todas los posibles pares de formas.

    Se definen los parámetros de una forma paralela como σx, σv, σe, ρxx (varianzas de las puntua-ciones emṕıricas, verdaderas, error, respectivamente y por último el coeficiente de fiabilidad), entoncesal unir las  n  formas paralelas los parámetros serán  σnx,  σnv,  σne,  ρnxx, donde:

    a) La varianza emṕırica es:

    σnx =  nσ2x[1 + (n

    −1)ρxx]

    b) La varianza verdadera es:

    σnv  = n2σ2v

    c) La varianza error es:

    σne  =  nσ2e

    23

  • 8/18/2019 Manual Estadistico (1).pdf

    25/276

    d) El coeficiente de fiabilidad del test alargado es:

    ρnxx =  nρxx

    1 + (n − 1)ρxxEsta expresión se conoce como fórmula general de Spearman-Brown y permite obtener el ı́ndice defiabilidad de un test compuesto de  n   formas paralelas.

    1.9.5. Fiabilidad como correlacíon entre formas paralelas

    A veces, por razones de ı́ndole práctica o investigadora, se diseña un test y una segunda ver-sión del mismo, denominada forma paralela, que intenta evaluar o medir lo mismo que el test originalpero con diferentes ı́tems. Como ya hemos explicado, dos versiones o formas se consideran paralelas si,aplicadas a una misma muestra de personas, obtienen medias y varianzas probabilı́sticamente similares.

    La correlación de Pearson entre las puntuaciones obtenidas en una misma muestra en dosformas paralelas se considera el coeficiente de fiabilidad de cualquiera de ellas, e indicará el grado en

    que pueden considerarse equivalentes.

    1.9.6. Fiabilidad como estabilidad temporal (Test-retest)

    Si disponemos de las puntuaciones de   N   personas en un test y, despúes de transcurrido untiempo, volvemos a medir a las mismas personas en el mismo test, cabe suponer que siendo el test al-tamente fiable, deberı́amos obtener una correlación elevada entre ambas mediciones. Dicha correlaciónentre la evaluación test y la evaluación retest (rxx) se denomina   coeficiente de fiabilidad test-retest , eindicará tanta mayor estabilidad temporal de la prueba cuanto m ás cercano a uno sea.

    1.9.7. Método de dos mitades

    Este procedimiento consiste en dividir el test en dos mitades equivalentes (normalmente unacon los elementos pares y otra con los impares). Para cada sujeto se obtiene la puntuación directaen ambas mitades. Disponemos entonces de dos variables (P   e   I ), cuya correlación (rPI ) indica sugrado de relacíon. Para superar el problema de subestimación, y aśı obtener el coeficiente de fiabilidaddel test completo, debemos aplicar la fórmula de Spearman-Brown, considerando ahora que estamostrabajando con datos muestrales, y haciendo n  = 2 ya que el test completo tiene el doble de ı́tems quecualquiera de sus mitades:

    rxx  =  2rPI 

    1 + rPI 

    1.9.8. Coeficiente  α  de Cronbach

    Fue desarrollado por J.L. Cronbach y a diferencia de los métodos anteriores, requiere de sólouna aplicación del instrumento. Además no es necesario dividir los ı́tems del instrumento, ya que sóloes necesario aplicar la medición y calcular el coeficiente.

    24

  • 8/18/2019 Manual Estadistico (1).pdf

    26/276

    α =  k

    k − 1

    1 −

    ki=1 S 

    2i

    S 2t

    Donde,k: Número de ı́tems o preguntas.S 2i : Varianza del ı́tem  i.

    S 2t : Varianza del total de valores observados (varianza de la suma de los ı́tems).

    1.9.9. Error t́ıpico o estándar de medida

    Asumiendo el postulado fundamental del modelo clásico, que expresa la relación:

    X  = V   + E 

    Es fácil demostrar que se cumple la siguiente relación para datos muestrales:

    S 2x =  S 2v  + S 

    2e

    A la desviación t́ıpica de los errores de medida (S e) se denomina  error t́ıpico de medida. En ciertamanera, se representa también una medida de precisión: cuanto más cercano a cero sea el error t́ıpicode medida de un test, eso significará que dicho test proporciona a cada persona una puntuación   X cercana a su nivel de rasgo  V .

    En términos paramétricos, se puede demostrar que el coeficiente de fiabilidad es:

    ρxx =  σ2vσ2x

    Para datos muestrales, la expresión anterior queda establecida como:

    rxx  =  S 2vS 2x

    = 1 −  S 2v

    S 2e

    De donde se deduce que el error t́ıpico de medida puede obtenerse a partir de la expresión:

    S e  =  S x√ 

    1 − rxx

    1.10. Validez del test

    Una cosa es que el test mida de manera precisa o estable (esta cualidad se refiere a su fiabili-

    dad), y otra diferente es la cuestión de qué es lo que auténticamente está evaluando.

    La validación es un proceso continuo, que incluye procedimientos diferentes para comprobarsi el cuestionario mide realmente lo que dice medir. Dicho de otro modo, tiene que ver con el tipo deconclusiones o inferencias que pueden realizarse a partir de las puntuaciones obtenidas en el test.

    Aunque cada vez se tiende más a concebir la validez como un proceso unitario que tiene comoobjetivo aportar pruebas sobre las inferencias que podemos realizar con un test, tradicionalmente

    25

  • 8/18/2019 Manual Estadistico (1).pdf

    27/276

    se han diferenciado varios procedimientos de validación, alguno de los cuales incluye varios métodosdiferentes de comprobación. Los fundamentales procedimientos son denominados como validez decontenido, de constructo y referida al criterio.

    1.10.1. Validez de contenido

    Sobre todo en pruebas de rendimiento (por ejemplo, pruebas de inteligencia, de aptitudes, etc...)y en pruebas de conocimientos (cuestionarios para evaluar el rendimiento en una materia escolar o enuna especialidad temática concreta), tiene sentido justificar que el conjunto de ı́tems que forman eltest conforman una muestra representativa del universo de contenidos que interesa evaluar.

    1.10.2. Validez de constructo

    Un constructo es un concepto elaborado por los teóricos de la Psicoloǵıa para explicar el com-portamiento humano. Inteligencia fluida, extroversión, autoconcepto, asertividad, motivación intrı́nse-ca... son constructos que forman parte de teorı́as psicológicas y que precisan de indicadores observables

    para su estudio. En muchas ocasiones, estos indicadores son los ı́tems de un test, y debe comprobarseemṕıricamente donde resultan adecuados para reflejar el constructo de referencia.

    1.10.2.1. Estrategias para la validez de constructo

    La validez de constructo incluye la planificación y ejecución de determinados estudios de in-vestigación orientados a comprobar emṕıricamente que un test mide realmente el constructo o rasgoque pretendemos.

    Aunque los métodos a emplear son sin duda variados, aśı como las técnicas estadı́sticas para

    analizar los datos, podemos encontrar un común denominador a todos ellos, que se sintetiza en lassiguientes fases:

    Formular hipótesis relevantes en las que aparezca el constructo que pretendemos evaluar con eltest.

    Efectuar en la práctica mediciones oportunas de las variables o constructos involucrados en lashipótesis.

    Determinar si se verifican o no las hipótesis planteadas. En el caso de que ası́ sea, queda confir-mado mediante una investigación que el test mide el constructo de interés ya que, de lo contrario,no habrı́a razones lógicas para que se cumplieran las hipótesis formuladas.

    1.10.3. Validez de criterio

    Cuando se pretende utilizar el test para pronosticar determinados criterios de rendimiento(por ejemplo, el rendimiento escolar en un nivel dado, el total de ventas que se van a conseguir o lamejora en un proceso terapéutico) conviene que el test se relacione muy estrechamente con un criterioexterno. Este criterio externo debe ser una medida fiable del rendimiento que se quiere pronosticar conel test: calificaciones escolares, total de ventas producidas en un determinado peŕıodo, estimaciones

    26

  • 8/18/2019 Manual Estadistico (1).pdf

    28/276

    de un terapeuta de las mejoras conseguidas por cada persona, etc. A la correlaci ón entre las puntua-ciones en el test (X) y en el criterio (Y) se le denomina coeficiente de validez, lo designamos comorxy  e indicará el grado en el que el test sirve para pronosticar con precisión el rendimiento en el criterio.

    Recordando algunos conceptos fundamentales de la regresión lineal simple, el coeficiente dedeterminación se puede expresar de la siguiente manera:

    r2xy  =S 2y

    S 2y= 1 − S 

    2y−yS 2y

    Donde,S 2y : Varianza del criterio.S 2y : Varianza de los pronósticos.

    S 2y−y : Varianza de los errores de pronóstico.

    1.10.3.1. Factores que afectan al coeficiente de validez

    El coeficiente de validez es una correlación entre una variable  X  (test) y otra  Y   (criterio). Lacuant́ıa de la correlación viene condicionada por varios factores, como son:

    La fiabilidad del test.

    La fiabilidad del criterio.

    La auténtica relación entre test y criterio.

    La variabilidad de la muestra en el test y en el criterio.

    Respecto a los dos primeros factores, se puede decir que el coeficiente de validez tiende a incrementarsea medida que test y criterio son variables medidas con exactitud. Problemas de fiabilidad en uno uotro se reflejan mediante una disminución del coeficiente de validez. De hecho, se puede comprobar

    que el ĺımite máximo al que puede llegar  rxy   es √ rxxryy  es decir:

    rxy ≤ √ rxxryySiendo rxx  el coeficiente de fiabilidad del test y  ryy  el coeficiente de fiabilidad del criterio.

    27

  • 8/18/2019 Manual Estadistico (1).pdf

    29/276

    1.11. Tabla de resumen

    TEMAS CONTENIDOS

    Investigación Definición de investigación

    Planteamiento del problema Estructuracíon de la idea de investi-

    gaciónMarco teórico Orientación de la investigación

    Tipo de investigación Definir alcance de la investigación

    Hipótesis Define relación entre dos o más va-riables a partir de una afirmación

    Tipos de diseño de investigación Diseño no experimentalDiseño experimental

    Redacción y análisis de ́ıtems Definición del constructoConstrucción provisional del cues-tionarioFormato de respuesta

    Redacción de ı́temsCuantificación de las respuestasAnálisis de ı́temsAnálisis de opciones incorrectas derespuestaCorrección de los efectos del azar

    Modelo clásico y concepto de fiabilidad Fiabilidad del testFormas paralelas de un testCoeficiente de fiabilidad de formasparalelasCoeficiente de fiabilidad de n formas

    paralelasFiabilidad como correlación de for-mas paralelasFiabilidad como estabilidad tempo-ralMétodos de dos mitadesCoeficiente α  de CronbachError t́ıpico o estándar de medida

    Validez del test Validez del contenidoValidez de constructoValidez de criterio

    28

  • 8/18/2019 Manual Estadistico (1).pdf

    30/276

    1.12. Comentarios

    Si bien el diseño de encuestas estructura y da forma a una investigación, éste se relaciona convarias áreas de la estad́ıstica, como son las técnicas de muestreo las cuales acotan el alcance de losresultados de la investigación como también en la selección de los grupos de estudio. Otro alcance, esque en la selección del tipo de diseño experimental tiene una relación directa con el caṕıtulo de di-

    seño de experimentos, en el cual el investigador selecciona el mejor modelo para representar su estudio.

    Por último, la relación con el caṕıtulo siguiente, estadı́stica no paramétrica, es aquella con lacual ayuda a contrastar las hipótesis de las medias en las formas paralelas de un test.

    En referencia al manual estad́ısitco del año 2000, éste caṕıtulo fue reordenado en su estructura.

    29

  • 8/18/2019 Manual Estadistico (1).pdf

    31/276

    Referencias

    [1] Sampieri. (1997). Metodoloǵıa de la Investigaci´ on. 1a edici´ on . Editorial McGraw-Hill.

    [2] Abad F / Garcı́a C. (2004).  Introducci´ on a la Psicometrı́a.  Universidad Autónoma de Madrid.

    [3] Guillermo Briones. (1990).   Métodos y Técnicas de Investigaci´ on para las Ciencias Sociales. 2 a

    edici´ on . Editorial Trillas.

    30

  • 8/18/2019 Manual Estadistico (1).pdf

    32/276

    Caṕıtulo 2

    Estad́ıstica No Paramétrica

    En los métodos de estad́ıstica inferencial se requieren de supuestos a priori acerca de la na-turaleza o forma de las poblaciones involucradas para poder hacer estimaciones o inferencias sobrelos valores reales de ciertos parámetros espećıficos, como la media (µ), la desviación estándar (σ) o

    la proporción ( p). Tambíen los problemas de pruebas de hipótesis en esta área depende de dichossupuestos.

    En este caṕıtulo se abordará una rama de la estad́ıstica totalmente contraria a la anteriormentecitada, esta es, la estad́ıstica no paramétrica, la cual posee la libertad de no regirse por supuestos sobrela naturaleza de la población en estudio, es por esto que las pruebas de hipótesis no paramétricas sontambién llamadas  pruebas de libre distribuci´ on .

    Por lo general, las pruebas no paramétricas son fáciles de usar y calcular, eliminan la necesidadde de suposiciones restrictivas de las pruebas paramétricas. También una de las importancias de ésta

    disciplina es la de trabajar con muestras pequeñas y usar datos cualitativos, sin embargo, a veces,ignoran o pierden información e incurren en un mayor error del tipo II (no rechazar una hip ótesis nulafalsa).

    2.1. Conceptos previos

    2.1.1. Clasificación de variables

    Las variables se clasifican según su recorrido y/o su escala.

    1.- Según el recorrido, encontramos 3 tipos:

    Dicotómicas o binarias: sólo pueden tomar un de dos valores.Discretas o categóricas:  aquellas que sólo toman valores enteros.Continuas:  toman valores en la recta real.

    2.- Según la escala, encontramos 4 tipos:

    31

  • 8/18/2019 Manual Estadistico (1).pdf

    33/276

    Nominal: on variables numéricas cuyos valores representan una categorı́a o identifican un grupode pertenencia.Ordinal (rankings): son variables numéricas cuyos valores representan una categoŕıa o identi-fican un grupo de pertenencia contando con un orden lógico o jerárquico.Intervalo:   son variables numéricas cuyos valores representan magnitudes y la distancia entrelos números de su escala es igual. Las variables de intervalo carecen de un cero absoluto, por lo

    que operaciones como la multiplicación y la división no son realizables.Razón:   poseen las mismas caracteŕısticas de las variables de intervalo, con la diferencia quecuentan con un cero absoluto; es decir, el valor cero representa la ausencia total de medida.

    2.1.2. Estad́ısticos de orden

    Sea  X  = (X 1, . . . , X  n) una muestra aleatoria de variables independientes e idénticamente dis-tribuidas con función de distribución  F X (x). Entonces se ordena la m.a. de forma creciente y se defineX [i]  como estadı́stico de orden i  de la muestra aleatoria.

    Es decir:

    Mı́nimo valor de la muestra:  X [1]  =  min{X i} ∀i = 1, . . . , nMáximo valor de la muestra:  X [n]  =  max{X i} ∀i = 1, . . . , nr-ésimo estadı́stico de orden:  X [r]   1 < r < n

    Algunas aplicaciones de esta estad́ıstica son:

    1. Cuando se desea obtener el mı́nimo costo al cual se puede obtener cierta materia prima.

    2. La temperatura máxima en un lapso de tiempo en estudio.

    3. Cuando se requiere la máxima presión de soporte de un cierto material de construcción, etc.La   mediana   es un buen estimador para la tendencia central de la población, ya que ésta no se veinfluenciada por valores grandes o pequeños dentro de la muestra como es en el caso de la   media .Luego la  mediana  para la m.a. se define por:

    M e =

    X n+1

    2si  n  es impar

    12(X n2 + X 

    n2+1) si  n  es par

    Otros elementos fundamentales son el rango definido como  X [n] − X 1  y el rango intercuat́ılico(Q3 − Q1). Estos estimadores dan una buena apreciación de la dispersión de los datos.

    2.1.3. Test de Hipótesis

    Para realizar un test de hipótesis se deben seguir los siguientes pasos:

    32

  • 8/18/2019 Manual Estadistico (1).pdf

    34/276

    1. Planteamiento de la HipótesisH 0  : Hipótesis nula. Se plantéa con el propósito de rechazarla.H 1  : Hipótesis alternativa. Declaración operacional de la hipótesis de investigación.

    2. Región de rechazo de  H 0

    a)