estadistica para administracion y economia_6ta ed_paulnewbold_william_berry.pdf

833

Upload: michael-cardenas

Post on 07-Aug-2018

250 views

Category:

Documents


1 download

TRANSCRIPT

 
Paul Newbold  University of Nottingham 
 William L. Carlson  St. Olaf College 
Betty M. Thorne Stetson University 
 Traducción 
Prentice Hall, Upper Saddle River, New Jersey 07458 Madrid
 
Estadística para Administración y Economía
PEARSON EDUCACIÓN, S.A., Madrid, 2008
ISBN: 978-84-8322-403-8 Materia: 519.5 Métodos estadísticos
Formato 195# 250 mm Páginas: 1088
Todos los derechos reservados. Queda prohibida, salvo excepción prevista en la Ley, cualquier forma de reproducción, distribución, comunicación pública y transformación de esta obra sin contar con autorización de los titulares de propiedad intelectual. La infracción de los derechos mencionados puede ser constitutiva de delito contra la propiedad intelectual  (arts. 270 y sgts. Código Penal).
Authorized translation from the English language edition, entitled STATISTICS FOR BUSINESS AND ECONOMICS, 6th Edition by NEWBOLD, PAUL; CARLSON, WILLIAM; THORNE, BETTY, published by Pearson Education, Inc, publishing as Prentice Hall, Copyright 5 2007.
All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means, electronic or mechanical photocopying, recording or by and information storage retrieval system, without permission from Pearson Education, Inc.
Spanish language edition published by PEARSON EDUCATION S.A., Copyright 5 2008
DERECHOS RESERVADOS 5 2008 por PEARSON EDUCACIÓN, S.A. Ribera del Loira, 28 28042 Madrid (España)
Paul Newbold, William L. Carlson y Betty M. Thorne Estadística para Administración y Economía
ISBN: 978-84-8322-403-8 Depósito legal:
PEARSON PRENTICE HALL es un sello editorial autorizado de PEARSON EDUCACIÓN, S.A.
Equipo editorial: Editor: Alberto Cañizal Técnico editorial: Elena Bazaco
Equipo de producción: Director: José Antonio Clares Técnico: José Antonio Hernán
Diseño de cubierta:  Equipo de diseño de PEARSON EDUCACIÓN, S.A.
Composición: COPIBOOK, S.L.
Impreso por:
 
Dedico este libro a mi mujer Charlotte, a nuestros hijos Andrea, Douglas y Larry y a nuestros nietos Ezra, Savanah,
Rellana, Anna, Eva Rose y Emily
William L. Carlson
Dedico este libro a mi marido Jim y a nuestra familia Jennie, Ann, Renee, Jon, Chris, Jon, Marius, Mihaela,
Cezara y Anda
Betty M. Thorne
SOBRE LOS AUTORES
Bill Carlson  es profesor emérito de economía en St. Olaf College,
donde lleva 31 años enseñando, ha sido varias veces director de de-
partamento y ha desempeñado diversas funciones administrativas,
entre las que se encuentra la de Director del Centro de Cálculo.
También ha ocupado diversos cargos en la administración pública de
Estados Unidos y en la Universidad de Minnesota, además de pro-
nunciar conferencias en numerosas universidades. Fue elegido
miembro honorario de Phi Beta Kappa. También trabajó 10 años en
el sector privado y en empresas de consultoría antes de iniciar su ca-
rrera en St. Olaf. Se licenció en ingeniería en la Michigan Technolo-
gical University (BS), realizó un Máster (MS) en el Illinois Institute
of Technology y se doctoró (Ph.D.) en Administración Cuantitativa
de Empresas en la Rackham Graduate School de la Universidad de
Michigan. Entre sus investigaciones, se encuentran numerosos estu-
dios sobre la administración de empresas, la seguridad vial y la ense-
ñanza de la estadística. Ha publicado anteriormente dos libros de
texto de estadística. Ha sido profesor encargado de numerosos gru-
pos de estudiantes que han realizado estancias de estudio en diversos
países de todo el mundo. Entre los cargos que ocupa actualmente se
encuentran el de Director Ejecutivo del Cannon Valley Elder Colle-
gium. Disfruta con sus nietos y con la ebanistería, y le encanta
viajar, leer y que le encarguen trabajos en la parte septentrional del
estado de Wisconsin.
Betty M. Thorne, autora, investigadora y profesora galardonada con
premios a la docencia, es profesora de Ciencias de la Decisión y Di-
rectora de Estudios de Grado en la School of Business Administra-
tion de Stetson University en DeLand (Florida). Galardonada con el
McEniry Award for Excellence in Teaching de la Stetson University,
el máximo premio que se concede a un profesor de la Stetson Uni-
versity, también ha recibido el Outstanding Teacher of the Year
Award y el Professor of the Year Award de la School of Business
Administration en Stetson. Enseña asimismo en el programa de vera-
 
de Stetson University; el programa de MBA Ejecutivo de Stetson University, y el Executive
Passport Program de Stetson University. En 2004 y 2005, fue nombrada mejor profesora del
programa JD/ MBA del College of Law de Stetson. Se licenció en Geneva College e hizo el
Máster y el Doctorado en la Universidad de Indiana. Es miembro del comité de planificación y
Secretaria/ Tesorera de las jornadas tituladas   Making Statistics More Effective in Schools and 
 Business, en las que se reúne anualmente con estadísticos para debatir sobre cuestiones de in-
vestigación y enseñanza. También es miembro del Decision Sciences Institute, de la American
Society for Quality y de la American Statistical Association. Participa en un estudio quinquenal
titulado North American Fareston versus Tamoxifen Adjuvant (NAFTA) Trial sobre el cáncer
de mama (http:// www.naftatrial.com).
Ella y su marido, Jim, tienen cuatro hijos. Viajan mucho, asisten a clases de teología, parti-
cipan en organizaciones internacionales dedicadas a ayudar a niños desfavorecidos y hacen tra-
bajo apostólico en Rumanía.
Capítulo 2.   Descripción gráfica de los datos ........................................................... 9
Capítulo 3.   Descripción numérica de los datos ........................................................ 49
Capítulo 4.   Probabilidad ............................................................................................ 83
Capítulo 5.   Variables aleatorias discretas y distribuciones de probabilidad ........... 145
Capítulo 6.   Variables aleatorias continuas y distribuciones de probabilidad ......... 201
Capítulo 7.   Muestreo y distribuciones en el muestreo ............................................ 249
Capítulo 8.   Estimación: una población ..................................................................... 295
Capítulo 9.   Estimación: otros temas ......................................................................... 325
Capítulo 10.   Contraste de hipótesis ............................................................................ 353
Capítulo 11.   Contraste de hipótesis II ........................................................................ 393
Capítulo 12.   Regresión simple .................................................................................... 431
Capítulo 13.   Regresión múltiple ................................................................................. 487
Capítulo 14.   Otros temas del análisis de regresión .................................................... 575
Capítulo 15.   Estadística no paramétrica ..................................................................... 627
Capítulo 16.   Contrastes de la bondad del ajuste y tablas de contingencia ............... 655
Capítulo 17.   Análisis de la varianza ........................................................................... 681
Capítulo 18.   Introducción a la calidad ....................................................................... 729
Capítulo 19.   Análisis de series temporales y predicción ........................................... 763
Capítulo 20.   Otros temas relacionados con el muestreo ............................................ 811
Capítulo 21.   Teoría estadística de la decisión ............................................................ 855
 
PRÓLOGO   ....................................................................................................................................... xix
CAPÍTULO 1. ¿Por qué estudiar estadística?   ........................................................................ 1 1.1. La toma de decisiones en un entorno incierto ........................................ 2 1.2. El muestreo ............................................................................................... 3 1.3. Estadística descriptiva e inferencial ......................................................... 4
Descripción de los datos  .............................................................................. 5 Realización de inferencias  ............................................................................ 6
CAPÍTULO 2. Descripción gráfica de los datos  ..................................................................... 9 2.1. Clasificación de las variables ................................................................... 10
Categóricas o numéricas  ............................................................................... 10 Niveles de medición   .................................................................................... 10
2.2. Gráficos para describir variables categóricas .......................................... 13 Tablas   ......................................................................................................... 13 Gráficos de barras y gráficos de tarta  ............................................................ 14 Diagramas de Pareto  .................................................................................... 16
2.3. Gráficos para describir datos de series temporales ................................. 20 2.4. Gráficos para describir variables numéricas ........................................... 24
Distribuciones de frecuencias   ....................................................................... 24 Histogramas y ojivas  .................................................................................... 27 Diagramas de tallo y hojas  ........................................................................... 30
2.5. Tablas y gráficos para describir relaciones entre variables .................... 32 Diagramas de puntos dispersos  ..................................................................... 33 Tablas cruzadas   ........................................................................................... 34
2.6. Errores en la presentación de datos ......................................................... 39 Histogramas engañosos   ................................................................................ 40 Gráficos de series temporales engañosos  ....................................................... 42
CAPÍTULO 3. Descripción numérica de los datos  ................................................................. 49 3.1. Medidas de la tendencia central .............................................................. 50
Media, mediana, moda  ................................................................................. 50 Forma de la distribución  .............................................................................. 52
 
Varianza y desviación típica  ......................................................................... 57 Teorema de Chebychev y regla empírica  ...................................................... 59 Coeficiente de variación  ............................................................................... 61
3.3. Media ponderada y medidas de datos agrupados .................................... 64 3.4. Medidas de las relaciones entre variables ............................................... 69 3.5. Obtención de relaciones lineales ............................................................. 75
CAPÍTULO 4. Probabilidad   ...................................................................................................... 83 4.1. Experimento aleatorio, resultados, sucesos ............................................. 84 4.2. La probabilidad y sus postulados ............................................................ 92
Probabilidad clásica   ..................................................................................... 92 Frecuencia relativa  ....................................................................................... 95 Probabilidad subjetiva  .................................................................................. 96
4.3. Reglas de la probabilidad ......................................................................... 102 Probabilidad condicionada  ............................................................................ 104 Independencia estadística   ............................................................................. 108
4.4. Probabilidades bivariantes ........................................................................ 116 Ventaja (odds)  ............................................................................................. 120 Cociente de «sobreparticipación»  .................................................................. 121
4.5. El teorema de Bayes ................................................................................ 128
CAPÍTULO 5. Variables aleatorias discretas y distribuciones de probabilidad  ................ 145 5.1. Variables aleatorias .................................................................................. 146 5.2. Distribuciones de probabilidad de variables aleatorias discretas ........... 148 5.3. Propiedades de las variables aleatorias discretas .................................... 151
Valor esperado de una variable aleatoria discreta  .......................................... 151 Varianza de una variable aleatoria discreta  .................................................... 153 Media y varianza de funciones lineales de una variable aleatoria  ................... 156
5.4. Distribución binomial ............................................................................... 161 5.5. Distribución hipergeométrica ................................................................... 170 5.6. La distribución de Poisson ....................................................................... 173
Aproximación de Poisson de la distribución binominal  .................................. 176 Comparación de la distribución de Poisson y la distribución binomial  ............ 177
5.7. Distribución conjunta de variables aleatorias discretas .......................... 179 Aplicaciones informáticas  ............................................................................. 183 Covarianza   .................................................................................................. 183 Correlación .................................................................................................. 184 Funciones lineales de variables aleatorias  ...................................................... 186 Análisis de carteras  ...................................................................................... 189
CAPÍTULO 6. Variables aleatorias continuas y distribuciones de probabilidad  ............... 201 6.1. Variables aleatorias continuas .................................................................. 202
La distribución uniforme  .............................................................................. 205 6.2. Esperanzas de variables aleatorias continuas .......................................... 208 6.3. La distribución normal ............................................................................. 211
Gráficos de probabilidades normales   ............................................................. 220 6.4. La distribución normal como aproximación de la distribución
binomial .................................................................................................... 225 Variable aleatoria proporcional  ..................................................................... 229
 xii   Contenido
6.5. La distribución exponencial ..................................................................... 231 6.6. Distribución conjunta de variables aleatorias continuas ......................... 234
Combinaciones lineales de variables aleatorias  .............................................. 238
CAPÍTULO 7. Muestreo y distribuciones en el muestreo  ..................................................... 249 7.1. Muestreo de una población ...................................................................... 250 7.2. Distribuciones de las medias muestrales en el muestreo ........................ 254
Teorema del límite central   ........................................................................... 260 Intervalos de aceptación  ............................................................................... 265
7.3. Distribuciones de proporciones muestrales en el muestreo .................... 272 7.4. Distribuciones de las varianzas muestrales en el muestreo .................... 277
CAPÍTULO 8. Estimación: una población   .............................................................................. 295 8.1. Propiedades de los estimadores puntuales ............................................... 296
Estimador insesgado   .................................................................................... 297 Estimador consistente ................................................................................... 298 Estimador eficiente   ...................................................................................... 298
8.2. Intervalos de confianza de la media: varianza poblacional conocida .... 302 Intervalos basados en la distribución normal  ................................................. 304 Reducción del margen de error  ..................................................................... 307
8.3. Intervalos de confianza de la media: varianza poblacional desconocida .... 309 Distribución  t  de Student  .............................................................................. 310 Intervalos basados en la distribución  t  de Student  .......................................... 312
8.4. Intervalos de confianza de proporciones de la población (grandes muestras) ................................................................................................... 315
CAPÍTULO 9. Estimación: otros temas  ................................................................................... 325 9.1. Intervalos de confianza de la diferencia entre las medias de dos
poblaciones normales ............................................................................... 326 Muestras dependientes   ................................................................................. 326 Muestras independientes, varianzas poblacionales conocidas  .......................... 328
9.2. Intervalos de confianza de la diferencia entre las medias de dos poblacionales normales cuando las varianzas poblacionales son conocidas ................................................................................................... 331 Muestras independientes, varianzas poblacionales que se supone que son iguales   ........................................................................................................ 331 Muestras independientes, varianzas poblacionales que no se supone que sean iguales   ........................................................................................................ 334
9.3. Intervalos de confianza de la diferencia entre dos proporciones poblacionales (grandes muestras) ............................................................ 337
9.4. Intervalos de confianza de la varianza de una distribución normal ....... 340 9.5. Elección del tamaño de la muestra .......................................................... 344
Media de una población que sigue una distribución normal, varianza poblacional conocida  .................................................................................... 344 Proporción poblacional  ................................................................................. 346
CAPÍTULO 10. Contraste de hipótesis   ...................................................................................... 353 10.1. Conceptos del contraste de hipótesis ..................................................... 354 10.2. Contrastes de la media de una distribución normal: varianza
poblacional conocida .............................................................................. 360
 p-valor   ...................................................................................................... 362 Hipótesis alternativa bilateral  ...................................................................... 369
10.3. Contrastes de la media de una distribución normal: varianza poblacional desconocida ......................................................................... 372
10.4. Contrastes de la proporción poblacional (grandes muestras) ............... 376 10.5. Valoración de la potencia de un contraste ............................................ 380
Contrastes de la media de una distribución normal: variable poblacional conocida .................................................................................................... 380 Potencia de los contrastes de proporciones poblacionales (grandes muestras)  ... 383
CAPÍTULO 11. Contraste de hipótesis II  .................................................................................. 393 11.1. Contrastes de la diferencia entre dos medias poblacionales ................ 394
Dos medias, datos pareados  ........................................................................ 395 Dos medias, muestras independientes, varianzas poblacionales conocidas  ..... 398 Dos medias, poblaciones independientes, varianzas desconocidas que se supone que son iguales  .............................................................................. 401 Dos medias, muestras independientes, varianzas poblacionales desconocidas que se supone que no son iguales  ............................................................... 404
11.2. Contrastes de la diferencia entre dos proporciones poblacionales (grandes muestras) .................................................................................. 408
11.3. Contrastes de la varianza de una distribución normal .......................... 412 11.4. Contrastes de la igualdad de las varianzas entre dos poblaciones
distribuidas normalmente ....................................................................... 416 11.5. Algunas observaciones sobre el contraste de hipótesis ........................ 420
CAPÍTULO 12. Regresión simple  ............................................................................................... 431 12.1. Análisis de correlación ........................................................................... 432
Contraste de hipótesis de la correlación  ...................................................... 433 12.2. Modelo de regresión lineal .................................................................... 437 12.3. Estimadores de coeficientes por el método de mínimos cuadrados ..... 442
Cálculo por ordenador del coeficiente de regresión  ...................................... 445 12.4. El poder explicativo de una ecuación de regresión lineal .................... 448
El coeficiente de determinación   R2 ............................................................. 450 12.5. Inferencia estadística: contrastes de hipótesis e intervalos de
confianza ................................................................................................. 456 Contraste de hipótesis del coeficiente de la pendiente poblacional utilizando la distribución   F  ........................................................................................ 463
12.6. Predicción ............................................................................................... 466 12.7. Análisis gráfico ....................................................................................... 472
CAPÍTULO 13. Regresión múltiple   ............................................................................................ 487 13.1. El modelo de regresión múltiple ........................................................... 488
Especificación del modelo  .......................................................................... 488 Desarrollo del modelo  ................................................................................ 491 Gráficos tridimensionales   ........................................................................... 494
13.2. Estimación de coeficientes ..................................................................... 496 Método de mínimos cuadrados  ................................................................... 497
13.3. Poder explicativo de una ecuación de regresión múltiple .................... 504
 xiv   Contenido
 
13.4. Intervalos de confianza y contrastes de hipótesis de coeficientes de regresión individuales ............................................................................. 511 Intervalos de confianza   .............................................................................. 513 Contrastes de hipótesis  ............................................................................... 515
13.5. Contrastes de los coeficientes de regresión ........................................... 525 Contrastes de todos los coeficientes   ............................................................ 525 Contraste de un conjunto de coeficientes de regresión  ................................. 528 Comparación de los contrastes   F  y  t   ........................................................... 529
13.6. Predicción ............................................................................................... 533 13.7. Transformaciones de modelos de regresión no lineales ....................... 535
Transformaciones de modelos cuadráticos  ................................................... 536 Transformaciones logarítmicas  .................................................................... 539
13.8. Utilización de variables ficticias en modelos de regresión .................. 545 Diferencias entre las pendientes  .................................................................. 548
13.9. Método de aplicación del análisis de regresión múltiple ..................... 553 Especificación del modelo  .......................................................................... 553 Regresión múltiple  ..................................................................................... 555 Efecto de la eliminación de una variable estadísticamente significativa  ........ 558 Análisis de los residuos .............................................................................. 559
CAPÍTULO 14. Otros temas del análisis de regresión   ............................................................ 575 14.1. Metodología para la construcción de modelos ...................................... 576
Especificación del modelo  .......................................................................... 577 Estimación de los coeficientes  .................................................................... 577 Verificación del modelo  ............................................................................. 578 Interpretación del modelo e inferencia   ........................................................ 579
14.2. Variables ficticias y diseño experimental .............................................. 579 Modelos de diseño experimental  ................................................................. 583
14.3. Valores retardados de las variables dependientes como regresores ..... 591 14.4. Sesgo de especificación .......................................................................... 596 14.5. Multicolinealidad .................................................................................... 599 14.6. Heterocedasticidad .................................................................................. 602 14.7. Errores autocorrelacionados ................................................................... 608
Estimación de las regresiones con errores autocorrelacionados  ..................... 612 Errores autocorrelacionados en los modelos con variables dependientes retardadas   .................................................................................................. 616
CAPÍTULO 15. Estadística no paramétrica   .............................................................................. 627 15.1. Contraste de signos e intervalo de confianza ........................................ 628
Contraste de signos de muestras pareadas o enlazadas  ................................. 628 Aproximación normal   ................................................................................ 631 Contraste de signos de una mediana poblacional  ......................................... 633 Intervalo de confianza de la mediana   .......................................................... 634
15.2. Contraste de Wilcoxon basado en la ordenación de las diferencias .... 636 Minitab (contraste de Wilcoxon)  ................................................................. 637 Aproximación normal   ................................................................................ 638
15.3. Contraste  U  de Mann-Whitney .............................................................. 641 15.4. Contraste de la suma de puestos de Wilcoxon ..................................... 645 15.5. Correlación de orden de Spearman ........................................................ 649
Contenido xv
 
CAPÍTULO 16. Contrastes de la bondad del ajuste y tablas de contingencia  ..................... 655 16.1. Contrastes de la bondad del ajuste: probabilidades especificadas ....... 656 16.2. Contrastes de la bondad del ajuste: parámetros poblacionales
desconocidos ........................................................................................... 661 Un contraste de normalidad  ........................................................................ 663
16.3. Tablas de contingencia ........................................................................... 666 Aplicaciones informáticas  ........................................................................... 669
CAPÍTULO 17. Análisis de la varianza   ..................................................................................... 681 17.1. Comparación de las medias de varias poblaciones ............................... 682 17.2. Análisis de la varianza de un factor ...................................................... 684
Modelo poblacional en el caso del análisis de la varianza de un factor  ......... 691 17.3. El contraste de Kruskal-Wallis .............................................................. 695 17.4. Análisis de la varianza bifactorial: una observación por celda, bloques
aleatorizados ........................................................................................... 698 17.5. Análisis de la varianza bifactorial: más de una observación por
celda ........................................................................................................ 709
CAPÍTULO 18. Introducción a la calidad  ................................................................................. 729 18.1. La importancia de la calidad ................................................................. 730
Los líderes de la calidad  ............................................................................ 730 Variación   .................................................................................................. 732
18.2. Gráficos de control de medias y desviaciones típicas .......................... 735 Una estimación de la desviación típica del proceso  ..................................... 736 Gráficos de control de medias  .................................................................... 738 Gráficos de control de desviaciones típicas  ................................................. 740 Interpretación de los gráficos de control  ...................................................... 741
18.3. Capacidad de un proceso ....................................................................... 745 18.4. Gráfico de control de proporciones ....................................................... 749 18.5. Gráficos de control del número de ocurrencias .................................... 754
CAPÍTULO 19. Análisis de series temporales y predicción  .................................................... 763 19.1. Números índice ....................................................................................... 764
Índice de precios de un único artículo   ......................................................... 766 Índice de precios agregado no ponderado  .................................................... 767 Índice de precios agregado ponderado   ......................................................... 768 Índice de cantidades agregado ponderado  .................................................... 769 Cambio del periodo base  ............................................................................ 770
19.2. Un contraste no paramétrico de aleatoriedad ........................................ 773 19.3. Componentes de una serie temporal ...................................................... 777 19.4. Medias móviles ....................................................................................... 780
Extracción del componente estacional por medio de medias móviles  ............ 783 19.5. Suavización exponencial ........................................................................ 789
Modelo de predicción por medio de la suavización exponencial con el método Holt-Winters  .................................................................................. 792 Predicción de series temporales estacionales  ............................................... 796
19.6. Modelos autorregresivos ......................................................................... 801 19.7. Modelos autorregresivos integrados de medias móviles ....................... 807
 xvi   Contenido
 
CAPÍTULO 20. Otros temas relacionados con el muestreo  .................................................... 811 20.1. Pasos básicos de un estudio realizado por muestreo ............................ 812 20.2. Errores de muestreo y errores ajenos al muestreo ................................ 817 20.3. Muestreo aleatorio simple ...................................................................... 819
Análisis de los resultados de un muestreo aleatorio simple  .......................... 820 20.4. Muestreo estratificado ............................................................................ 825
Análisis de los resultados de un muestreo aleatorio estratificado  .................. 827 Afijación del esfuerzo muestral a los distintos estratos  ................................ 833
20.5. Elección del tamaño de la muestra ........................................................ 837 Tamaño de la muestra para el muestreo aleatorio simple: estimación de la media o el total poblacional  ....................................................................... 838 Tamaño de la muestra para el muestreo aleatorio simple: estimación de la proporción poblacional  ............................................................................... 839 Tamaño de la muestra para un muestreo aleatorio estratificado con un grado de precisión especificado  ............................................................................ 840
20.6. Otros métodos de muestreo .................................................................... 843 Muestreo por conglomerados  ...................................................................... 843 Muestreo bietápico  ..................................................................................... 847 Métodos de muestreo no probabilísticos  ...................................................... 850
CAPÍTULO 21. Teoría estadística de la decisión  ..................................................................... 855 21.1. La toma de decisiones en condiciones de incertidumbre ..................... 856 21.2. Soluciones que no implican la especificación de probabilidades:
criterio maximin, criterio de la pérdida de oportunidades minimax .... 859 Criterio maximin   ....................................................................................... 860 Criterio de la pérdida de oportunidades minimax  ......................................... 862
21.3. Valor monetario esperado; TreePlan ..................................................... 864 Árboles de decisión ................................................................................ 866 La utilización de TreePlan para resolver un árbol de decisión  ...................... 868 Análisis de sensibilidad  .............................................................................. 872
21.4. Información muestral: análisis y valor bayesianos ............................... 876 Utilización del teorema de Bayes  ................................................................ 876 El valor de la información muestral   ............................................................ 881 El valor de la información muestral visto por medio de árboles de decisión  .... 884
21.5. Introducción del riesgo: análisis de la utilidad ..................................... 890 El concepto de utilidad  .............................................................................. 891 Criterio de la utilidad esperada para tomar decisiones  .................................. 895
TABLAS DEL APÉNDICE 1. Función de distribución acumulada de la distribución normal estándar ... 899 2. Función de probabilidad de la distribución binomial .............................. 901 3. Probabilidades binomiales acumuladas .................................................... 906 4. Valores de  e.j ........................................................................................... 910 5. Probabilidades de Poisson individuales .................................................... 911 6. Probabilidades de Poisson acumuladas ..................................................... 919 7. Puntos de corte de la función de distribución ji-cuadrado ...................... 927 8. Puntos de corte de la distribución   t  de Student ....................................... 928 9. Puntos de corte de la distribución  F   ......................................................... 929
Contenido   xvii
 
10. Puntos de corte de la distribución del estadístico de contraste de Wilcoxon .................................................................................................... 932
11. Puntos de corte de la distribución del coeficiente de correlación de orden de Spearman .................................................................................... 933
12. Puntos de corte de la distribución del estadístico de contraste de Durbin-Watson ........................................................................................... 934
13. Constantes de los gráficos de control ....................................................... 936 14. Función de distribución acumulada del estadístico del contraste de
rachas ......................................................................................................... 937
ÍNDICE ANALÍTICO ....................................................................................................................... 1051
AUDIENCIA A LA QUE VA DIRIGIDO
Estadística para los negocios y la economía  (6.a edición) se ha escrito para satisfacer la necesidad de un libro de texto que ofrezca una buena introducción a la estadística para los negocios que permita comprender los conceptos y haga hincapié en la resolución de pro- blemas poniendo ejemplos realistas del mundo de la empresa y de la economía.
Programas de máster o de licenciatura que enseñen estadística para los negocios. Programas de doctorado y de licenciatura de economía. Programas de MBA ejecutivo. Cursos de doctorado de estadística empresarial.
CONTENIDO
Hemos escrito este libro con el fin de ofrecer una buena introducción a los métodos esta- dísticos aplicados para que sus lectores puedan realizar un sólido análisis estadístico en muchas situaciones empresariales y económicas. Hemos hecho hincapié en la comprensión de los supuestos que son necesarios para realizar un análisis profesional. Con los ordenado- res modernos, es fácil calcular a partir de los datos las salidas necesarias para muchos mé- todos estadísticos. Es tentador, pues, aplicar meramente sencillas «reglas» utilizando estas salidas, enfoque que se adopta en numerosos libros de texto. El nuestro es combinar los conocimientos con muchos ejemplos y ejercicios y mostrar que la comprensión de los mé- todos y de sus supuestos es útil para entender los problemas empresariales y económicos.
NUEVO EN ESTA EDICIÓN
Hemos actualizado y ampliado la sexta edición de este libro para satisfacer mejor las nece- sidades de los usuarios y ofrecer más flexibilidad. En esta edición, hemos introducido im- portantes cambios y novedades. Éstos son:
 
Hemos dividido el análisis de los intervalos de confianza y del contraste de hipótesis en un capítulo dedicado a una población y otro dedicado a dos poblaciones en res- puesta a las sugerencias de los usuarios y de los revisores. Presentaciones revisadas y más claras de los métodos de regresión simple y múltiple. Presentamos el análisis de cartera utilizando valores correlacionados con un extenso número de ejercicios aplicados. Hemos adoptado nuevos enfoques para presentar los datos utilizando imágenes grá- ficas.
A LOS ESTUDIANTES
El CD-ROM que acompaña a este libro contiene todos los ficheros de datos utilizados en el libro que son necesarios para hacer los problemas y los ejercicios, así como el programa TreePlan y su documentación. El PowerPoint y otros ficheros relevantes pueden encontrar- se en la página web del libro (www.prenhall.com/ newbold).
A LOS PROFESORES
Los ficheros de las soluciones de los capítulos y las presentaciones en PowerPoint de este libro se encuentran en formato digital descargable. Visite el Instructor Resource Center en el catálogo de Prentice Hall (www.prenhall.com). Para registrarse con el fin de utilizar los recursos del Instructor Resource Center se necesita un código de acceso como educador de Pearson.
Cada vez mejor
Una vez que se registre, no tendrá que rellenar más formularios o recordar múltiples nom- bres de usuario y contraseñas para acceder a nuevos títulos y / o ediciones. Como profesor registrado, puede acceder directamente a los ficheros de recursos y recibir inmediatamente el acceso y las instrucciones para instalar en el servidor de su universidad el contenido del gestor del curso.
¿Necesita ayuda?
Contamos con un entregado equipo de apoyo técnico para ayudar a los profesores a re- solver cuestiones relacionadas con el material auxiliar que acompaña a este libro. Visite http:// 247.prenhall.com/  para las respuestas a las preguntas formuladas frecuentemente y los números de teléfono gratuitos de ayuda.
AGRADECIMIENTOS
Nos gustaría dar las gracias a las siguientes personas que han revisado el libro y han hecho perspicaces sugerencias para esta edición:
Mr. C. Patrick Kohrman-Penn State University, Berks Campus James Thorson-Southern Connecticut State University Mamnoon Jamil-Rutgers University, Camden Zhimin Huang-Adelphi University
 xx    Prólogo
Renee Fontenot-University of Texas, Permian Basin Allen Lynch-Mercer University Bulent Uyar-University of Northern Iowa David Hudgins-University of Oklahoma Allan Lacayo-Diablo Valley College J. Morgan Jones-University of North Carolina Eugene Allevato-Woodbury University Patricia Odell-Bryant University Jay DeVore-California Polytechnic State University Valerie Bencivenga-University of Texas Myles J. Callan-University of Virginia Andrew Narwold-University of San Diego Anthony Smith-Carnegie Mellon University Peter Baxendale-University of Southern California Steen Anderson-Aarhus School of Business, Denmark Eric Bentzen-Copenhagen Business School, Denmark Hans Geilnkirchen-Erasmus University, Netherlands Peter Reiss-Stanford University David Hudgins-University of Oklahoma Robert Lemke-Lake Forest College Michael Gordinier-Washington University Fred Wenstop-Norwegian School of Management Sheri Aggarwal-University of Virginia Jorgen Lauridsen-University of Southern Denmark Robert Gillette-University of Kentucky Peter Boatwright-Carnegie Mellon Mark Kamstra-Simon Fraser Albert Madansky-University of Chicago Jeff Russell-University of Chicago Nick Polsen-University of Chicago Aaron Smith-University of Virginia Yu-Chi Cheng-University of Notre Dame Professor Mohanty-California State, Los Angeles Ken Alexander-University of Southern California Mendy Fygenson-University of Southern California Matthew White-Stanford University Stefanos Zenios-Stanford University Lawrence Brown-Pennsylvania State University Abba Krieger-Pennsylvania State University Harvey Singer-George Mason William Hausman-William and Mary University of Iowa Jim Swanson-Central Missouri University C. Barry Pfitzner-Randolf-Macon College
También estamos agradecidos a Annie Puciloski que ha revisado la precisión de esta edición y especialmente a Sandra Krausman, GGS Production Services, por su ayuda y pericia.
Por lo que se refiere al St. Olaf College, debemos dar las gracias a Priscilla Hall, ayu- dante administrativo de St. Olaf, por la labor realizada en algunas partes del libro y su
Prólogo   xxi
 
dirección del trabajo de varios estudiantes que han colaborado en el libro, entre los que se encuentran Michael Loop, Holly Malcomson, Erin McMurtry, Nelly Schwinghammer, Catharina Zuber. Este libro no habría sido posible sin su colaboración.
Por lo que se refiere a Stetson University, también damos las gracias a Jim Scheiner, Paul Dascher, Marie Gilotti, Sean A. Thomas, John Tichenor y Emma Astrom y especial- mente a Jennie Bishop (Computer Programmer Analyst II ,  State of Florida,   Volusia Coun-
ty Health Department ). Agradecemos, además, especialmente a nuestras familias su apoyo durante las numero-
sas horas dedicadas a este libro. Bill Carlson da las gracias especialmente a su mujer Char- lotte y a sus hijos adultos Andrea, Douglas y Larry. Betty Thorne da las gracias especial- mente a su marido Jim y a sus hijos adultos Jennie Bishop, Ann Thorne, Renee Payne y Jon Thorne; así como a Marius, Mihaela, Cezara y Anda Sabou.
Los autores agradecen las sólidas bases y tradición creadas por el autor original, Paul Newsbold. Paul comprendió la importancia del análisis estadístico riguroso y de sus funda- mentos. Se dio cuenta de que hay algunas complejas ideas que es necesario desarrollar y se esforzó en ofrecer explicaciones claras de difíciles ideas. Además, estas ideas sólo son úti- les cuando se utilizan para resolver problemas realistas. En ediciones anteriores, se in- cluyeron, pues, muchos ejemplos y muchos ejercicios aplicados. Nos hemos esforzado en mantener y ampliar esta tradición para hacer un libro que satisfaga las necesidades de los futuros líderes empresariales en la era de la información.
Si el lector tiene alguna sugerencia o corrección, puede ponerse en contacto con los autores a través del correo electrónico en [email protected]; [email protected].
 xxii   Prólogo
 Esquema del capítulo
1.1. La toma de decisiones en un entorno incierto 1.2. El muestreo 1.3. Estad stica descriptiva e inferencial
Descripción de los datos Realización de inferencias
Introducción
En nuestra era de la información, el mundo abunda en datos. En los artículos de los periódicos y en los reportajes de la televisión, se hacen afirmaciones como «El Dow Jo- nes ha caído 6 puntos hoy» o «El índice de precios de consumo subió un 0,8 por ciento el mes pasado» o «la última encuesta indica que la tasa de aprobación del presidente es hoy de un 63 por ciento» o «El 98 por ciento de los pacientes de un estudio clínico no experimentó ningún efecto secundario significativo con un nuevo medicamento contra el cáncer de mama». Cada vez es más frecuente que para hacer una valoración inteligente de los acontecimientos actuales, necesitemos asimilar e interpretar una cantidad consi- derable de datos. La Administración, las empresas y los investigadores científicos gas- tan miles de millones de dólares en la recogida de datos. La Administración ha contribui- do a ello, tanto recogiendo datos ella misma como obligando a las empresas a dar información. El sector privado también ha tenido que ver en ello. Las aireadas encuestas Gallup de las actitudes de los votantes y los índices de audiencia de Nielsen de los pro- gramas de televisión de la semana no son más que la punta de un enorme iceberg de estudios de mercado. La cantidad de datos recogidos ha aumentado a un ritmo extraor- dinario en los últimos años.
 
1.1. La toma de decisiones en un entorno incierto
Las decisiones a menudo se basan en información incompleta. Por ejemplo, se supone que los estudiantes universitarios de primer año, cuando son admitidos en la universidad, selec- cionan una carrera. Sin embargo, muchos de estos estudiantes pueden no tener una meta profesional clara. Por poner otro ejemplo, los enfermos de cáncer pueden ser invitados a participar en un estudio clínico para probar un nuevo medicamento experimental (véase re- ferencia bibliográfica 1) cuando aún no se dispone de información sobre los efectos secun- darios, las tasas de supervivencia y las tasas de recurrencia de esta nueva medicación. Asi- mismo, las decisiones empresariales normalmente se toman en un entorno en el que los responsables de tomarlas no pueden estar seguros de la futura conducta de los factores que acabarán afectando al resultado de las distintas opciones consideradas.
Cuando un fabricante presenta una oferta para hacerse con un contrato, no está total- mente seguro de cuáles serán los costes totales ni de qué ofertas presentarán los competi- dores. A pesar de esta incertidumbre, debe hacer una oferta. Un inversor no sabe con segu- ridad si los mercados financieros estarán boyantes, estables o deprimidos. No obstante, debe elegir las acciones, los bonos y los instrumentos del mercado de dinero de manera que su cartera esté equilibrada sin saber cómo evolucionará el mercado en el futuro.
Consideremos las siguientes afirmaciones:
«El precio de las acciones de IBM será más alto dentro de seis meses que ahora». «Si el déficit presupuestario público es tan elevado como se prevé, los tipos de interés se mantendrán altos el resto del año». «La renta anual de un titulado universitario será mayor que la renta anual de una per- sona que no tenga estudios universitarios».
Cada una de estas afirmaciones contiene un lenguaje que sugiere la existencia de una cantidad espuria de certeza. En el momento en el que se hicieron las afirmaciones, era im- posible estar  seguro  de que eran ciertas. Aunque un analista crea que lo que ocurrirá en los próximos meses será tal que se prevé que el precio de las acciones de IBM subirá durante ese periodo, no estará seguro de eso. Por lo tanto, las afirmaciones deben modificarse co- mo indican los siguientes ejemplos:
«El precio de las acciones de IBM  probablemente  será más alto dentro de seis meses que ahora». «Si el déficit presupuestario público es tan elevado como se prevé, es  probable  que los tipos de interés se mantengan altos durante el resto del año». «La renta anual de un titulado universitario   probablemente  será mayor que la renta anual de una persona sin estudios universitarios».
Es muy importante pensar bien cómo se dicen las cosas. No es correcto sustituir las afirmaciones injustificadamente precisas por afirmaciones innecesariamente vagas. Al fin y al cabo, ¿qué significa «probablemente» o «es probable que»? Debe ponerse especial cui- dado en expresar las ideas que se pretende expresar, sobre todo cuando se trata de probabi- lidades o cuando hay incertidumbre.
EJERCICIOS
Ejercicios básicos
1.1.   Modifique las afirmaciones siguientes para que re- flejen una posible incertidumbre:
a)   El mejor instrumento para mejorar la cuota de mercado de este producto es una campaña pu- blicitaria destinada al grupo de edad 18-24 años.
2   Estadística para administración y economía
 
b)   Si se presenta una oferta de esta cuantía, será más baja que las del competidor y el contrato estará asegurado.
c)   El coste de la gasolina será más alto en Esta- dos Unidos dentro de 2 meses.
1.2.   Ponga un ejemplo de una decisión de comerciali- zación que debe tomarse en condiciones de incer- tidumbre.
1.3.   Ponga un ejemplo de una decisión financiera que debe tomarse en condiciones de incertidumbre.
1.2. El muestreo
Antes de introducir un nuevo producto en el mercado, su fabricante quiere saber cuál será el nivel probable de demanda y es posible que realice una encuesta de mercado. Lo que le interesa, en realidad, son   todos  los compradores potenciales (la población). Sin embargo, las poblaciones a menudo son tan grandes que es difícil analizarlas; sería imposible o prohibitivo recoger toda la información de una población. Incluso en las circunstancias en las que parece que se dispone de suficientes recursos, las limitaciones de tiempo obligan a examinar un subconjunto (muestra).
Población y muestra
Una población  es el conjunto completo de todos los objetos que interesan a un investigador. El tamaño de la población,  N , puede ser muy grande o incluso infinito. Una   muestra   es un subconjunto observado de valores poblacionales que tiene un tamaño muestral que viene dado por n .
Ejemplos de poblaciones son:
Todos los votantes inscritos en un país. Todos los estudiantes de una universidad. Todas las familias que viven en una ciudad. Todas las acciones que cotizan en una bolsa de valores. Todas las reclamaciones que recibe en un año dado una compañía de seguros médicos. Todas las cuentas pendientes de cobro de una empresa.
Nuestro objetivo final es hacer afirmaciones basadas en datos muestrales que tengan al- guna validez sobre la población en general. Necesitamos, pues, una muestra que sea repre- sentativa de la población. ¿Cómo podemos lograrlo? Uno de los principios importantes que debemos seguir en el proceso de selección de la muestra es la aleatoriedad.
Muestreo aleatorio
El muestro aleatorio simple  es un método que se emplea para seleccionar una muestra de  n 
objetos de una población en el que cada miembro de la población se elige estrictamente al azar, cada miembro de la población se elige con la misma probabilidad y todas las muestras posibles de un tamaño dado,  n , tienen la misma probabilidad de ser seleccionadas. Este méto- do es tan frecuente que generalmente se suprime el adjetivo  simple  y la muestra resultante se denomina  muestra aleatoria.
El muestreo se utiliza mucho en todas las áreas de los negocios, así como en otras dis- ciplinas. Para averiguar si un proceso de producción está funcionando correctamente, se se- lecciona una muestra de bienes producidos. Las auditorías de las cuentas pendientes de co- bro generalmente se basan en una muestra. Durante los años de elecciones presidenciales, se hacen estimaciones de las preferencias de los votantes a partir de muestras de votantes;
Capítulo 1. ¿Por qué estudiar estadística?   3
 
también puede hacerse una encuesta a la salida de los colegios electorales para predecir qué candidato obtendrá más votos. Sin embargo, tomar una muestra es meramente un me- dio para llegar a un fin. Necesitamos estudiar estadística,   no para hacer afirmaciones so-
bre la muestra sino,  más bien,  para extraer conclusiones sobre la población en general. La estadística es el estudio de cómo se toman decisiones sobre una población cuando la infor- mación procede de una muestra. Siempre quedará alguna incertidumbre.
Supongamos que queremos saber cuál es la edad media de los votantes de un país. Es evidente que el tamaño de la población es tan grande que sólo podríamos tomar una mues- tra aleatoria, por ejemplo, 500 votantes, y calcular su edad media. Como esta media se ba- sa en datos muestrales, se llama   estadístico. Si pudiéramos calcular la edad media de toda la población, la media resultante se llamaría  parámetro. En este libro veremos cómo se to- man decisiones sobre un parámetro, basándose en un estadístico. Debemos darnos cuenta de que siempre habrá una cierta incertidumbre, ya que no se conoce el valor exacto del parámetro.
Parámetro y estadístico
Un parámetro  es una característica específica de una población. Un  estadístico  es una carac- terística específica de una muestra.
EJERCICIOS
Ejercicios básicos
1.4.  Ponga un ejemplo de un parámetro en cada una de las siguientes poblaciones:
a)   Las rentas de todas las familias que viven en una ciudad.
b)   Los rendimientos anuales de todas las acciones que cotizan en una bolsa de valores.
c)   Los costes de todas las reclamaciones que reci- be en un año dado una compañía de seguros médicos.
d)  Los valores de todas las cuentas pendientes de cobro de una empresa.
1.5.  Su universidad ha encuestado a sus estudiantes pa- ra averiguar el tiempo semanal medio que dedican a navegar por Internet.
a)  ¿Cuál es la población? b)  ¿Cuál es la muestra? c)  ¿Cuál es el estadístico? d)  ¿Es el valor de 6,1 horas un parámetro o un es-
tadístico?
1.6.  Una compañía aérea sostiene que menos de un 1 por ciento de los vuelos programados que despe- gan del aeropuerto de Nueva York sale tarde. Se ha observado que el 1,5 por ciento de una muestra aleatoria de 200 vuelos salió más tarde de la hora prevista.
a)  ¿Cuál es la población? b)  ¿Cuál es la muestra? c)   ¿Cuál es el estadístico? d)  ¿Es 1,5 por ciento un parámetro o un estadís-
tico?
1.3. Estadstica descriptiva e inferencial
Para pensar en términos estadísticos hay que seguir una serie de pasos que van desde la definición del problema hasta la toma de decisiones. Una vez identificado y definido el problema, se recogen datos producidos mediante diversos procesos de acuerdo con un dise- ño y se analizan utilizando uno o más métodos estadísticos. De este análisis se obtiene in- formación. La información se convierte, a su vez, en conocimiento, utilizando los resulta- dos de las experiencias específicas, la teoría y la literatura y aplicando métodos estadísticos adicionales. Para convertir los datos en un conocimiento que lleva a tomar mejores decisio- nes se utiliza tanto la estadística descriptiva como la inferencial.
4   Estadística para administración y economía
 
Estadística descriptiva e inferencial
La estadística descriptiva  está formada por los métodos gráficos y numéricos que se utilizan para resumir y procesar los datos y transformarlos en información. La  estadística inferencial constituye la base para hacer predicciones, previsiones y estimaciones que se utilizan para transformar la información en conocimiento.
Descripción de los datos
En el ejemplo 1.1 vemos una tabla de la producción diaria de una fábrica de cereales.
EJEMPLO 1.1.   Producción de cereales (estadística descriptiva)
Un jefe de producción de Cereales de Trigo formó un equipo de empleados para estu- diar el proceso de producción de cereales. Durante la primera fase del estudio, se pesó una selección aleatoria de cajas y se midió la densidad del producto. A continuación, el
 jefe quería estudiar datos relacionados con las pautas de producción diaria. Se hallaron los niveles de producción (en miles) de un periodo de 10 días. Represente estos resulta- dos gráficamente y comente sus observaciones:
Día 1 2 3 4 5 6 7 8 9 10 Cajas (miles) 84 81 85 82 85 84 109 110 60 63
Solución
En la Figura 1.1, el jefe de producción puede identificar los días de baja producción, así  como los días de mayor producción.
Producción diaria de cereales
Día
   C   a    j  a   s    (  m    i   l  e   s    )
Figura 1.1.   Producción diaria de cereales de trigo.
No parecía que hubiera mucha diferencia en el número de cajas producidas en los seis primeros días. Había variaciones de un día a otro, pero los seis puntos tenían valo- res numéricos muy parecidos. Sin embargo, en los días 7 y 8 el nivel de producción pa- recía que era más alto. En cambio, en los días 9 y 10 parecía que era más bajo. Basán- dose en estas observaciones, el equipo intentó identificar las causas por las que la productividad era más alta y más baja. Por ejemplo, tal vez en los días 9 y 10 estuvieran ausentes trabajadores clave o hubiera cambiado el método de producción o hubieran cambiado las materias primas. También se podrían identificar las causas por las que aumentó la productividad en los días 7 y 8.
Capítulo 1. ¿Por qué estudiar estadística?   5
 
Realización de inferencias
La estadística inferencial es un proceso, no un mero resultado numérico. Este proceso pue- de consistir en una estimación, un contraste de hipótesis, un análisis de relaciones o una predicción. En primer lugar, podemos querer  estimar un parámetro. Supongamos que Flo- rin’s Flower Mart quiere desarrollar una nueva estrategia de comercialización. Podría ser útil la información sobre los hábitos de gasto de los clientes de la floristería. Florin puede querer:
Estimar la edad  media  de los clientes de la tienda. Estimar la diferencia entre la cantidad media que los clientes cargan a una Visa y la cantidad media que cargan a American Express. Estimar la proporción de clientes que están insatisfechos con el sistema de reparto de la tienda.
En segundo lugar, podemos querer   contrastar una hipótesis   sobre un parámetro. Por ejemplo, Florin puede querer:
Contrastar si los clientes tienen este año una preferencia por el color de las rosas dis- tinta a la del año pasado. Contrastar si menos del 25 por ciento de los clientes de la tienda son turistas. Contrastar si las ventas son mayores los fines de semana que el resto de los días de la semana. Contrastar si la cantidad  media  que gastaron los clientes en su última compra superó los 40 $.
Las respuestas a estos tipos de preguntas pueden ayudar a Florin a lanzar una campaña publicitaria que le permita reducir los costes, incrementar los beneficios y aumentar la sa- tisfacción de los clientes.
En tercer lugar, podemos querer  analizar las relaciones   entre dos o más variables. El director financiero de General Motors quiere tomar decisiones estratégicas que afectan a toda la compañía. En esos casos, puede utilizar series de datos macroeconómicos de los que puede disponerse en fuentes como el Bureau of Economic Analysis del Departamento de Comercio de Estados Unidos para analizar las relaciones entre variables como el pro- ducto interior bruto, el tipo de interés, la renta per cápita, la inversión total y la oferta mo- netaria, que indican la situación general de la economía nacional. El director financiero puede hacerse las siguientes preguntas:
¿Influye la tasa de crecimiento de la oferta monetaria en la tasa de inflación? Si General Motors sube un 5 por ciento el precio de los automóviles de tamaño inter- medio, ¿cómo afectará la subida a las ventas de estos automóviles? ¿Afecta la legislación sobre el salario mínimo al nivel de desempleo?
¿Cómo se comienza a responder a la pregunta sobre el efecto que puede producir una subida de los precios en la demanda de automóviles? La teoría económica básica nos dice que, manteniéndose todo lo demás constante, una subida del precio va acompañada de una reducción de la cantidad demandada. Sin embargo, esa teoría es puramente cualitativa. No nos dice   cuánto  disminuye la cantidad demandada. Para avanzar más, hay que recoger in- formación sobre cómo ha respondido la demanda a las variaciones del precio en el pasado y evaluarla. Estudiando estadística inferencial, aprenderemos a recoger información y a analizar relaciones.
En cuarto lugar, podemos necesitar   predecir, es decir, hacer predicciones fiables. Las decisiones de inversión deben hacerse mucho antes de que pueda llevarse un nuevo
6   Estadística para administración y economía
 
producto al mercado y, evidentemente, es deseable tener predicciones de la situación en la que se encontrará probablemente el mercado dentro de unos años. Cuando los productos están consolidados, las predicciones sobre las ventas a corto plazo son importantes para decidir los niveles de existencias y los programas de producción. Las predicciones de los futuros tipos de interés son importantes para una empresa que tiene que decidir si emite o no nueva deuda. Para formular una política económica coherente, el gobierno necesita pre- dicciones de los resultados probables de variables como el producto interior bruto. Las pre- dicciones de los futuros valores dependen de las regularidades descubiertas en la conducta anterior de estas variables. Por lo tanto, se recogen datos sobre la conducta anterior de la variable que va a predecirse y sobre la conducta de otras variables relacionadas con ella. Utilizaremos la estadística inferencial para analizar esta información y sugerir entonces las tendencias futuras probables.
EJERCICIOS
Ejercicios básicos
1.7.  Suponga que es dueño de una tienda de alimenta- ción.
a)   Ponga un ejemplo de una pregunta que podría responderse utilizando la estadística descriptiva.
b)   Ponga un ejemplo de una pregunta en la que sería útil estimar un parámetro.
c)   Ponga un ejemplo de una pregunta sobre una posible relación entre dos variables que tienen interés para su tienda de alimentación.
d)   Ponga un ejemplo de una cuestión en la que hay que hacer una predicción.
1.8.  Averigue si debe utilizarse la estadística descripti- va o la inferencial para obtener la siguiente infor- mación:
a)   Un gráfico que muestra el número de botellas defectuosas producidas durante el turno de día a lo largo de una semana.
b)   Una estimación del porcentaje de empleados que llegan tarde a trabajar.
c)   Una indicación de la relación entre los años de experiencia de los empleados y la escala sa- larial.
RESUMEN
Las decisiones deben tomarse en condiciones de incer- tidumbre. Todas las áreas de negocios, así como otras disciplinas, utilizan la estadística para tomar esas deci- siones. Los contables pueden necesitar seleccionar muestras para realizar auditorías. Los inversores finan- cieros utilizan la estadística para comprender las fluc- tuaciones del mercado y elegir entre varias inversiones de cartera. Los directivos que quieren saber si los clien- tes están satisfechos con los productos o los servicios de su compañía pueden utilizar encuestas para averi- guarlo. Los ejecutivos de marketing pueden querer in-
formación sobre las preferencias de los clientes, sus há- bitos de compra o las características demográficas de los compradores por Internet. En cada una de estas si- tuaciones, debemos definir meticulosamente el proble- ma, averiguar qué datos se necesitan, recogerlos, resu- mirlos y hacer inferencias y tomar decisiones basadas en los datos obtenidos. La teoría estadística es esencial desde la definición inicial del problema hasta la deci- sión final y puede llevar a reducir los costes, a obtener más beneficios, a mejorar los procesos y a aumentar la satisfacción de los clientes.
TÉRMINOS CLAVE
muestra, 3 muestra aleatoria, 3 muestreo aleatorio simple, 3
parámetro, 4 población, 3
 
EJERCICIO Y APLICACIÓN DEL CAPÍTULO
1.9.   Se hizo a una muestra aleatoria de 100 estu- diantes universitarios una serie de preguntas para obtener datos demográficos sobre su nacionalidad, la especialización cursada, el sexo, la edad, el cur- so en el que están y su nota media hasta ese mo- mento. También se les hizo otras preguntas sobre su grado de satisfacción con el aparcamiento del campus universitario, las residencias del campus y los comedores del campus. Las respuestas a estas preguntas sobre su satisfacción se midieron en una escala de 1 a 5, donde 5 era el nivel de satisfac- ción más alto. Por último, se les preguntó si, cuan-
do se graduaran, tenían intención de seguir estu- dios de postgrado en un plazo de 5 años (0: no; 1: sí). Estos datos se encuentran en el fichero de da- tos  Findstad and Lie Study.
a)  Ponga un ejemplo de cómo se aplica la estadís- tica descriptiva a estos datos.
b)  Ponga un ejemplo de una pregunta que conlle- ve una estimación a la que podría responderse por medio de la estadística inferencial.
c)   Ponga un ejemplo de una relación posible entre dos variables.
Bibliografa
1. The North American Fareston versus Tamoxifen Adjuvant Trial for Breast Cancer. www.naftatrial.com.
8   Estadística para administración y economía
 
 Esquema del capítulo
2.1. Clasificación de las variables Categóricas o numéricas Niveles de medición
2.2. Gráficos para describir variables categóricas Tablas Gráficos de barras y gráficos de tarta Diagramas de Pareto
2.3. Gráficos para describir datos de series temporales 2.4. Gráficos para describir variables numéricas
Distribuciones de frecuencias Histogramas y ojivas Diagramas de tallo y hojas
2.5. Tablas y gráficos para describir relaciones entre variables Diagramas de puntos dispersos Tablas cruzadas
2.6. Errores en la presentación de datos Histogramas engañosos Gráficos de series temporales engañosos
Introducción
Una vez que definimos con cuidado un problema, necesitamos recoger datos. A menudo el número de observaciones recogidas es tan grande que los resultados efectivos del estudio no están claros. Nuestro objetivo en este capítulo es resumir los datos de mane- ra que tengamos una imagen clara y precisa. Queremos reducir lo más posible una ma- sa de datos, evitando al mismo tiempo la posibilidad de ocultar características importan- tes por reducirlos excesivamente. Por desgracia, no existe una única «manera correcta» de describir los datos. La línea de ataque adecuada normalmente es específica de cada problema y depende de dos factores: el tipo de datos y el fin del estudio.
Se ha dicho que una imagen vale más que mil palabras. Asimismo, un gráfico vale más que mil cifras. En este capítulo, introducimos tablas y gráficos que nos ayudan a comprender mejor los datos y que constituyen una ayuda visual para tomar mejores decisiones. Los informes mejoran con la inclusión de tablas y gráficos adecuados, como distribuciones de frecuencia, gráficos de barras, gráficos de tarta, diagramas de Pareto, gráficos de series temporales, histogramas, diagramas de tallo y hojas u ojivas. La vi- sualización de los datos es importante. Siempre debemos preguntarnos qué sugiere el gráfico sobre los datos, qué es lo que vemos.
 
2.1. Clasificación de las variables
Las variables pueden clasificarse de varias formas. Uno de los métodos de clasificación se refiere al tipo y la cantidad de información que contienen los datos. Los datos son categóri- cos o numéricos. Otro método consiste en clasificar los datos por niveles de medición, dan- do variables cualitativas o cuantitativas.
Categóricas o numéricas
Las   variables categóricas  producen respuestas que pertenecen a grupos o categorías. Por ejemplo, las respuestas a preguntas sí / no son categóricas. Las respuestas a «¿Tiene usted teléfono móvil?» y «¿Ha estado alguna vez en Oslo?» se limitan a un sí o un no. Una com- pañía de seguros médicos puede clasificar las reclamaciones incorrectas según el tipo de errores, como los errores de procedimiento y diagnóstico, los errores de información al pa- ciente y los errores contractuales. Otros ejemplos de variables categóricas son las preguntas sobre el sexo, el estado civil y la carrera universitaria. A veces, las variables categóricas permiten elegir entre varias opciones, que pueden ir desde «totalmente en desacuerdo» has- ta «totalmente de acuerdo». Consideremos, por ejemplo, una evaluación del profesorado en la que los estudiantes tienen que responder a afirmaciones como «El profesor de este curso es un buen profesor» (1: totalmente en desacuerdo; 2: un poco en desacuerdo; 3: ni de acuerdo ni en desacuerdo; 4: un poco de acuerdo; 5: totalmente de acuerdo).
Las   variables numéricas pueden ser variables discretas o variables continuas. Una  va-
riable numérica discreta puede tener (pero no necesariamente) un número finito de valo- res. Sin embargo, el tipo más frecuente de variable numérica discreta con el que nos en- contraremos produce una respuesta que proviene de un proceso de recuento. Ejemplos de variables numéricas discretas son el número de estudiantes matriculados en una clase, el número de créditos universitarios obtenidos por un estudiante al final de un cuatrimestre, el número de acciones de Microsoft que contiene la cartera de un inversor y el número de reclamaciones de indemnizaciones presentado tras un huracán.
Una variable numérica continua puede tomar cualquier valor de un intervalo dado de números reales y normalmente proviene de un proceso de medición (no de recuento). Ejemplos de variables numéricas continuas son la altura, el peso, el tiempo, la distancia y la temperatura. Una persona puede decir que mide 1,89 metros, pero en realidad puede te- ner una estatura de 1,81, 1,79 o algún otro número similar, dependiendo de la precisión del instrumento utilizado para medir la estatura. Otros ejemplos de variables numéricas conti- nuas son el peso de las cajas de cereales, el tiempo que se hace una persona en una carrera y la distancia entre dos ciudades. En todos los casos, el valor podría desviarse dentro de un cierto margen, dependiendo de la precisión del instrumento de medición utilizado. En las conversaciones diarias tendemos a truncar las variables y a tratarlas como si fueran varia- bles discretas sin pensarlo ni siquiera dos veces. Sin embargo, la diferencia es muy impor- tante en estadística, ya que es uno de los factores de los que depende que un método esta- dístico sea mejor que otro en un determinado caso.
Niveles de medición
También podemos dividir los datos en  cualitativos y  cuantitativos. Con datos cualitativos, la «diferencia» entre los números no tiene ningún significado mensurable. Por ejemplo, si a un jugador de baloncesto se le asigna el número «20» y a otro el número «10», no pode-
10   Estadística para administración y economía
 
mos extraer la conclusión de que el primero es el doble de bueno que el segundo. Sin em- bargo, con datos cuantitativos la diferencia entre los números tiene un significado mensura- ble. Cuando un estudiante obtiene una puntuación de 90 en un examen y otro obtiene una puntuación de 45, la diferencia es mensurable y tiene un significado.
Veremos que los datos cualitativos pueden ser niveles de medición nominales y ordina- les. Los datos cuantitativos pueden ser niveles de medición basados en intervalos y en ra- zones.
Los niveles de medición nominales y ordinales se refieren a los datos que se obtienen con preguntas categóricas. Las respuestas a preguntas sobre el sexo, el país de origen, la afiliación política y la propiedad de un teléfono móvil son  nominales. Se considera que los datos nominales son el tipo de datos más bajo o más débil, ya que la identificación numéri- ca se elige estrictamente por comodidad.
Los valores de las variables nominales son palabras que describen las categorías o cla- ses de respuestas. Los valores de la variable sexo son hombre y mujer; los valores de «¿Ha estado alguna vez en Oslo?» son «sí» y «no». Asignamos arbitrariamente un código o un número a cada respuesta. Sin embargo, este número no se emplea más que para clasificar. Por ejemplo, podríamos codificar las respuestas sobre el sexo o las respuestas sí / no de la forma siguiente:
1%Hombres 1%Sí  2%Mujeres 2%No
Los datos   ordinales indican el orden que ocupan los objetos y, al igual que en el caso de los datos nominales, los valores son palabras que describen las respuestas. He aquí algu- nos ejemplos de datos ordinales y de códigos posibles:
1.   Valoración de la calidad del producto (1: malo; 2: medio; 3: bueno). 2.   Valoración de la satisfacción con el servicio de comedor de la universidad (1: muy
insatisfecho; 2: moderadamente insatisfecho; 3: ninguna opinión; 4: moderada- mente satisfecho; 5: muy satisfecho).
3.   Preferencia de los consumidores entre tres tipos de bebidas refrescantes (1: el que más se prefiere; 2: segunda opción; 3: tercera opción).
En estos ejemplos, las respuestas son ordinales, es decir, siguen un orden, pero la «diferen- cia» entre ellas no tiene ningún significado mensurable. Es decir, la diferencia entre la pri- mera opción y la segunda puede no ser igual que la diferencia entre la segunda y la tercera.
Los niveles de medición basados en intervalos y en razones se refieren a los datos en una escala ordenada, en la que la  diferencia entre las mediciones tiene un significado. Una escala de intervalos indica el orden y la distancia con respecto a un cero arbitrario medidos en intervalos unitarios. Es decir, se ofrecen datos en relación con un nivel de referencia determinado arbitrariamente. La temperatura es un ejemplo clásico de este nivel de medi- ción; los niveles de referencia determinados arbitrariamente se basan, en general, en los grados Fahrenheit o Celsius. Supongamos que hace 80 grados Fahrenheit en Orlando (Flo- rida) y sólo 20 en St. Paul (Minnesota). Podemos extraer la conclusión de que la diferencia de temperatura es de 60 grados, pero no podemos saber si hace el cuádruple de calor en Orlando que en St. Paul. Supongamos que cuando se estableció la temperatura Fahrenheit, el punto de congelación se fijó en 500 grados. En ese caso, en nuestro ejemplo de la tem- peratura de Orlando y St. Paul, ésta habría sido de 548 grados en Orlando y de 488 en St. Paul (la diferencia sigue siendo de 60 grados). El año es otro ejemplo de un nivel de medi- ción basado en intervalos; en este caso los niveles de referencia se basan en el calendario gregoriano o en el islámico.
Capítulo 2. Descripción gráfica de los datos   11
 
Los datos basados en una escala de razones sí indican tanto el orden como la distancia con respecto a un cero natural y los cocientes entre dos medidas tienen un significado. Una persona que pesa 80 kilos pesa el doble que una que pesa 40; una persona que tiene 40 años es el doble de vieja que una que ti