estadistica general

42
Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos APUNTES DE ESTADÍSTICA DESCRIPTIVA MC Raúl Adalberto Morelos Centro de Estudios Superiores del Estado de Sonora Unidad Académica de San Luis Río Colorado, Sonora México. 1

Upload: piratamorgan2

Post on 12-Jun-2015

31.203 views

Category:

Education


2 download

DESCRIPTION

Apuntes de estadística general

TRANSCRIPT

Page 1: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

APUNTES DE ESTADÍSTICA DESCRIPTIVA

MC Raúl Adalberto MorelosCentro de Estudios Superiores del Estado de Sonora

Unidad Académica de San Luis Río Colorado, Sonora México.

Septiembre 2010

1

Page 2: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

ÍndiceTema Página

Unidad 1Conceptos Básicos ¿Qué es la estadística? ------------------------- 3Datos estadísticos ----------------------------------------------------------- 4Importancia Actual de la estadística ------------------------------------ 4Clases de estadística ------------------------------------------------------- 5Estadística Descriptiva ------------------------------------------------------ 6Estadística Inferencial ------------------------------------------------------- 6Definición del concepto de estadística ---------------------------------- 7Ejercicio 1.1 -------------------------------------------------------------------- 9Ejercicio 1.2 -------------------------------------------------------------------- 9

Unidad 2Métodos estadísticos ------------------------------------------------------- 10Recopilación de datos ------------------------------------------------------ 11Organización de datos ----------------------------------------------------- 12Organización de datos usando arreglos ------------------------------- 15Organización de datos usando una distribución de frecuencias -------------------------------------------------------------------- 15Número de clases o intervalos ------------------------------------------- 16Amplitud de clases ---------------------------------------------------------- 17Tabla de frecuencias -------------------------------------------------------- 18Datos fundamentales de una tabla de frecuencia ------------------- 18Otros métodos de presentación de datos ----------------------------- 19Partes principales de una tabla ------------------------------------------ 20Gráficas estadísticas -------------- ---------------------------------------- 21Representación gráfica de una tabla de frecuencia ---------------- 22Ejercicio 2.1 ------------------------------------------------------------------- 24Medidas de tendencia central para datos NO agrupados --------- 26Medidas de tendencia central para datos agrupados -------------- 27Medidas de dispersión para datos No agrupados ------------------ 28Medidas de dispersión para datos agrupados ----------------------- 29Bibliografía --------------------------------------------------------------------- 29

2

Page 3: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

ESTADÍSTICA GENERAL.

CONCEPTOS BÁSICOS

¿QUE ES LA ESTADÍSTICA?

Con el fin de estudiar inteligentemente el tema de la estadística debemos, en primer lugar, comprender lo que él termino significa en la actualidad así como conocer algo de su origen.

Como en la mayoría de los vocablos, la palabra “estadística” tiene diversos significados para diferentes personas. Cuando la mayoría de la gente escucha el término lo relaciona con cuadros o tablas llenas de cifras sobre nacimientos, muertes, matrimonios, divorcios, accidente de automóviles, etc., que ofrecen, por ejemplo, en los almanaques anuales, y que indudablemente usan el término con toda corrección. A decir verdad, el término en cuestión fue inicialmente usado para tabular las funciones del Estado en lo que respecta a los datos necesarios para una planeación idónea, reglamentaciones y recaudación de impuestos. Los cobradores de impuestos y los encargados de hacer este tipo de análisis eran llamados “estadísticos” por su dedicación a compaginar datos e informes requeridos por el Estado.

En la actualidad, desde luego, la palabra “estadística” se aplica en este primer sentido para casi todo relacionado con los informes basados en hechos y consignados en base a números, lo que comúnmente se denomina: “Hechos y cifras”. Los anunciadores de radio y televisión nos informan que “en unos cuantos minutos darán la estadística del juego ...”y los periódicos con frecuencia publican artículos a cerca de concursos de belleza en los cuales brindan las “estadísticas” de las concursantes.

Sin embargo, el término tiene otros significados y la gente que no esta familiarizada con la materia los desconoce. La estadística es una rama del conocimiento el campo de las matemáticas aplicadas, que utiliza sus propios símbolos, términos, contenido, teoremas y técnicas. Cuando se estudia la “estadística” normalmente se pretende dominar algunas de estas técnicas.

Para todos aquellos ya iniciados en los misterios de campo de las estadísticas, el vocablo tiene una segunda aceptación; las estadísticas son cantidades que han sido calculadas con datos de muestreo: una sola cantidad así calculada se denomina “estadística”. Por ejemplo, la media de la muestra es una estadística, así como también lo son la mediana de la muestra y el modo. La varianza de la muestra es una estadística, como también lo es la gama de la muestra. El coeficiente de correlación de la muestra es asimismo una estadística.

La estadística está desarrollada para tratar con datos numéricos o información cuantitativa. La palabra "estadística", por lo tanto ha sido ampliamente referida ya sea a la información cuantitativa misma como a los métodos que tratan con la información. Los estadísticos prefieren llamar a la información cuantitativa Datos Estadísticos y a los métodos que tratan con la información los Métodos Estadísticos.

Por ESTADÍSTICA debemos entender que son los métodos por medio de los cuales podemos recolectar, organizar, presentar y analizar datos numéricos de un conjunto de individuos permitiéndonos extraer conclusiones válidas y efectuar decisiones lógicas basadas en dicho análisis.

Los DATOS son agrupaciones de cualquier número de observaciones relacionadas. Para que los datos sean útiles, las observaciones deben estar organizadas en tal forma que se puedan identificar tendencias y llegar a conclusiones lógicas.

3

Page 4: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

DATOS ESTADÍSTICOS

La información cuantitativa apropiada para el análisis estadístico debe ser un conjunto (o conjuntos) de números que muestren relaciones significativas. En otras palabras, los datos Estadísticos son números que pueden ser comparados, analizados e interpretados.

Un número aislado que no se compara o que no muestra relación significativa con otro número no es dato estadístico. Por ejemplo: Las edades de 1000 estudiantes son datos estadísticos, puesto que las edades pueden ser comparadas y analizadas, y los resultados de los análisis pueden ser interpretados.

El área de la cual los datos estadísticos son recopilados, se le conoce como población o universo.

Si deseamos tener las edades de 25 estudiantes en la clase de Biometría, podemos simplemente preguntar a cada estudiante su edad: así tenemos un conjunto completo de datos. Sin embargo recopilar tales datos de una población finita pero grande es algunas veces imposible o impráctico. A fin de evitar la tarea imposible o impráctica, usualmente se extrae una muestra de elementos representativos de la población. La muestra entonces, utilizada para el estudio estadístico y los resultados de la muestra son usados como las bases para describir, estimar o predecir las características de la población.

Podemos resumir los significados del término “Estadística” como sigue:

1. La acepción publica de cifras y hechos, gráficas y mapas. El término en este sentido se usa en plural.

2. La materia propiamente dicha, con su terminología, metodología y conocimientos particulares. Bajo este concepto el término se usa en singular.

3. Cantidades calculadas sobre datos de muestreo, en cuyo caso el término se usa en plural.

IMPORTANCIA ACTUAL DE LA ESTADÍSTICA

La aplicación de las técnicas estadísticas se ha extendido tanto, y la influencia de la estadística en nuestra vida es tan grande, que difícilmente podemos ponderarla lo bastante.

Nuestra abundancia agrícola actual se puede explicar parcialmente gracias a la aplicación de la estadística a los planos y a los análisis de los experimentos agrícolas. Este es un campo en el cual la técnica estadística se utilizó relativamente al principio. Algunas de las preguntas que los métodos de la estadística ayudan a contestar son: ¿Qué clase de maíz da los mejores rendimientos? ¿Qué clase de mezcla alimenticia se debe dar a las gallinas para que obtengan el mayor peso? ¿Qué clase de mezcla de semillas de pasto da mayor número de toneladas de forraje por hectárea? Todas estas preguntas y cientos mas nos afectan a todos en forma directa a través del mercado domestico.

La metodología de la estadística también se usa constantemente en la investigación médica y farmacéutica. La eficacia de nuevos medicamentos se determina por medio de experimentos realizados primero en animales y, posteriormente, en seres humanos. Los adelantos de la investigación médicas y las nuevas drogas nos afectan casi a todos.

La estadística también es empleada por los gobiernos. La información económica es objeto de estudio y afecta la política del gobierno en lo que respecta a los impuestos y a partidas asignables a obras públicas (tales como caminos, presas, etc.), a fondos para la asistencia pública, y otros. La estadística

4

Page 5: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

del desempleo influye incrementando los esfuerzos para disminuir el porcentaje correspondiente. Los métodos estadísticos se aprovechan para evaluar el funcionamiento de todo tipo de equipo militar, desde las balas para las pistolas hasta enormes proyectiles dirigidos. La teoría de las probabilidades y la estadística (especialmente un nuevo campo llamado teoría estadística de la toma de decisiones) se usan como ayuda para tomar decisiones sumamente importantes en los altos niveles.

En cuanto a la industria privada, el empleo de las estadísticas es casi tan importante en sus efectos como en el sector gubernamental. Se usa las técnicas estadísticas para el control de calidad de los productos en proceso y para evaluar la aceptación de los nuevos productos que se van a lanzar al mercado. La estadística se emplea en el mercado, en las decisiones para la ampliación de los negocios, en el análisis de la eficacia de la publicidad, etc. Las compañías de seguros se basan en las estadísticas para fijar sus tarifas a un nivel realista. La lista sería interminable. La estadística se emplea en la geología, biología, psicología, sociología; en todo sector en el que las decisiones deben de hacerse a base de los datos o informes incompletos. Se usan también en pruebas educacionales, para medidas de seguridad en la ingeniería. La meteorología, la ciencia de la predicción del tiempo, también esta usando la estadística actualmente.

Aún hay sectores aparentemente heterogéneos que las emplean. ¿Quién habría supuesto que las estadísticas ayudaran a un erudito o a un investigador histórico a determinar quien es el autor de obras en disputa? En este particular, creemos que el ejemplo mas conocido es el del empleo de las estadísticas para establecer la prolongada controversia sobre quien fue el autor de los ensayos literarios en los “Federalist Papers”.

En planos menores, se han hecho estudios estadísticos sobre el efecto que la luna llena tiene la pesca de las truchas; sobre cual sería el tipo más adecuado del vaso para el agua de los restaurantes; así como la estrategia óptima para juegos de destreza y azar, tales como el bridge, los solitarios, el veintiuno, el béisbol, etc.

No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todo y en cada uno de nosotros. Los resultados de los estudios estadísticos se pueden ver, aunque quizás no se comprendan, al recibir nuestros sueldos, en los pagos de pensiones, del seguro social, los premios de las primas de seguros, en nuestra satisfacción al consumir diversos productos y en nuestra propia salud.

CLASES DE ESTADÍSTICA

La estadística normalmente se divide en dos grandes categorías: La estadística DESCRIPTIVA y la estadística INFERENCIAL.

Como complemento a las breves consideraciones de los elementos básicos de la probabilidad, hay dos clases de estadísticas tratadas en este libro. El nombre que naturalmente mas se ajusta a este tipo de estadística es el de estadística descriptiva. La clasificación de datos; el trazo de los histogramas que corresponden a las distribuciones a una población; la representación de los datos por medio de otras clases de gráficas, tales como las lineales, las gráficas en barras, los pictogramas; él cómputo de medidas muestrales, medianas y modos; él cómputo de varianzas, las medidas de las desviaciones absolutas y de la gama; todas estas operaciones se refieren a la estadística descriptiva. La labor estadística ejecutada en el siglo XIX y principios de este siglo, fue en su mayor parte la estadística descriptiva.

5

Page 6: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

ESTADÍSTICA DESCRIPTIVASignificado de Estadística

La palabra “Estadística” ha sido frecuentemente referida a la información cuantitativa o numérica. También ha sido referida ampliamente a los métodos que se tratan con la información. Sin embargo esto debería aclararse y llamar a la información, datos estadísticos y a los métodos, métodos estadísticos.

La estadística descriptiva es la parte de la estadística que agrupa las técnicas apropiadas para la organización, representación y descripción de un conjunto de datos con el propósito de resaltar sus rasgos más importantes y extraer la información esencial que contiene. En nuestros términos, diremos que la estadística descriptiva permite tener una visión “a vuelo de pájaro” de la variable que miden los datos para adelantar conclusiones acerca de ella o preparar un estudio mas fino de la misma para la toma de alguna decisión.

En pocas palabras, la Estadística Descriptiva permite tener una visión “a vuelo de pájaro”, de la variable que miden los datos para adelantar conclusiones acerca de ella o preparar un estudio más fino de la misma, para la toma de alguna decisión.

Ejemplo 1.1 : Supóngase que un profesor que calcula un promedio para una clase de Historia. Como él está usando estadística para describir el comportamiento de esa clase y no para hacer una generalización acerca de varias clases, se puede decir que él está usando estadística descriptiva. Los gráficos, las tablas y mapas que muestren datos en tal forma que sean más fáciles de entender son ejemplos de estadística descriptiva.

ESTADÍSTICA INFERENCIAL Y su significado

La segunda parte importante de la estadística se refiere a la Estadística Inferencial. Antes definimos a la estadística como la ciencia para tomar decisiones ante alguna incertidumbre; esto es, llegar a la mejor resolución sobre bases de una información incompleta. Con el fin de llegar a una decisión sobre una población, se toma una muestra (generalmente de unos cuantos de los miembros) de esa población. Dicha selección se hace, generalmente, al azar, a pesar de que existen varios medios de muestreo. En este libro nos circunscribimos al uso del muestreo al azar. Por lo que dicho término implica, se puede apreciar que se trata de un método de muestreo en los que los elementos que lo integran son seleccionados bajo un proceso que no esta bajo el control del investigador. Se conocen varias definiciones de matemáticas del muestreo del azar, pero nosotros lo aceptaremos como un muestreo en el que cada elemento escogido de la población tiene la misma oportunidad de ser seleccionado, y en el que la selección de cualquier elemento no afecta que se pueda seleccionar cualquier otro.

Sobre la base de un muestreo al azar, inferimos ciertos datos acerca de la población. La inferencia que hacemos acerca de la población sobre bases de este tipo de muestreo se conoce como inferencia estadística. En otras palabras, la inferencia estadística es el empleo de la técnica de muestreo para llegar a determinadas conclusiones acerca de la población de la cual se han obtenido las muestras.

De manera general, la Estadística Inferencial es: la Estadística mediante la cual se obtienen generalizaciones o se toman decisiones en base a una información parcial o incompleta obtenida mediante técnicas descriptivas. Los datos se analizan de una manera más detallada, se interpretan y se infieren.

6

Page 7: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

Si una muestra es representativa de una población, se puede deducir importantes conclusiones acerca de ésta, a partir del análisis e interpretación de la misma.

Ejemplo 1.2: Supóngase ahora que el profesor de Historia decide usar las notaspromedios en una de la clase de Historia para estimar la nota promedio obtenida en los diez grupos del mismo curso de Historia. El proceso para estimar esta nota será un problema de inferencia estadística. Obviamente, cualquier conclusión que realice el profesor acerca de los diez grupos del curso estará basada en una generalización que va más allá de los datos originalmente obtenidos en el curso de Historia. La generalización del profesor puede no ser completamente válida y él debe establecer cuanto tiene de cierto.

Al efectuar una investigación o experimento, es necesario definir qué datos se pretenden obtener de la POBLACIÓN en estudio.

Para ello debemos definir los siguientes conceptos:

POBLACIÓN: Es una agrupación de todos los elementos que se están estudiando y de los cuales se está tratando de obtener conclusiones. Se debe definir esta población para precisar si un elemento que pertenece a la población.

POBLACIÓN FINITA: Cuando una población consta de un número limitado (finito) de elementos. Por ejemplo, si se desea obtener información acerca de la capacidad didáctica de los 40 profesores de una universidad, se obtendrán datos de una población finita.

POBLACIÓN INFINITA: Cuando una población consta de un número ilimitado de elementos. Por ejemplo, la población formada por todos los posibles sucesos (cara, sol) en tiradas sucesivas de una moneda es infinita, puesto que hipotéticamente la moneda puede lanzarse un número infinito de veces.

MUESTRA: Una muestra es una agrupación de algunos elementos de la población, pero no todos. La mayoría de las veces no es posible o práctico observar todos los elementos de la población, en todo caso se toma solo una parte de ella.

PARÁMETRO: Cuando una medida se calcula a partir de los datos de una población.

ESTADÍSTICO: Cuando una medida se calcula a partir de los datos de una muestra.

MEDIDA ESTADÍSTICO (MUESTRA) PARAMETR0 (POBLACIÓN )Media aritmética (Promedio) x Desviación Estándar S Número de datos o elementos n N

VARIABLE: Es una característica que toma valores diferentes en personas, lugares y cosas diferentes.

VARIABLE ALEATORIA: Son variables cuyos valores son el resultados de factores fortuitos.

VARIABLE ALEATORIA DISCRETA: Se caracteriza por saltos o interrupciones en los valores que esta puede obtener (estos valores se asocian a cualquier valor entero).

Ejemplos 1.3: El número de automóviles vendidos en un mes. El número de clientes esperando servicio en la caja de un supermercado. El número de tubos electrónicos de T.V. producidos en una hora determinada.

7

Page 8: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

VARIABLE ALEATORIA CONTINUA: Es aquella que puede tomar cualquier valor de entre todos los contenidos en un intervalo de recta.

Ejemplo 1.4: La cantidad de energía eléctrica producida en una planta hidroeléctrica en un día. El tiempo necesario para completar el ensamblaje de un artículo en una planta. La cantidad de petróleo bombeado cada hora en un pozo.

La estadística está desempeñando un importante papel ascendente en casi todas las facetas del progreso humano. Anteriormente solo era aplicada a los asuntos del Estado, ahora su influencia se extiende a la agricultura, biología, negocios, química, comunicaciones, economía, educación, electrónica, medicina, física, ciencias políticas, psicología, sociología, y otros campos de la ciencia. Este desarrollo de la estadística está ligada a los métodos científicos en la toma, organización, presentación y análisis de los datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.

No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todos y cada uno de nosotros. Los resultados estadísticos se pueden ver, aunque quizás no se comprendan, al recibir nuestro salario, en los pagos de pensiones, los premios de las primas de seguro, en nuestra satisfacción al consumir diversos productos y en nuestra propia salud.

8

Page 9: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

EJERCICIOS 1.1: ESTADÍSTICA GENERAL.

1) Identifique las variables aleatorias siguientes como discretas o continuas.

a) El número de transistores defectuosos en un embarque de 10,000 transistores.b) El número de robos ocurridos en un almacén en un período de tiempo.c) La cantidad de gasolina consumida por un vehículo en una prueba de 100 km.d) Las ventas brutas de un supermercado en un día determinado.e) El número de pólizas vendidas en una determinada semana por un agente de seguros.f) La demanda diaria de energía eléctrica en una determinada ciudad.g) La duración de una bombilla eléctrica observada en un experimento.

EJERCICIOS 1.2: ESTADÍSTICA DESCRIPTIVA E INFERENCIALIdentifique, en dónde se está utilizando la estadística descriptiva y dónde la inferencial.

1.- En una prueba de aptitudes, tres trabajadores recibieron calificaciones de 90, 85 y 80. Tres trabajadoras recibieron calificaciones de 89, 86 y 92. De las siguientes declaraciones realizadas con base en estas calificaciones identifíquense aquellas que se derivan de métodos descriptivos y aquellos que se derivan de inferencia estadística.

a) La calificación promedio de los tres trabajadores es 85, y la calificación promedio de las tres trabajadoras es 89.

b) La aptitud promedio de todas las trabajadoras es probablemente mayor que la de los trabajadores.

c) En las siguientes pruebas de aptitudes, probablemente los trabajadores reciben calificaciones mas bajas que las trabajadoras.

2.- Tres bombillas de marca A dejaron de funcionar después de 1100, 900 y 1000 hrs. de uso continuo. Cuatro bombillas de la marca B dejaron de funcionar después de 1050, 960, 1070 y 840 hrs. de uso continuo. Se llega a las siguientes conclusiones, ¿Cuáles de ellas provienen de la estadística descriptiva y cuáles de la inferencial?

a) La duración promedio de las tres bombillas marca A es de 1000 hrs mientras que la duración promedio de las cuatro bombillas marca B es de 980 hrs.

b) La duración promedio de todas las bombillas marca A es mayor que todas las bombillas de la marca B.

c) La diferencia entre los dos promedio es de 20. d) La diferencia entre los dos promedio es demasiado pequeña para llegar a la conclusión de que

las bombillas marca A son mejores que la marca B. e) Si se selecciona y prueba otra bombilla de marca A, probablemente durará más que el promedio

de las bombillas marca B. f) Usted decide comprar bombillas marca A en vez de bombillas marca B.

9

Page 10: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

Unidad 2:DESCRIPCIÓN DE LOS DATOS.

Cuando los datos están organizados en una forma compactada y fácil de utilizar, se puede obtener información del medio digna de confianza y utilizarla para decisiones inteligentes

MÉTODOS ESTADÍSTICOS

En un estudio estadístico los métodos estadísticos son divididos en cinco pasos básicos.a) Recopilación. d) Análisis.b) Organización. e) Interpretación.c) Presentación.

Estrictamente hablando, no hay línea de división definitiva que separe los cinco pasos básicos. Algunos de los métodos pueden ser usados en más de un paso.

a) RECOPILACIÓN DE DATOSDe acuerdo a la localización de la información los datos estadísticos pueden se clasificados en datos Internos y datos Externos.

DATOS INTERNOS: Es cuando la información cuantitativa es obtenida dentro de la organización que hace el estudio estadístico; Tal como los sueldos de empleados de una lista de pagos, recibos de caja de la oficina de contabilidad de la organización.

DATOS EXTERNOS: Es cuando la información es obtenida fuera de la organización. Los datos externos son usualmente obtenidos de dos maneras:

- Datos publicados: (revistas, periódicos, instituciones de investigación, universidades, publicaciones editadas por gobierno federal, editores privados, etc...)

- Encuestas de datos originales (encuestas, entrevistas, etc..)

1).- Obtención de datos publicados. Los datos publicados pueden ser obtenidos fácilmente si las fuentes de datos son conocidas por el lector.

En relación con esto, es importante conocer las clases de fuentes de datos y las fuentes de datos publicados.

1 .1) FUENTE PRIMARIA Y SECUNDARIA

Las fuentes de datos publicados pueden ser clasificadas en dos clases primarias y secundarias.Una fuente de datos se denomina primaria cuando los datos obtenido de la publicación EDITADA por el recopilador original de los datos.

La fuente llamada secundaria cuando los datos son obtenidos de una reimpresión, la cual es publicada por una organización distinta del recopilador original.

FUENTES DE DATOS PUBLICADOSLos siguientes siete grupos son las fuentes más importantes de datos publicados con relación a las actividades de los negocios y económicos, aunque de ninguna manera puede considerarse como una lista completa de fuentes.

10

Page 11: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

a).- Agencias gubernamentalesb).- Asociaciones empresarialesc).- Revistas y publicaciones periódicas de empresasd).- Periódicos y almanaquese).- Organizaciones privadas de servicio de estadísticaf).- Organizaciones internacionalesg).- Otras organizaciones de negocios y educativas

ELABORACIÓN DE UNA ENCUESTA

El trabajo de elaborar una encuesta esta usualmente limitado por los factores del tiempo, dinero y mano de obra disponible para el estudio.

En vez de recopilar información completa relacionada con el estudio, una muestra consistente de un grupo de elementos representativos es ordinariamente sacada de la fuente de información (población) en una encuesta.

Los métodos más comunes de recopilación de datos a través de muestras son: Observación Directa y Formulación de Preguntas.

OBSERVACIÓN DIRECTA

El método de observación directa puede dar información exacta y es usualmente preferida, ya que puede ser empleado efectiva y económicamente. Sin embargo, está limitado a unos pocos tipos de estudio y es a menudo demasiado inconveniente en observaciones reales de ciertas operaciones.

Ejemplos:a).- Si un investigador desea conocer los precios de menudeo de los alimentos de una ciudad puede ir a un grupo seleccionado de tiendas para observar los precios marcados en los mismos.

b).- Si deseamos conocer el ingreso recibido en una semana por un grupo de taxistas sería muy inconveniente observarlos a ellos. Sería más práctico y fácil obtener los resultados haciéndoles ciertas preguntas.

FORMULACIÓN DE PREGUNTAS

Hay 3 formas de hacer preguntas a fín, de recopilar datos originales.a).- Entrevistas personales b).- Por teléfonoc).- Cuestionario por correo

Al diseñar un cuestionario debemos de tener presente los siguientes puntos:

1).- El número de preguntas deberá ser conservado en un mínimo2).- Las preguntas deberán ser breves y claras3).- Preguntas ofensivas deberán ser evitadas4).- Preguntas que induzcan a una respuesta no deberán ser usadas5).- Las preguntas deberán ser fáciles de contestar 6).- Las preguntas deberán requerir contestaciones simples.

11

Page 12: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

Reglas de Redacción y contenido de las Preguntas:

1.- Facilitar la memoria: No debe preguntarse sobre hechos ocurridos hace mucho tiempo; las preguntas deben limitarse al pasado inmediato (un mes máximo)2.- No deben usarse más palabras de las que sean necesarias (máximo 20 por pregunta).3.- Las palabras empleadas deben ser simples, fáciles de pronunciar y de ser posible de uso común.4.- Deben evitarse al máximo emplear términos comerciales o de negocios y palabras cargadas o insinuantes.

Ej. ¿Verdad que la Compañía X es la mejor de su ramo?

5.- Asimismo al elaborar la pregunta debe tenerse cuidado en no dar la respuesta.

Ej. ¿Asiste usted al cine por lo menos una vez a la semana?

6.- No debe forzarse a la persona a que realice cálculos, complicados porque ésta, tenderá a cansar rápidamente al entrevistado.

Ej. ¿Cuántos Kgrs. de azúcar se consumen en su hogar?

7.- Cuando se tenga que realizar una pregunta que por su naturaleza sea embarazosa o difícil de contestar, es necesario planear cuidadosamente su redacción, para evitar una gran cantidad de contestaciones falsas.

Ej. ¿Cada cuántos días se baña usted?

8.- Al realizar preguntas referidas a tiempos es necesario fijar intervalos adecuados a las posibles contestaciones y la pregunta debe referirse de preferencia a una fecha concreta.

Ej. ¿Cuándo fue la última vez que asistió usted al cine?

9.- Cuando tratan de medirse aspectos relacionados con la calidad de un producto, o bien su sabor, su aroma, su aspecto y otras características similares, es recomendable el uso de respuestas preformuladas, utilizando escalas de conceptos o de valores o una combinación de ambas.

Ej. Excelente 3Muy Bueno 2Bueno 1Regular 0Malo -1Muy Malo -2Pésimo -3

10.- Evitar motivos emocionales o estereotipados, ciertos nombres, expresiones o hechos que son susceptibles de provocar reacciones de tipo Psicológico positivo o negativos y alterar la respuesta.

Ej. El Presidente de la República mencionó en su discurso. ¿Usted qué Opina?En este caso el presidente eclipsa el asunto que se discutía.

12

Page 13: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

11.- Por último es conveniente destacar los siguientes puntos que influyen en forma determinante en la redacción de un buen cuestionario:

No abrumar con palabras altisonantes. Construir las preguntas gramaticalmente breves No usar vulgarismos No someter a negativas dobles. Evitar dobles significados. Evitar preguntas capciosas. Mencionar lo que antecede, siempre que exista la posibilidad de olvido o confusión.

Elementos del Cuestionario.

Reporte: Es una breve introducción al tema, objetivo de la encuesta se usa para crear confianza y cooperación en el encuestado.

Consigna: Es la indicación de como contesta a determinada pregunta, debe ser muy explícita al diseñarse y haber un número máximo e igual de las preguntas.

Por ej. Ponga una cruz en la respuesta que crea, enumere del 1 al 4 etc.

Pregunta introductoria: Deben ser fáciles de contestar, están antes del tema principal y sirven para introducirlo.

Preguntas Básicas: Es el elemento clave del cuestionario aquel están traducida las observaciones de la investigación y deben ser lo suficientemente extensas para que cubra los mismos.

Escala de Sinceridad: Son trampas que se le ponen al encuestado para ver si este dice la verdad, como cuando en el cuestionario se repiten las preguntas y, si estas son cortas deben redactarse de diferente manera la misma pregunta.

Pregunta de Clasificación: Tara de la información sobre el individuo, edad sexo domicilio, no. de hijos, nacionalidad etc., son preguntas de identificación al final del cuestionario por que podrían influir en la respuesta si fueran al principio.

ORGANIZACIÓN DE DATOS ESTADÍSTICOS

Dentro de una organización de datos estadísticos debemos tomar en cuenta:

1).- Crítica y corrección de datos recopilados. Un corrector puede encontrar una o varias de las siguientes cosas que deberían ser corregidas y tratadas.a).- Las respuestas son inconsistentesb).- La escritura no es determinablec).- Las respuestas son incompletasd).- Se necesitan cálculos

2).- Clasificación de datos corregidos. Hay muchas formas de clasificar datos estadísticos en general las clasificaciones pueden ser determinadas de acuerdo a 4 bases:Tiempo, lugar, cantidad y cualidad.

13

Page 14: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

CUALITATIVA.- En esta clasificación la distinción es mas bien de clases que de cantidad. Por ejemplo, cuando los empleados se clasifican en sindicalizados y no sindicalizados, tenemos una diferencia cualitativa. Los agricultores pueden clasificarse en propietario, parcialmente propietarios, administradores y arrendatarios. En hule puede clasificarse en cultivo o silvestre, de acuerdo con su origen.

CUANTITATIVA.- Cuando los valores se modifican con respecto a una característica mensurable, conviene una clasificación cuantitativa. Por ejemplo, las familias pueden clasificarse de acuerdo con él numero de hijos, las empresas industriales, según él número de obreros empleados y también desacuerdo con el valor de los artículos producidos. La mayoría de las distribuciones cuantitativas son distribuciones de frecuencia, que son la forma básica de organización de los datos para sus análisis estadísticos. Los datos clasificados cualitativamente a veces pueden clasificarse de nuevo sobre bases cuantitativas, mediante cambios muy ligeros.

CRONOLÓGICA.- Los datos cronológicos o las series cronológicas contienen cifras relativas a un fenómeno determinados en diversos periodos de tiempo especificados. Por ejemplo, se puede mostrar la cotización diaria de cierre de ciertas acciones durante un periodo de meses o años, puede registrarse el coeficiente anual de natalidad de varios años, puede indicarse la producción mensual de carbón durante un lapso dado de años. Las series cronológicas tiene un cierto modo algún parentesco con las distribuciones cuantitativas, por el hecho de que cada año o mes sucesivo de una serie esta un año o un mes alejado del punto de referencia anterior. Sin embargo, los periodos de tiempo o más bien los acontecimientos, que ocurren dentro de estos periodos difieren cualitativamente entre sí. Ocasionalmente una serie cronológica puede convertirse en una distribución de frecuencias.

GEOGRÁFICA.- La distribución geográfica es esencialmente un tipo de distribución cualitativa, pero en general se considera como una clasificación especial. Por ejemplo, cuando se muestra la población de cada unos de los estados, tenemos datos clasificados geográficamente. Aun cuando existe una diferencia cualitativa entre dos estados cualesquiera, la distinción que se establece no es de clase sino de situación. A veces es posible esperar una distribución geográfica en forma de distribución de frecuencias. 3).- Tabulación de datos clasificados. Después de que se han decidido las clasificaciones adecuadas o deseadas el siguiente paso en la organización de los datos es arreglar la masa de hechos cuantitativos en una forma resumida basadas en las clasificaciones.

Este proceso se llama tabulación son:

1).- Tarjetas de escritura manual2).- Hojas de registro3).- Tarjetas de perforación manual4).- Tarjetas perforadas5).- Procesamiento electrónico de datos

14

Page 15: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

ORGANIZACIÓN DE LOS DATOS USANDO EL ARREGLO.

El ARREGLO de datos es una de las formas más simples de organizar la información, se organizan del valor menor al mayor (en orden ascendente), o del mayor al menor (en orden descendente).

Los arreglos de datos ofrecen varias ventajas sobre los datos en bruto.

- Rápidamente se pueden apreciar los valores menor y mayor en los datos.- Fácilmente se puede dividir los datos en secciones.- Se puede ver si algún valor aparece más de una vez en el arreglo.- Se puede observar la distancia entre valores sucesivos de datos.

A pesar de éstas ventajas, algunas veces el arreglo de datos no es de mucha utilidad. Cuando sea necesario mostrar una gran cantidad de ellos, esto se tornará engorroso, porque se debe hacer la lista de todas las observaciones. Para estos casos se necesita condensar la información y estar en capacidad de usarla para tomar decisiones e interpretarla.

ORGANIZACIÓN DE LOS DATOS USANDO DISTRIBUCIÓN DE FRECUENCIAS

Una manera de simplificar los datos es usar una tabla de frecuencia o distribución de frecuencia. Como se verá, la organización de los datos en una tabla de frecuencia muestra el comportamiento de la distribución de manera más significativa.

La organización de los datos generalmente implica el arreglo de las observaciones en CLASES o INTERVALOS. Al arreglo de los datos para expresar la frecuencia de ocurrencia de las observaciones en cada una de estas clases se conoce como DISTRIBUCIÓN DE FRECUENCIA.

La construcción de una tabla de frecuencia se realiza de una serie de datos, los cuales primeramente son recopilados y posteriormente organizados. La primera forma de organizarlos es dándoles un orden ascendente o descendente. Los datos constituidos de esta manera están en un ARREGLO. Este arreglo puede ser construido mediante el uso de marcas, y el número de veces que un valor está repetido se le llama FRECUENCIA.

Ejemplo 2.1: Calificación final de Estadística de 80 Estudiantes de la carrera de LSCA.

= R E C O P I L A C I O N =

68, 84, 75, 82, 68, 90, 62, 88.3, 76, 93, 73, 79, 88, 73, 60, 93, 72, 53, 85, 7553, 65.5, 75, 87, 74, 62, 95, 78, 62, 72, 66, 78, 82, 75, 94, 77, 69, 74, 68, 6096, 78, 89, 60, 75, 95, 60, 79, 83, 72.6, 79, 60, 67, 97, 78, 85, 76, 65, 71, 7565, 80, 73, 53, 88, 78, 63, 76, 53, 74, 86, 67, 73, 81, 72, 63, 76, 75, 85, 77.8

= O R G A N I Z A C I O N =

53, 53, 53, 53, 60, 60, 60, 60, 60, 62, 62, 62, 63, 63, 65, 65, 65.5, 66, 67, 6768, 68, 68, 69, 72, 72, 72, 72, 72, 72.6, 73, 73, 73, 74, 74, 74, 75, 75, 75, 7575, 75, 75, 76, 76, 76, 76, 77, 77.8, 78, 78, 78, 78, 78, 79, 79, 79, 80, 81, 8282, 83, 84, 85, 85, 85, 86, 87, 88, 88, 88.3, 89, 90, 93, 93, 94, 95, 95, 96, 97

15

Page 16: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

TABLA DE FRECUENCIAS, ARREGO DE FRECUENCIASValor Marca Frecuencia (f)

53 llll 460 llll 562 lll 363 ll 2... ... ...

En la tabla la segunda columna es sólo auxiliar. En la tercera se presenta la Frecuencia de cada dato posible (fi = al número de veces que ocurre la i-ésima observación posible).

La información contenida en la tabla puede ser representada gráficamente en varias formas: gráfica de barras, de líneas, por sectores, etc. El inconveniente de graficar cada dato contenido en la gráfica anterior, es que si el número de datos diferentes es muy grande, se diluye la información. Imagínese un gráfico de 25 o 50 barras. Este inconveniente es superado, al utilizar otras técnicas apropiadas para el tratamiento de datos provenientes de una variable continua.

En el ejempo 2.1 encontramos 80 valores diferentes, distribuídos entre el dato menor (Dm) = 53 y el dato mayor (DM) = 97, como puede verse en la ordenación (organización). Para el tratamiento adecuado, procedemos a agrupar los datos por intervalos de clase de igual longitud, para lo cual necesitaremos saber o calcular el número de intervalos que tendrá nuestra tabla.

NUMERO DE CLASES ó INTERVALOS (k)

No hay un criterio establecido para el número de agrupación de datos ( intervalo de clase) a utilizar. El primer paso para construir una tabla de frecuencia consiste en decidir cuantas CLASES o INTERVALOS DE CLASE se van a utilizar. El número de clases depende del número de datos y del rango de los mismos y de la información que el investigador desea obtener. Entre mayor sea el número de datos, o más amplio el rango de los datos, mayor número de clases se necesitará para dividirlos. Por supuesto, si se tiene sólo 10 datos, deja de tener sentido el hacer 10 clases. Como una norma, los estadísticos usan entre 5 y 20 clases. Menos de 5 clases pueden concentrar la información y más de 20 clases pueden dispersar la información.

Hay muchos libros de texto que recomiendan un sínnumero de formas para determinar el número adecuado de intervalos. Para nosotros debe ser claro que a mayor número de datos resulta adecuado un mayor número de intervalos de clase, por lo que utilizaremos un criterio preciso, (aunque personal), basado en la Regla de Sturges, que consiste en elegir k como el entero impar más cercano a:

k Log N 1 3 3. ( )

Podemos agregar que la experiencia y el uso a que esté destinado el agrupamiento, son criterios determinantes en algunos casos.

La recomendación de elegir un número impar de intervalos es con el fin de mantener la posible simetría de una distribución de datos.

k = Número de clases.N = Número de datos.

16

Page 17: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

Ejemplo 2.2: Para el problema de los 80 estudiantes de estadística Ejemplo 2.1.

k = 1 + 3.3 Log (80) = 7.28 » 7 CLASES (Entero impar más cercano), entonces:k = 7

AMPLITUD DE CLASES.

Debido a que se necesita tener los intervalos de clase de igual tamaño, el número de clases determinará la amplitud ( i ) de cada clase. Para encontrar la amplitud de cada intervalo de clase se utilizan las siguientes ecuaciones:

Rango (R) = DM - Dm = Dato mayor - Dato menor

Para el ejemplo 2.1 tendremos:

R = 97 - 53 = 44 i = 44/ 7 = 6.2857 ~= 6.3 (para datos continuos) i = 7 (para datos discretos)

Si observamos el ejemplo anterior, podemos tomar a 6.2857 pero, resultaría engorroso el trabajar con cuatro dígitos después del punto decimal, por lo que tomaremos la aproximación de 6.3 con ancho del intervalo. Aquí debemos tomar en cuenta que tipo de variable estamos utilizando, o sea, si nuestros datos son discretos o continuos. Pues si fueran datos discretos tomaríamos i = 7, ya que si tomamos el valor 6, no concordaría con el número de intervalos que previamente se habían calculado, (esto lo podemos calcular con un pequeño despeje de i = R/k, lo cual tendríamos k = R/i ), y tendríamos que utilizar un intervalo más para poder “meter” los valores más altos.

Al fijar los limites de clase, es necesario tomar en cuenta que el valor mínimo de los datos debe quedar incluido en el primer intervalo de clase y el valor máximo en el último. Para que el valor mínimo de los datos quede incluido en el primer intervalo de clase, el primer límite inferior de clase deberá escogerse en tal forma que sea igual o menor que él. De la misma manera, para que el valor máximo de los datos quede incluido en el último intervalo de clase, el último límite superior de clase deberá ser igual o mayor que él.

Los intervalos quedarían así:

I1 I2 I3 I4 I5 I6 I7

53.0 59.3 65.6 71.9 78.3 84.6 90.0 97.2

iR

k

Dato Mayor Dato Menor

Numero Intervalos

17

Page 18: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

a , b

para introducir los datos en los intervalos tomaremos el criterio siguiente:

( a, b ) a este intervalo pertenecen todas las observaciones que son estrictamente mayores que a; “a mayor que” y estrictamente menores que b; “b menor que”.

( a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores que a; “a mayor que” y estrictamente menores o iguales que b; “b menor o igual que”.

[ a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores o iguales que a; “a mayor o igual que” y estrictamente menores o iguales que b; “b menor o igual que”.

[ a, b ) a este intervalo pertenecen todas las observaciones que son estrictamente mayores o iguales que a; “a mayor o igual que” y estrictamente menores que b; “b menor que”.

CONSTRUCCIÓN DE UNA TABLA DE FRECUENCIAS.

CLASES

Li - Ls

MARCA DE CLASE

xi

FRECUENCIA

f

FRECUENCIASRELATIVAS

fr

FRECUENCIAACUMULADA

C

53.0 - 59.3 56.15 4 4/80 = 0.05 4

59.3 - 65.6 62.45 13 13/80 = 0.1625 17

65.6 - 71.9 68.75 7 7/80 = 0.0875 24

71.9 - 78.2 75.05 30 30/80 = 0.375 54

78.2 - 84.5 81.35 9 9/80 = 0.1125 63

84.5 - 90.8 87.65 10 10/80 = 0.125 73

90.8 - 97.1 93.95 7 7/80 = 0.0875 80

Suma de frecuencias = f = 80 f r 1.0000

DATOS FUNDAMENTALES DE LA TABLA DE FRECUENCIA.

LÍMITES DE CLASE: Son los valores localizados en los extremos de una clase.

LÍMITE INFERIOR ó LÍMITE REAL INFERIOR (Li) = 53.0

LÍMITE SUPERIOR ó LÍMITE REAL SUPERIOR (Ls) = 59.3

TAMAÑO DE CLASE (i):: Es el recorrido de valores que pueden tomar los elementos de la frecuencia de una clase determinada. Se calcula restando los limites reales.

i = TAMAÑO DE CLASE= Ls - Li = 59.3 -53.0 = 6.3

18

Page 19: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

MARCA DE CLASE (xi) : Es el valor representativo de los elementos de la frecuencia. Se obtiene promediando el límite inferior y superior de una clase.

Marca ClaseLi Ls

2

53 0 59 32

5615. .

.

FRECUENCIA RELATIVA: Es la frecuencia de la clase dividida por la frecuencia total de todas las clases y se expresa generalmente en porcentaje.

fr = FRECUENCIA RELATIVA= 13/80 = 0.1625= 16.25%

FRECUENCIA ACUMULADA: Es la suma de las frecuencias de clase del intervalo en consideración y de los intervalos anteriores.

Ejercicios 2.1: Resolver las siguientes cuestiones:

1.- Si la calificación mínima aprobatoria es de 70, ¿Cuántos alumnos acreditaron?2.- ¿Cuántos alumnos acreditaron con menos de 80 ?3.- Porcentaje de alumnos reprobados.4.- Entre que rango de valores encontramos más calificaciones.5.- Porcentaje de alumnos que obtuvieron 90 o más de calificación.6.- Número de alumnos que obtuvieron una calificación menos de 90.7.- ¿Puede determinarse en la distribución de frecuencia el número de calificaciones con 95.

c) OTROS MÉTODOS DE PRESENTACIÓN DE DATOS:

REPRESENTACIÓN DE DATOS ESTADÍSTICOS

En general hay 3 formas para presentar datos organizados:

a).- Presentación con palabrasb).- Tablas estadísticasc).- Gráficas estadísticas

PRESENTACION CON PALABRAS .

La combinación de cifras y texto no es un sistema muy eficaz ya que es necesario leer, o por lo menos registrar, todo el parrafo antes de que se pueda comprender el significado de todo el conjunto de cifras. Para la mayoría de las personas les resulta difícil aislar las cifras individuales que se presentan. Sin embargo, hay la ventaja de que el autor puede dirigir la atención hacia determinada cifra, haciéndola resaltar, y también puede llamar la atención sobre las comparaciones de importancia.

TABLAS ESTADÍSTICAS .

Las tablas estadísticas pueden ser agrupadas en dos tipos de acuerdo con sus propósitos para los cuales nos sirven:

19

Page 20: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

TABLAS PARA PROPÓSITOS GENERALES:Proporcionan información para referencia o uso general. No se construyen para una exposición específica. En otras palabras, las tablas nos sirven como un depósito de información. Por ejemplo se tiene una tabla titulada "Empleo y Población" que muestra el número de empleados en manufactura, minería, construcción, transporte, comercio al mayoreo y menudeo, gobierno y otras áreas del país. Esta tabla es de propósitos generales, puesto que solamente dice hechos que no son para una discusión particular. Cuando las tablas de propósitos generales son utilizadas por un investigador, son usualmente colocadas en el apéndice del informe para fácil referencia.

TABLAS PARA PROPÓSITOS ESPECIALES.Proporcionan información para una exposición particular. Una tabla para propósitos especiales debería ser diseñada de tal forma que un lector pueda dirigirse fácilmente a la tabla para comparación, análisis o énfasis concerniente a la exposición particular. La tabla debe ser construida de una manera breve y simple.

PARTES PRINCIPALES DE UNA TABLA

TÍTULO: Es una descripción del contenido de la tabla. Debe ser compacto y completo. Un título usualmente indica: ¿Qué son los datos incluidos? ¿Dónde está el área representada por los datos? ¿Cómo están los datos clasificados? ¿Cuándo ocurrieron los datos?

ENCABEZADO: Es el titulo de la parte superior de una columna o columnas. La tabla más simple tiene solamente dos columnas y dos encabezados: uno para los conceptos y otro para los datos. Sin embargo, muchas tablas tiene mas de dos encabezados y algunas veces tienen encabezados principales y subencabezados.

NOTA DE ENCABEZADO:

Son usualmente escritas justamente arriba de los encabezados y abajo del titulo. Son usadas para explicar ciertos puntos relacionados con la tabla completa que no han sido incluidos en el titulo o en el encabezado ni en los conceptos. Por ejemplo la unidad de los datos es frecuentemente escrita como una nota de encabezado, tal como "En miles" .

CONCEPTOS O COLUMNA

MATRIZ:

Son las descripciones en hileras o filas de las tablas, son colocados al lado izquierdo de la tabla. Usualmente representan las clasificaciones de las cifras incluidas en el cuerpo de la tabla. La naturaleza de las clasificaciones es indicada por los encabezados de la columna.

CUERPO: Es el contenido de los datos estadísticos. Los datos presentados en el cuerpo son arreglados de acuerdo con las clasificaciones de los encabezados y conceptos. Por lo tanto la presentación efectiva de los datos en la tabla depende de los arreglos columnas y filas.

NOTA DE PIE: Son usualmente colocadas abajo de los conceptos. Son usadas para clarificar algunas partes incluidas en la tabla que no son explicadas en otras partes.

FUENTE: Es el origen de donde se obtuvo la información. Es usualmente escrita abajo de las notas de pie. Si los datos fueron recopilados por la misma persona, es costumbre no establecer la fuente de la tabla. Sin embargo, si los datos fueron

20

Page 21: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

tomados de otras fuentes, las fuentes de los datos deberán ser declaradas en la tabla. La declaración permitirá al lector comprobar o evaluar los datos, u obtener información adicional de la fuente original.

GRÁFICAS ESTADÍSTICASHay una gran variedad de gráficas usadas para representar datos estadísticos, los tipos más comunes de gráficas son:

1).- Gráfica de línea2).- Gráfica de barras3).- Gráficas de partes componentes4).- Gráfica de dimensiones5).- Pictogramas6).- Mapas estadísticos.

GRÁFICAS DE LÍNEAS

Las curvas o gráfica de línea se usan a menudo para representar las series cronológicas, así como las distribuciones de frecuencia. Los datos clasificados cualitativa y geográficamente raras a veces se presentan por medio de líneas; en su lugar se usan gráficas de barras.

La Línea o líneas que representan los datos deberán resaltar claramente sobre el fondo de la gráfica. La línea deberá, pues, dibujarse con un trazo mas grueso que las coordenadas de línea.Cuando se trazan varias líneas en el mismo cuadrante, es esencial que cada línea se destaque con claridad. Para ello se pueden usar tanto líneas continuas, de puntos y de guiones, como líneas gruesas y delgadas. Cuando en una gráfica aparecen dos o más curva, deben distinguirse unas de otras. Esto puede lograrse, de preferencia, rotulando las líneas. De ordinario es conveniente evitar el uso de mas de dos o tres líneas en una gráfica. Especialmente si se cruzan, es muy probable que se produzca alguna confusión.

GRÁFICAS DE BARRAS

Cuando se espera que la gráfica de simplemente una impresión muy general pueden hacerse gráficas de barras simples, sin escalas. Cuando se desea dar una impresión menos vaga, se utilizara la escala y si los intervalos de tiempo son diferentes, los espacios entre barra y barra también lo serán de acuerdo a la magnitud de dichos intervalos.

Las gráficas de barras se usan para hacer representaciones de datos clasificados cronológicamente, arreglando las barras en forma vertical para datos clasificados en forma cuantitativa. Cuando se realizan comparaciones de datos clasificados cualitativa o geográficamente, se usan, por lo general, barras horizontales.

Aun cuando no hay reglas establecidas para dibujar las gráficas de barras, son útiles ciertas consideraciones:

1.- Las barras no deben ser ni excesivamente cortas y anchas, ni demasiadas largas o angostas.2.- Entre barra y barra deberá dejarse un espacio que no sea menos, aproximadamente, que la mitad del ancho de una barra, ni mayor que el ancho de la misma.

21

Page 22: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

3.- La escala es generalmente útil. La distancia a la que se colocara no deberá exceder de la mitad de una barra a partir de la más alta, cuando son horizontales, o de la izquierda, cuando son verticales.4.- Las líneas que sirven como guía ayudan a leer la gráfica.

Para representar gráficamente una serie cronológica pueden usarse una gráfica de barras o de líneas. Si la serie abarca muchos años, por lo general, no es adecuada una gráfica de barras, que es difícil de construir. Una gráfica lineal facilita el estudio de la variación general que ha experimentado la serie; mientras que una gráfica de barras permite comparar determinados años con mayor facilidad.

REPRESENTACIÓN GRÁFICA DE UNA TABLA DE FRECUENCIA.

Los gráficos de distribuciones de frecuencias son útiles porque enfatizan y clasifican las tendencias que no se perciben fácilmente en las tablas. Los gráficos también ayudan a resolver problemas relacionados con las distribuciones de frecuencia. Permiten estimar algunos valores de un vistazo y proveen un chequeo visual de lo correcto de las soluciones.

HISTOGRAMA:

Es un diagrama formado con rectángulos o barras cada uno de ellos pertenecientes a una clase. Cada rectángulo tiene de ancho el tamaño de clase.

En el eje "Y" se grafica la frecuencia, y en el eje "X" los límites reales de clase. En el centro de su base se señala la marca de clase.

Las ventajas de los histogramas son:

- El rectángulo muestra claramente cada clase separada en la distribución.- El área de cada rectángulo, referida a todos los otros rectángulos, muestra la proporción del

número total de observaciones que ocurren en cada clase.

0

5

10

15

20

25

30

Intervalos de clase

Frecuencias

HISTOGRAMA

22

Page 23: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

POLÍGONO DE FRECUENCIA:

Es la poligonal que une los puntos cuya abscisa es la marca de clase y cuya ordenada es la frecuencia del intervalo. Es un diagrama de líneas que se forma uniendo los centros (marca de clase) de la parte superior de los rectángulos de un histograma mediante segmentos rectos.

La ventaja de los polígonos de frecuencia son:

- El polígono de frecuencia es mucho más simple que el histograma. - Esboza una idea del comportamiento de los datos más claramente. - El polígono se va aplanando y curveando en la medida en que se aumenta el número de clase y

el número de observaciones.

OJIVA:

Es una poligonal que une los puntos cuya abscisa es el extremo superior de cada intervalo y cuya ordenada es la frecuencia acumulada correspondiente al intervalo, con la convención de que antes del primer intervalo considerado, la frecuencia acumulada es cero y después del último es el total de datos (N).

23

Page 24: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

EJEMPLOS 2.2: PRESENTACIÓN ESCRITA DE DATOS ESTADÍSTICOS.

Se presentan los Costos, Ingresos y utilidades ( en miles de pesos) durante 1991-1995 de la compañía XXX en sus diferentes departamentos: Damas, caballeros y niños.

Durante los últimos 5 años los costos fueron de 100, 200, 300, 350 y 400 en el departamento de damas; de 120, 180, 310, 380 y 390 en el departamento de caballeros; y de 80, 100, 160, 290, 430 en el departamento de niños.

Los ingresos correspondientes obtenidos en este periodo fueron de 260, 390, 425, 560 y 730 en el departamento de damas; de 300, 320, 480, 560 y 700 en el departamento de caballeros; y de 145, 210, 300, 410 y 625 en el departamento de niños.

Para lo cual sus utilidades respectivas en el departamento de damas fueron de 160, 190, 125, 210 y 310; en el departamento de caballeros fueron de 180, 140, 170, 180 y 310; y en el departamento de niños fueron de 65, 110, 140, 120 y 195.

EJEMPLOS: TABLAS ESTADÍSTICAS.

NÚMERO DE AUTOS MANUFACTURADOS Y VENDIDOS PORG.M., K.W. Y M.S. COMPANY EN 1995

( MILES DE AUTOS )Compañía Manufactu-

radosVendidos

G.M. 10 9.2

K.W. 14 12.8

M.S. 5* 5

FUENTE: Revista Journal, Enero de 1996, Pag. 13.* La manufactura fue muy poca debido a que en los meses de Abril-Juniohubo huelga por parte del sindicato de trabajadores.

24

Título

Nota de Encabezado

Encabezado

CuerpoConceptos

Page 25: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

EJERCICIOS 21: DISTRIBUCIÓN DE FRECUENCIA

Una máquina vendedora de proporciona 16 oz. de café si se insertan monedas adecuadas. Para probar si la máquina esta operando adecuadamente se tomaron 30 vasos de café y se midieron.

15.7 15.9 15.2 16.0 16.2 16.4 15.7 15.9 15.4 16.0 16.3 16.615.8 15.9 15.6 16.0 16.3 16.8 15.8 15.9 15.6 16.1 16.3 16.8 15.8 16.0 15.6 16.2 16.4 16.9

a) Realizar un arreglo de los datos de menor a mayor. b) Realizar una distribución de frecuencia. c) Cuando la máquina tiene un margen de ± 0.2 oz se dice que trabaja correctamente, no

importando las onzas que proporcione después de 16 oz. ¿En qué porcentaje la máquina funciona adecuadamente?

d) ¿En qué porcentaje la máquina no trabaja adecuadamente? e) ¿En qué porcentaje la máquina proporciona más de 16 oz de café? f) ¿Cuál es la probabilidad de una persona al usar la máquina le proporcione más de 16 oz de

café?

GRÁFICAS CIRCULARES

Se emplean para demostrar la relación existente entre los componentes de una clase. Cada uno de los sectores del círculo representa una parte de un agregado de un total.

Para dividir la circunferencia en sectores se emplean proporciones, en las que se hace el total igual a los 360 grados, o bien, cuando se trata de porcentajes, a 100%.

Para evitar los cálculos resulta muy conveniente emplear un transportador de porcentajes que tiene graduados los grados y los porcentajes, A falta de ese transportados de porcentajes, podemos simplificar el procedimiento si partimos del siguiente razonamiento: si 1% equivale a 3.6 grados, basta multiplicar el porcentaje por este factor y el producto así obtenido equivale a los grados que le corresponde en la circunferencia.

Si se trata de valores absolutos, y no de porcentajes o valores relativos, ese factor se obtendrá dividiendo 360 entre el total, ya que la circunferencia se ha hecho igual a él.

PICTOGRAMAS

Las gráficas de volumen al presentar dibujos que se relacionan directamente con la naturaleza de los datos que representan son más atractivas; sin embargo; como ya se señalo presentan mayores dificultades, tanto para su elaboración como para su adecuada interpretación.Este valor pictórico, puede conservarse usando varios dibujos pequeños que representen una cantidad fija de los datos, del mismo tamaño, y arreglándolos de manera que se forme una gráfica de barras. A la gráfica resultante se le llama pictograma.

Aunque este diagrama es esencialmente una gráfica de barras es más atractivo y, por lo tanto, hay mayor probabilidad de que lo examine el lector. En los pictogramas las barras, aun cuando representen series cronológicas, se arreglan en forma horizontal, porque aparece más adecuado poner los dibujos (cosas o personas) uno al lado del otro y no uno encima del otro.

25

Page 26: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

Las reglas fundamentales para la construcción de pictogramas estadísticos son:

1.- Los símbolos deben explicarse por sí mismo2.- Las cantidades mayores se indican por un número mayor de símbolos y no por símbolos más grandes3.- Estos diagramas compran cantidades aproximadas y no detalles minuciosos4.- Los pictogramas sólo deben utilizarse para hacer comparaciones y no afirmaciones aisladas

MAPAS ESTADÍSTICOS

Los mapas estadísticos son artificios gráficos que muestran la información cuantitativa sobre una base geográfica. Los tipos más comunes son los mapas sombreados o rayados, los mapas punteados y los mapas de alfileres.

26

Page 27: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS (Descriptivas)

Una vez que los datos han sido obtenidos y organizados, el investigador esta listo para realizar un análisis descriptivo. En el tratamiento de los datos, es útil resumir sus características principales. Para ello, se plantean las siguientes cuestiones: ¿Cuál es el dato de mayor frecuencia? ¿Cuál es el valor central de la distribución? ¿Qué tan separados se encuentran los datos? Las respuestas a estas interrogantes es por medio de las medidas descriptivas conocidas como de Tendencia Central, de dispersión, de sesgo y kurtosis.

La medida de tendencia central son los promedios o valores típicos representativos de un conjunto de datos que tienden a situarse en el centro de dichos datos. Las tres medidas de tendencia central más comunes son la media (X), mediana (Md) y moda (Mo).

MEDIA ARITMÉTICA ( X )

Es la suma de las observaciones o datos entre el número de observaciones totales. Es una de las medidas digna de confianza porque se determina con mayor certeza que otras medidas.

VENTAJ AS:

Es familiar a la mayoría de la gente y muy sencilla de calcular. En ellas se reflejan todos los valores del conjunto de datos. Un conjunto de datos solo tiene una sola media.

DESVENTAJAS:

Puede afectarse por los valores extremos que no son representativos del resto de los valores.

MEDIANA ( Md )

La mediana es el valor único de un conjunto de datos que mide al elemento central de los datos.

Para encontrar la mediana de un conjunto de datos, primero se ordenan los datos de menor a mayor. Si el conjunto de datos tiene un número impar de elementos, el elemento de la mitad del arreglo es la mediana { (N+1)/2 }. Si hay un número par de elementos, la mediana es el promedio de los dos elementos de la mitad { N/2 }.

VENTAJAS:

Los valores extremos no afectan la mediana tan fuertemente como lo hacen con la media.

xN

iI

N

x

1

27

Page 28: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

Se puede encontrar la mediana aún cuando los datos sean descripciones cualitativas como el color o la claridad.

DESVENTAJAS:

Debido a que la media es un promedio de posición, se deben de organizar los datos antes de realizar cualquier tipo de cálculo. Esto consume tiempo para un conjunto de datos muy grande.

MODA ( Mo )

La moda es aquel valor que se repite más en un conjunto de datos.

VENTAJAS:

Se puede usar como una medida de localización central tanto para datos cualitativos como cuantitativos.

La moda no esta afectada por los valores extremos.

DESVENTAJAS:

Muy a menudo no hay un valor modal porque el conjunto de datos no contiene valores que se repiten más de una vez.

Otras veces, cada valor es la moda porque cada valor aparece el mismo número de veces.

Cuando el conjunto de datos tiene dos, tres o más modas, éstas son difíciles de interpretar y comparar.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

MEDIA ARITMETICA PARA DATOS AGRUPADOS

Método corto para el cálculo de la Media Aritmética:

xi Marca de clasef N Total de datos

f = Frecuencia

A = Media supuesta (marca de clase del intervalo central)di = Desviación en unidades de intervaloi = Amplitud del intervalo

28

Page 29: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

MEDIANA PARA DATOS AGRUPADOS

Se divide N/2 para encontrar la clase mediana para datos pares, (N+1)/2 para datos impares.

MODA PARA DATOS AGRUPADOS:

MEDIDAS DE DISPERSIÓN:

Indican el grado de esparcimiento de los datos con respecto al valor central. Las medidas de dispersión se usan para poder verificar si el promedio es representativo o no de la muestra y como base de control de la variación misma.

Una dispersión pequeña indica un alto grado de uniformidad. Las medidas de dispersión son: desviación estándar, varianza y rango.

VARIANZA: La varianza es la suma de la distancia al cuadrado de la media y cada elemento de la población entre el número total de elementos de la población.

La fórmula para datos no agrupados es:

Linf = Límite inferior N = Total de datosi = Amplitud del intervalofMd = Frec. de la clase medianaC = Frecuencia acumulada hasta antes

de la clase mediana.

d1 = Frec. de la clase modal menos la frecuencia de la clase anterior.

d2 = Frec. de la clase modal menos la frecuencia de la clase anterior.

29

Page 30: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

Para la varianza, sin embargo, las unidades son el cuadrado de las unidades de los datos, por ejemplo, "dólares al cuadrado" o "dólares cuadrados", no son expresiones intuitivas claras de interpretar. Por esta razón, debe efectuarse un cambio significativo en la varianza para calcular una medida de desviación útil, una que no presente problemas con las unidades de medidas y sea menos confusa. Este parámetro es llamado la DESVIACIÓN ESTÁNDAR y es la raíz cuadrada de la varianza.DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS

La desviación estándar permite determinar, con cierto grado de certeza dónde están localizados los valores de una distribución de frecuencia con relación a la media.

Desviación estándar para datos agrupados:

Método corto para el cálculo de la desviación estándar:

S2 =Varianza.xi = Dato individual o marca de clase. x = Media Aritmética.N = Total de datos.

S = Desviación Estándar.xi = Dato individual o marca

de clase.

X = Media Aritmética.N = Total de datos.f = frecuencia del intervalo.

30

Page 31: Estadistica general

Estadística Descriptiva _____________ _____________ __________ MC Raúl Adalberto _ Morelos

Bibliografía. Anderson, D. (2007) Estadística para Administración y Economía. México: PearsonBerenson, M., Levine, D. (1996) Estadística Básica en Administración, Conceptos y Aplicaciones. (6aEd.). México :Prentice Hall HispanoamericanaHildebrand, D. (1998). Estadística Aplicada a la Administración. México: PearsonLevin, R. I., (2004). Estadística para Administración y Economía. México: PearsonLevine, D., Krehbiel, T., Berenson, M. (2006). Estadística para Administración. (4ta. Ed.). México.:Printece Hall Webster, A. (2005). Estadística Aplicada a los Negocios y la Economía. (3ra Ed. ). México: Prentice Hall.Stephen, P. Shao (1970) Estadística para economistas y administradores de empresas. (6aEd.). México: Trillas

S = Desviación Estándar.xi = Dato individual.di = Desviación en unidades

de intervalo.N = Total de datos.f = frecuencia del intervalo.i = Amplitud de la clase.

31