unidad 1-2-3 eb.doc

42
Unidad 1. Fundamentos de la estadística Presentación de la unidad La palabra estadística a menudo te remite a gráficas y tablas; cifras relativas a nacimientos, muertes, impuestos, demografía, ingresos, deudas, créditos, etc. No obstante, para aprovechar las herramientas de análisis estadístico, es necesario comprender qué representa cada concepto y la metodología mediante la cual se obtiene un dato estadístico. En esta unidad se hablará sobre la importancia de la estadística, conocerás sus conceptos básicos, así como la metodología del muestreo para que al final, obtengas una muestra aleatoria simple. Propósitos de la unidad Identificarás los conceptos básicos relacionados con la Estadística. Reconocerás la utilidad e importacia de la Estadística. Aplicarás el procedimiento para obtener una muestra aleatoria simple. Competencia específica Aplica la metodología estadística para obtener una muestra aleatoria simple, identificando los elementos que intervienen en un problema estadístico. 1.1. Introducción a la estadística

Upload: yesson-emis-garcia-hernandez

Post on 07-Dec-2014

129 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Unidad 1-2-3 EB.doc

Unidad 1. Fundamentos de la estadística

Presentación de la unidad

La palabra estadística a menudo te remite a gráficas y tablas; cifras relativas a nacimientos, muertes, impuestos, demografía, ingresos, deudas, créditos, etc. No obstante, para aprovechar las herramientas de análisis estadístico, es necesario comprender qué representa cada concepto y la metodología mediante la cual se obtiene un dato estadístico.

En esta unidad se hablará sobre la importancia de la estadística, conocerás sus conceptos básicos, así como la metodología del muestreo para que al final, obtengas una muestra aleatoria simple.

Propósitos de la unidad

Identificarás los conceptos básicos relacionados con la Estadística.

Reconocerás la utilidad e importacia de la Estadística.

Aplicarás el procedimiento para obtener una muestra aleatoria simple.

Competencia específica

Aplica la metodología estadística para obtener una muestra aleatoria simple, identificando los elementos que intervienen en un problema estadístico.

1.1. Introducción a la estadística

La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadística, en general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la interpretación de datos numéricos con el

Page 2: Unidad 1-2-3 EB.doc

fin de realizar una toma de decisiones más efectiva.

Haz clic en la imagen para conocer más información.

Las estadísticas…

La palabra estadística también se utiliza para referirse a la información estadística (descripción de parámetros); es decir, a series de datos, tablas y gráficas que presentan resultados. Por ejemplo, cuando leemos las estadísticas de los equipos o escuchamos la estadística muestra que el índice de reprobación en las escuelas es tal, se hace referencia a los datos y no al procedimiento o metodología de análisis.

1.1. Introducción a la estadística

Utilidad e importancia de la estadística

La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para interpretar la información obtenida, que puede ser aprovechada para demostrar la evolución de un fenómeno a través de cierto tiempo.

En México, el Instituto Nacional de Estadística y Geografía (INEGI) se encarga de recabar información estadística y geográfica de todo el país, en diferentes áreas y contextos.

Los métodos estadísticos se utilizan en investigaciones de todas las áreas del conocimiento en el ámbito académico, profesional y laboral. La finalidad es resolver un problema, entendiendo éste como la diferencia entre lo real y lo deseado, donde la estadística muestra la realidad para que el investigador la analice y tome una decisión.  

División de la estadística

La estadística, por su aplicación se divide en:

1) Estadística descriptiva.La función descriptiva de la estadística se enfoca en la presentación y clasificación de los datos obtenidos de la población que se analiza.

Page 3: Unidad 1-2-3 EB.doc

2) Estadística inferencial.Esta aplicación de la estadística busca plantear y resolver problemas específicos y/o hacer previsiones a partir de los datos de una muestra, dado que es muy difícil estudiar a la población completa.

Actividad 1. Encuesta

 

Antes de continuar con el contenido de la asignatura, responde la encuesta Preferencias por carrera.

Es necesario que participes en este ejercicio, porque a partir de los datos que arroje la encuesta, realizarás las actividades para evaluar las tres unidades de la asignatura.

Para ingresar a la Encuesta: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades de la unidad, da clic en la Actividad 1. Encuesta Preferencias por carrerra.

1.2. Conceptos de estadística

La estadística tiene aplicación en prácticamente todas las áreas del conocimiento, inclusive en la vida cotidiana, mucho más a menudo de lo que crees.

La siguiente actividad te permitirá apreciar una aplicación simple de la estadística e identificar algunos conceptos relacionados con ella:

1. Lee el texto La estadística y la salud.2. Identifica los conceptos relacionados con la estadística.3. Define cada concepto utilizando sólo la información de la lectura. No es necesario que busques

definiciones.

Da clic en el icono para descargar el documento.

Conceptos básicos de estadística

Los conceptos más utilizados en estadística son los que a continuación se presentan.

Page 4: Unidad 1-2-3 EB.doc

Población: Conjunto de todos los elementos que permiten resolver un problema, que presentan una característica común determinada, observable y medible. Por ejemplo, si el elemento es una persona, se pueden estudiar las características edad, peso, nacionalidad, sexo, etc. Los elementos que integran una población pueden corresponder a personas, objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.).

Individuo: Un individuo o unidad estadística es cada uno de los elementos que componen la población. Nota que un individuo en estadística puede ser distinto a un individuo como persona. Por ejemplo, en los censos económicos se obtienen datos de los negocios. En este caso cada negocio, que está formado por varias personas, es un individuo de la población.

Muestra: Cuando es difícil estudiar la población debido a su gran tamaño o que provenga de un proceso que no se detiene (como la producción de un bien), se debe analizar un subconjunto o parte de ésta que la represente, llamado muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y características que la población. En general el tamaño de la muestra es mucho menor al tamaño de la población.

Muestreo: Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporción reducida y representativa de la población.

Dato: El dato es cada uno de los valores que se han obtenido al realizar un estudio estadístico. Por ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Variable: Se llama variable a una característica que se observa en una población o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Las variables se pueden clasificar en dos tipos:

1. Variable cuantitativa. Puede ser escala continua o discreta.

2. Variable cualitativa. Puede ser escala nominal u ordinal.

Tipos de variables

Page 5: Unidad 1-2-3 EB.doc

La variable es una característica de la población o muestra que desea estudiarse. Las variables pueden ser:

¿Cómo utilizamos los conceptos?En el ejemplo La estadística y la salud identificaste algunos conceptos básicos de estadística. Ahora, revisemos juntos(as) los conceptos que estaban en el texto.

La población de estudio es la sangre del individuo, de la cual se toma una muestra que representa una pequeña parte de esta población. Esta muestra contiene información sobre las características que se desean observar.Los (las) expertos(as) de laboratorio preparan la sangre para observar en un microscopio electrónico los elementos (variables) que contiene, por ejemplo pueden observar la cantidad de plaquetas o neutrófilos (las plaquetas y los neutrófilos son los individuos y la cantidad que contiene la sangre de estos elementos son los datos) que contiene la muestra por unidad de volumen.

Se realiza un conteo, en este caso, del número de plaquetas y del número de neutrófilos, esta información se representa por medio de un estadístico, característica numérica que refleja la información contenida en la muestra, en la que se observa el total de plaquetas.

Aunque, en realidad, lo que nos interesa conocer o estimar es el total de plaquetas en el total de la sangre (población) del individuo.

¿Cuántos conceptos identificaste en la lectura?

La metodología para solucionar un problema estadístico comprende los siguientes pasos:

Page 6: Unidad 1-2-3 EB.doc

1. Planteamiento del problema. En el planteamiento se define si se requiere de una muestra o es posible estudiar la población, las características a estudiar (las variables), si es necesario establecer  una hipótesis, entre otros. En este punto también se analizan los medios de los que se dispone y el procedimiento a seguir.

2. Elaboración de un modelo. Se establece un modelo teórico de comportamiento de las variables de estudio. En ocasiones no es posible diseñar el modelo hasta realizar un estudio previo. Los posibles modelos son normal, binomial, poisson, uniforme, y otros como binomial negativa, geométrico.

3. Extracción de la muestra. Se usa alguna técnica de muestreo o un diseño experimental para obtener información de una pequeña parte de la población.4. Tratamiento de los datos. En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que serán necesarios en pasos posteriores, como la media y la varianza de la muestra. Los métodos de esta etapa corresponden a los métodos de la estadística descriptiva. Algunas de las etapas de esta fase son: recopilación, clasificación y presentación de la información. 5. Estimación de los parámetros. La estadística inferencial nos proporciona herramientas para la predicción o estimación de los parámetros de la población que nos ayudarán a resolver el problema. Un ejemplo de estas herramientas son las pruebas de hipótesis que se obtienen del análisis de los datos y los intervalos de confianza.

1.3. Muestreo aleatorio

Introducción

Los estudios estadísticos normalmente se hacen con una parte de la población, ya que realizarlos sobre la totalidad resultaría demasiado complicado. Para que la información obtenida tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones específicas. Estas condiciones están relacionadas con el método para determinar el tamaño y características de la muestra y los individuos que la componen.

Los métodos de muestreo se pueden clasificar en:

Revisa los métodos de muestreo probabilístico, para ello, lee el texto Tipos de muestreo.

Da clic en el icono para descargar el documento.

Page 7: Unidad 1-2-3 EB.doc

1.3.1. Conceptos básicos de muestreo aleatorio

Muestreo aleatorio simple

El muestreo aleatorio simple es el procedimiento por medio del cual se obtiene una muestra aleatoria simple.

Una muestra aleatoria simple es la que resulta de aplicar un método por el cual todos los elementos de la población tienen la misma probabilidad de ser elegidos.

A continuación, conocerás cuáles son los pasos para obtener una muestra aleatoria simple.

Paso 1. Definir la población de estudio y el parámetro a estudiar.

Paso 2. Enumerar a todas las unidades de análisis que integran la población, asignándoles un número de identidad o identificación.

Paso 3. Determinar el tamaño de la población, determinar el porcentaje de error y el porcentaje de confianza y obtener una muestra preliminar.

Paso 4. Determinar el tamaño óptimo de la muestra para el estudio.

Paso 5. Seleccionar los sujetos dela muestra usando números aleatorios

1.3.2. Metodología del muestreo aleatorio

Pasos para obtener una muestra aleatoria simpleHas visto una descripción general del procedimiento que debes seguir para obtener una muestra aleatoria simple, ahora revisarás cada paso específico.

Paso 1. Definir la población de estudio y las variables a estudiar.

Recuerda que la población es el grupo formado por el conjunto total de individuos, objetos o medidas que poseen algunas características comunes, observables en un lugar y en un momento determinado. Por lo tanto, el paso 1 es determinar qué se estudiará.

Ejemplo

Un investigador realiza un estudio sobre las relaciones de género en el noviazgo, su objeto de estudio son las manifestaciones de violencia física y psicológica entre los (las) estudiantes del último año de la carrera de química. Su población es el total de estudiantes del último año de ingeniería química que tengan novio o novia; el total de individuos con esta característica es de 386. Por lo que, la población es de 386 individuos y las variables son: violencia física y violencia psicológica.

Page 8: Unidad 1-2-3 EB.doc

Paso 2. Numerar todas las unidades de análisis que integran la población, asignándoles un número de identificación.

Una vez que has definido la población y las variables a estudiar, es necesario asignar un número de identificación a cada individuo de la población. Siguiendo con el ejemplo de la relaciones de género en el noviazgo de los (las) estudiantes de química, lo que sigue es numerar a los 386 estudiantes un número del 1 al 386.

Paso 3. Definir la población, determinar el porcentaje de error y el porcentaje de confianza.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:

1. El porcentaje de confianza con el que se quiere generalizar los datos, desde la muestra hacia la población total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalización. 3. El nivel de variabilidad que se calcula para comprobar la hipótesis.

A continuación definiremos estos conceptos.

1.3.2. Metodología del muestreo aleatorio

Page 9: Unidad 1-2-3 EB.doc

Ahora veamos una definición de los conceptos implicados en el paso 3.

Definir el tamaño de la población. Significa determinar el número de individuos que la constituyen; la variable N representa el tamaño de la población. N=X

Porcentaje de confianza. Es el grado o nivel de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero también implica estudiar a la totalidad de los casos de la población. Para evitar un costo muy alto se busca un porcentaje de confianza menor, comúnmente es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningún cálculo) para poder acertar al valor verdadero de la población . Este dato se obtiene a partir de la distribución normal estándar.

Porcentaje de error. Este error es una distancia alrededor del valor que deseamos estimar y nos da un margen de aproximación. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse. Comúnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error. Variabilidad. Es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere comprobar. El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y se indica con p (también llamada probabilidad de éxito ), y el porcentaje con el que se rechazó la hipótesis es la variabilidad negativa, identificada por q (también llamada probabilidad de fracaso y se obtiene 1-p).

Variabilidad positiva=p= a la probabilidad de que suceda el eventoVariabilidad negativa=q=a la probabilidad de que no suceda el evento

La variabilidad positiva (p) al sumarla con la negativa (q) siempre nos debe dar la unidad p+q=1. Cuando no se tienen antecedentes sobre la investigación, entonces los valores de variabilidad son p=q=0.5

Paso 4. Determinar el tamaño de la muestra óptimo para el estudio.

Una vez que la población, el porcentaje de confianza, el porcentaje de error y el nivel de variabilidad han sido determinados, se debe determinar el tamaño de la muestra. Puedes calcularlo mediante alguna de las dos fórmulas que examinarás: una para los casos en que se conoce el tamaño de la población y la otra para cuando este dato se desconoce.

Fórmula para cuando no se conoce el tamaño de la población

Fórmula para cuando se conoce el tamaño de la población

Page 10: Unidad 1-2-3 EB.doc

Nota. En este momento no conoces los procedimientos para obtener todos los componentes de las fórmulas, en los ejemplos, estos componentes ya están dados. Estos procedimientos se verán más adelante.

1.Haz clic sobre las fórmulas para ver un ejemplo de cómo se aplican.2.Observa el video “Determinar el tamaño de la población”, que se encuentra en la pestaña Material de apoyo, en la página de inicio del curso.

n es el tamaño de la muestraZ es el nivel de confianzap es la variabilidad positivaq es la variabilidad negativaE es la precisión o error

Ejemplo:En un lote grande de medicinas, se desea verificar que la proporción de los ingredientes activos sea el adecuado. Se debe determinar el tamaño de la muestra para un nivel de confianza del 95% con un error del 5%. Supón que la variabilidad p=q=0.5.Solución:Para el nivel de confianza sea igual al 95%, tienes que P(Z)=0.95 si Z=1.96.Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en el caso necesario, hay que convertir esos valores a proporciones.

Sustituyendo:

Es decir, se ocupará una muestra de aproximadamente 384 unidades.

n es el tamaño de la muestraZ es el nivel de confianzap es la variabilidad positivaq es la variabilidad negativaN es el tamaño de la poblaciónE es la precisión o error

Ejemplo:En un lote de 25,000 cajas de medicina, se desea verificar que la proporción de los ingredientes activos sea el adecuado. Se debe determinar el tamaño de la muestra para un nivel de confianza del 95% con un error del 5%. Supón que la variabilidad p=q=0.5.Solución:Para el nivel de confianza sea igual al 95%, tienes que p(Z)=0.95 si Z=1.96. Sustituyendo:

En otras palabras, se ocupará una muestra de aproximadamente 378 cajas.

Page 11: Unidad 1-2-3 EB.doc

Paso 5. Seleccionar los sujetos de la muestra usando números aleatorios.

El último paso para obtener la muestra es saber qué individuos específicos de la población se tomarán. Para hacer esto debes:

1. Numerar a los individuos de la población del 1 a N (donde N es el tamaño de la población).

2. Generar números aleatorios para seleccionar los individuos de la muestra.

3. Tomar los individuos correspondientes a los números elegidos.

Los números aleatorios se pueden generar por diversos métodos, por ejemplo mediante programas computaciones (por ejemplo en Excel con la función “=aleatorio()”), funciones en calculadora, sacando números de una urna o lanzando una moneda al aire, o bien utilizando tablas de números aleatorios. Para obtener los números aleatorios, utilizarás la tabla, para ello lee el documento Uso de la tabla de números aleatorios.

Da clic en el icono para descargar el documento.

Actividad 2. Problemas para determinar el tamaño de la muestra

1. Descarga el archivo Determinación de muestras y realiza lo que se te pide.2. Guarda  tu documento  como  EB_A2_Mu_XXYZ. Sustituye las XX por las dos primeras letras

de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno.

3. Sube  tu  archivo para que tus compañeros(as) y tu Facilitador(a) lo revisen y te retroalimenten.

En esta actividad es muy importante que revises los trabajos de tus compañeros(as) y los evalúes, dándoles una retroalimentación sobre los aciertos de sus trabajos y también de los errores.

Da clic en el icono para descargar el documento.

Para subir tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades de la unidad, da clic en la Actividad 2. Problemas para determinar el tamaño de la muestra.

Page 12: Unidad 1-2-3 EB.doc

Actividad 3. Problemas

1. Descarga el documento adjunto Problemas y resuelve los ejercicios que se presentan.

2. Guarda tu documento como EB_A3_PR_XXYZ y envíalo a tu Facilitador(a). Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno.

Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en la Actividad 3. Problemas.

Da clic en el icono para descargar el documento.

Actividad 4. Foro: La importancia de la estadística

El foro La importancia de la estadística tiene como propósito que reflexiones acerca de la percepción que tienes sobre la estadística y su utilidad, y la compartas con tus compañeros(as) de grupo y el (la) Facilitador(a). Responde las siguientes preguntas en el foro:

¿Qué importancia tiene el uso de la estadística? ¿Quién usa la estadística y para qué la usa?

¿Qué utilidad le encuentras a esta asignatura?Revisa las aportaciones de tus compañeros(as) y coméntalas. Al final del foro, el (la) Facilitador(a) retomará todos los comentarios para dar una conclusión general sobre el tema.

Consulta la rúbrica del foro para conocer cómo se evaluará tu participación.

Da clic en el icono para descargar el documento.  Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades de la unidad, da clic en Actividad 4. Foro: La importancia de la estadística.

Autoevaluación

 

Antes de concluir la unidad resuelve el ejercicio de autoevaluación. Lee las preguntas que se te presentan y elije la respuesta correcta.Para ingresar a la Autoevaluación: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en Autoevaluación.

 

Evidencia de aprendizaje

1. Descarga la base de datos Preferencias por carrera, disponible en la pestaña Material de apoyo. En este documento encontrarás los resultados de la encuesta en que participaste en la actividad 1. Los resultados

Page 13: Unidad 1-2-3 EB.doc

presentados son de todos los (las) alumnos(as) que respondieron.

2. En un documento aparte, y con base en los datos, determina lo siguiente:

¿Cuál es la población de estudio?

¿Cuáles son los individuos de esa población?

¿De cuántos individuos consta la población? Nombra el rango que abarca la población (numéralos comenzando por el 1 y ocupa la cantidad de ceros necesaria para completar los dígitos del número total de la población, por ejemplo del 0001 al 1845).

Obtén el número de elementos necesarios para seleccionar una muestra aleatoria simple tal que los resultados del estudio tengan un porcentaje de error del 5% y un porcentaje de confianza del 95%. Para ello considera que Z = 1.96 y que la variabilidad positiva es igual a la negativa.

¿Cuál es la variable o cuáles son las variables a estudiar en esa muestra?

Obtén la muestra en base a la tabla de números aleatorios que tienes (no olvides indicar el renglón que elegiste para comenzar a seleccionar los individuos de la muestra).

3. Guarda tu archivo como EB_U1_EV_XXYZ y envíalo a tu Facilitador(a) para que lo revise y te retroalimente. ¡No olvides darle seguimiento!

Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en la Evidencia de aprendizaje.

Page 14: Unidad 1-2-3 EB.doc

Unidad 2. Representación numérica y gráfica de datos

Presentación de la unidad

En la unidad anterior, conociste las dos grandes divisiones de la estadística: la que se dedica a la recolección, presentación y categorización de datos, llamada estadística descriptiva y la que se dedica a realizar hipótesis con base en dichos datos, la inferencial.

También aprendiste a determinar el espacio de estudio (es decir, la población) y las variables que se van a estudiar de acuerdo al problema planteado.

En esta unidad estudiarás la estadística descriptiva y aprenderás cómo organizar y presentar los datos obtenidos mediante el muestreo en poblaciones.

 

Cuando se realiza un trabajo que requiere a la estadística, se diseñan instrumentos para obtener los datos deseados. Existen muchos métodos para recolectar información, pero los más frecuentes son:

Otra de las técnicas más recurridas en estadística para recolectar información son los experimentos, revisa en qué consisten. Un experimento es una prueba que se realiza para determinar las características o comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qué alimentos te parecen más salados.

Page 15: Unidad 1-2-3 EB.doc

 También, experimento se define como el proceso que se realiza para verificar una serie de hipótesis relacionadas con un determinado fenómeno, en el cual se determinan las características o comportamientos del fenómeno que se analiza.Por ejemplo, un experimento para determinar la velocidad de la luz en el vacío.

La diferencia entre la primera y la segunda definición es que en la segunda se parte de una hipótesis mientras que en la primera no necesariamente. En el primer ejemplo, experimentas los sabores de los alimentos sin antes predecir cuál será más salado. En el segundo ejemplo, la hipótesis, a partir de estudios anteriores, es que la velocidad de la luz en el vacío es de 300 000 km/seg. Por lo tanto, el experimento verifica si esta hipótesis es cierta o no y en él cabe un margen de error experimental.

Los datos que se recopilan, usando alguna técnica de las que acabamos de describir u otra, son organizados de acuerdo a los parámetros de la estadística descriptiva que estudiarás en esta unidad.

Propósitos de la unidad

En esta unidad:

Identificarás algunos conceptos que se utilizan en estadística descriptiva.

Organizarás datos en diferentes tipos de tablas y elaborarás varios tipos de gráficas

Competencia específica

Utiliza las técnicas de representación numérica y gráfica para representar información a través de la organización de los datos obtenidos de una muestra o población.

2.1. Organización de datos y distribución de frecuencias

Introducción

La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Esta área sólo describe, resume, organiza y representa los datos obtenidos de una población o muestra de la población, sin elaborar inferencias ni obtener conclusiones.

La organización de datos se realiza a través de tablas que se utilizan para simplificar la presentación y distribución de estos datos.

A continuación, conocerás que existen diferentes tipos de presentación de datos y con base en ellos, distintas clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta.

Page 16: Unidad 1-2-3 EB.doc

Actividad 1: Datos agrupados y datos no agrupados

Antes de comenzar con el tema de tablas de datos, realiza la siguiente actividad:

1. Organízate junto con tus compañeros(as) de grupo, en un equipo de 6 integrantes y nombren un responsable del mismo.

2. De manera individual, investiga en fuentes confiables qué son los datos agrupados y lo datos no agrupados. Comparte la información con el resto del equipo.

3. De manera grupal, elaboren un resumen donde expliquen en qué consisten estos tipos de datos incluyendo, por lo menos, dos ejemplos para cada uno; y publíquenlo en la wiki Datos agrupados y datos no agrupados.

Nota: No olviden incluir el nombre de todos los integrantes del equipo y las fuentes de donde obtuvieron la información.

Para ingresar a la wiki: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en la Actividad 1: Datos agrupados y no agrupados.

2.1.1. Frecuencias

Antes de comenzar con el tema, es importante que consideres lo siguiente:

Frecuencia o Frecuencia absoluta

La frecuencia o frecuencia absoluta es el número de veces que se repite un valor dentro de un conjunto de datos, se denota como fi. Por ejemplo, supongamos que tienes la siguiente serie de datos: 3, 2, 5, 7, 3, 7, 7, 5, 2, 7, 3. Si los organizas en una tabla, tendrías:

Dato Frecuencia2 2 (porque se repite 2 veces)3 3 (porque se repite 3 veces)4 2 (porque se repite 2 veces)5 4 (porque se repite 4 veces)

Page 17: Unidad 1-2-3 EB.doc

Total de datos (N) 11

Frecuencia absoluta acumulada

La frecuencia absoluta acumulada es la suma de las frecuencias de las variables hasta el renglón i, se representa como Fi. También es conocida como frecuencia acumulada. Siguiendo con el ejemplo anterior:

Dato Frecuencia Frecuencia acumulada2 2 2 (hasta aquí tienes 2 datos

3 35 (la suma de la frecuencia del primer dato con la del segundo dato 2+3)

5 2 7 (frecuencia de 2+frecuencia de 3+frecuencia de 5)

7 411 (frecuencia de 2+frecuencia de 3+frecuencia de 5 frecuencia de 7)

Total de datos (N) 11  

Frecuencia relativa

La frecuencia relativa es el resultado de dividir la frecuencia de cada dato entre el número total de datos (N). La suma de esta columna da 1 (excepto cuando el resultado de las divisiones se redondea). Este dato también puede verse como un porcentaje, se representa como hi. Siguiendo con el ejemplo anterior:

Dato Frecuencia Frecuencia acumulada Frecuancia relativa2 2 2 0.181 (se divide 2/11)3 3 5 0.272 (se divide 3/11)4 2 7 0.181 (se divide 2/11)5 4 11 0.363 (se divide 4/11)Total de datos (N) 11  

Frecuencia relativa acumulada

La frecuencia relativa acumulada es la suma de las frecuencias relativas hasta el renglón i. Se representa como Hi, observa el ejemplo:

Dato FrecuenciaFrecuencia acumulada

Frecuencia relativa

Frecuencia relativa acumulada

2 2 2 0.18180.1818 (hasta este renglón sólo tienes esta frecuencia relativa)

3 3 5 0.27270.4545 (se suma la frecuencia relativa del primer dato con la del segundo dato 0.1818+0.2727)

5 2 7 0.18180.6363 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5)

7 4 11 0.36360.9999 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5+la frecuencia relativa de 7)

Total de datos (N)

11      

Page 18: Unidad 1-2-3 EB.doc

Ejemplo de organización de frecuencias

En la siguiente pantalla observarás una tabla con la organización de frecuencias, los datos presentados son los siguientes:

18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.

Frecuencias

No. renglón

Datos obtenidos

de la variable

Frecuencia fi

Frecuencia acumulada Fi

Otra forma para obtener

Fi

Frecuencia relativa hi

Frecuencia relativa acumulada Hi

1 7 f1=  2 f1=F1= 2 f1 = F1=2 h1=f1/N=0.0625 h1=H1=0.0625

2 18 f2=  6 f1+f2= F2= 8 F1+f2=F2=8 h2=f2/N=0.1875h1+h2=H2=0.2500

3 23 f3=  8 f1+f2+f3= F3=16 F2+f3=F3=16 h3=f3/N=0.2500h1+h2+h3=H3=0.5000

4 41 f4=  4 f1+f2+f3+f4= F4=20F3+f4=F4=20 h4=f4/N=0.1250h1+h2+h3+h4=H4=0.6250

5 47 f5=  7f1+f2+f3+f4+f5= F5=27

F4+f5=F5=27 h5=f5/N=0.2187h1+h2+h3+h4+h5=H5=0.8430

6 52 f6= 5f1+f2+f3+f4+f5+f6= F6=32

F5+f6=F6=32 h6=f6/N=0.1563h1+h2+h3+h4+h5+h6=H6=1.0000

Total   N=32     1.0000  

Actividad 2: Frecuencias

1. Descarga el archivo Frecuencias y resuelve el problema que se te presenta.2. Guarda tu archivo como EB_U2_FR_XXYZ y compártelo en la base de datos con el resto de tus

compañeros(as). Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB.

3. En la entrada que agregues, escribe tus dudas o dificultades al momento de realizar la tabla. Revisa las entradas de tus compañeros(as) y coméntalas tratando de complementar la información o de resolver sus inquietudes.

4. Compara tus tablas con las de tus compañeros(as).

Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en la Actividad 2: Frecuencias.

Page 19: Unidad 1-2-3 EB.doc

Da clic en el icono para descargar el documento.

Es importante que realices esta actividad porque la ocuparás más adelante.

2.1.2. Intervalos

Otro concepto muy utilizado en estadística descriptiva es el de intervalo. Conoce qué es y los demás conceptos asociados.Intervalos

Conjunto de valores agrupados entre dos números, conocidos como límites, en este caso, límites del intervalo.

Intervalo de clase

Se llama intervalo de clase a la expresión que denota un intervalo.

Amplitud del intervalo

La amplitud del intervalo es la distancia que hay entre los límites superior e inferior del intervalo. Se calcula restando el valor del límite inferior al valor del límite superior.

Frontera de clase

Son los puntos medios entre los límites de intervalos consecutivos. Las fronteras de clase se utilizan para recuperar los datos entre el límite superior de un intervalo y el límite inferior del siguiente.

Marca de clase

También conocida como punto medio de clase, es el resultado de la suma de los límites inferior y superior del intervalo, dividido entre dos.

Ejemplo de intervalos

Observa cómo se representan los conceptos relacionados con los intervalos, coloca el cursor sobre las palabras resaltadas.

Dados los números 15 y 25, tendrías que:El intervalo corresponde a todos los números que se encuentran entre 15 y 25.El intervalo de clase sería: 15-25Los límites del intervalo son:Límite inferior=15Límite superior=25La amplitud del intervalo 15-25 sería: 25 menos 15, es decir, 10.

Es recomendable que todos los intervalos tengan la misma amplitud, por lo que se puede restar el dato menor al dato mayor y dividir el resultado entre el número de intervalos.

Page 20: Unidad 1-2-3 EB.doc

La frontera de clase: dados los intervalos 4-14, 15-25 y 26-36, las fronteras de clase serían: 3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por último, 25.5 y 36.5 para el tercer intervalo.

La marca de clase del intervalo 15-25 es igual a: 15+25=40/2=20.

Es recomendable que la marca del intervalo coincida con alguno de los datos, aunque esto no es necesario ni siempre se logra; sobre todo cuando los intervalos tienen la misma amplitud.

2.1.3. Construcción de intervalos de clase

La formación de clases o intervalos de clase, que se representa con (k), depende, generalmente, del tamaño del rango de la población o muestra. Lo que se debe hacer para determinar los intervalos de clase es lo siguiente.Paso 1. Calcular el rango

Se identifica el número mayor (Xn) y el número menor (X1) en los datos. El rango es el resultado de restar el número menor al número mayor; esto es: 240

R= Xn – X1Por ejemplo:

Para una serie de datos que van desde el 18 hasta el 56,se tiene lo siguiente:

Xn= 56X1= 18

por lo tanto, R= Xn – X1= 56 – 18= 38

Paso 2. Determinar el número de intervalos que se desea tener No existe una regla para determinar el número de intervalos, pero generalmente se suelen crear entre 5 y 20 intervalos. La decisión la toma el investigador.Siguiendo con el ejemplo, se van a construir 7 intervalos.Entonces k= 7

Paso 3. Dividir el rango entre el número de intervalos que se desea tener

Recuerda que es recomendable elegir un número entre 5 y 20 para los intervalos y dividir el rango entre el número deseado de intervalos.Siguiendo con el ejemplo:

Si son 7 intervalos 38/7 = 5.428

Ésta será la amplitud de los intervalos. Cuando no es un número entero, se escoge el entero sin decimales.

Paso 4. Formación de intervalos:

Los intervalos se forman comenzando un número antes del primer dato.

Page 21: Unidad 1-2-3 EB.doc

Intervalos:

17 a 22 (se cuenta 5 desde 18 hasta 22)23 a 28 (el siguiente intervalo comienza a partir del límite superior del intervalo anterior)29 a 3435 a 4041 a 4647 a 5253 a 58

Nota. No importa que el último intervalo exceda el último dato.

Ejemplo de construcción de intervalos

El director de una consultoría en desarrollo de software desea conocer el número de incidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Para ello registra los siguientes datos:

35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28, 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20.

Observa cada paso:

1. Calcular el rango: R=Xn–X1=60-20=402. Determinar el número de intervalos entre 5 y 20: Elegir 8 intervalos.3. Dividir el rango entre el número de intervalos: 40/8=54. Se forman los intervalos: Comenzar por un número anterior al límite inferior: 19-24, 25-30, 31-36, 37-

42, 43-48, 49-54, 55-60

Revisa el video Construcción de intervalos que se encuentra en la sección Material de apoyo.

Actividad 3: Intervalos

Page 22: Unidad 1-2-3 EB.doc

1. Descarga el archivo Intervalos y resuelve el problema elaborando los intervalos de clase de los datos que se presentan y la tabla de frecuencias correspondiente.

2. Guarda tu documento como EB_U2_IN_XXYZ, en formato Word 97-2003, y envíaselo al (a la) Facilitador(a). Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB.

Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en la Actividad 3: Intervalos.

Da clic en el icono para descargar el documento.

Es importante que elabores esta actividad porque la ocuparás para realizar las actividades siguientes.

2.1.4. Tablas de datos

Existen diferentes tipos de tablas para presentar datos, las más utilizadas son: Tabla de datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. Conoce en qué consiste cada una:

Tablas de datosUna tabla de datos es la forma más sencilla de organizar un conjunto de datos y se utiliza cuando la información que necesitas son los datos mismos. Se organizan en columnas o renglones y se registran las mediciones o datos obtenidos.

Ejemplo:Imagina que la medición de temperatura a lo largo del día da como resultado los siguientes valores (en grados Celsius): 20.4°, 21.2°, 22.1°, 23.9°, 25.3°, 26.9°, 27.7°

A partir de estos valores construyes la siguiente tabla:

2.1.5. Tablas de frecuencias

Las tablas de frecuencia aportan mayor información que las tablas de datos, ya que están construidas con las categorías de la variable que se está midiendo y su frecuencia.

Ejemplo:

Page 23: Unidad 1-2-3 EB.doc

Un experimento da como resultado los siguientes valores: 1, 2, 2, 2, 1, 1, 5, 4, 3, 2, 2, 1, 3, 4, 5, 6, 2, 3, 4, 5, 5, 4, 3, 3, 2Si agrupas los datos por categorías, según la frecuencia o número de veces que aparece cada dato, tendrías la siguiente tabla: 

Las tablas de frecuencias pueden construirse anexando las columnas correspondientes a la frecuencia acumulada, la frecuencia relativa y frecuencia relativa acumulada.

2.1.6. Tablas por intervalos de clase

En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores correspondientes a cada variable.

Ejemplo: En una encuesta sobre el desempleo en el área metropolitana de la ciudad de México, se organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de cada intervalo, teniendo un total de 23,700 desempleados.

2.1.7. Tablas de doble entrada

Page 24: Unidad 1-2-3 EB.doc

Estas tablas proporcionan información referente a dos variables o eventos relacionados entre sí. La información se distribuye poniendo en los renglones de la tabla la información de una de las variables y en las columnas la información de la otra variable. Ejemplo: Se cuenta el número de cirugías realizadas por edades en una muestra de 100 personas, los resultados son los siguientes:

En el ejemplo las variables relacionadas son la edad y el número de cirugías.

Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables relacionadas son los rangos contra el valor de las variables en dicho rango. Por ejemplo, imagina que mides la temperatura de un líquido con respecto al tiempo de calentamiento. En el renglón colocas los tiempos y en las columnas la temperatura obtenida. Puedes considerar la tabla como una tabla de frecuencias o como una tabla de doble entrada:

2.2. Representación gráfica de los datos

Introducción

El tema anterior presentó diferentes formas de organizar o de tabular datos y la distribución de frecuencias. Ahora estudiarás la representación gráfica de los datos. Las gráficas son representaciones visuales de los datos que se muestran en una tabla. Existen diferentes tipos de gráficas, cada una de ellas se elabora con base en el tipo de información que se quiere representar.

2.2.1. Histograma

Page 25: Unidad 1-2-3 EB.doc

 El histograma es la representación gráfica de una variable continua. Se elabora en un sistema de coordenadas rectangulares. El eje horizontal se utiliza para representar la variable independiente, es decir, la escala de medición o fronteras de clase. El eje vertical representa la escala de frecuencias. Si los intervalos de clase tienen el mismo ancho, las alturas de las barras serán proporcionales a las frecuencias. El histograma permite apreciar visualmente la distribución y dispersión de las mediciones.

2.2.2. Gráfica de barras

Este tipo de gráfica se utiliza para datos de tipo ordinal, nominal y discreto. En éstas se muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por el área de la barra. Esta gráfica muestra las discontinuidades en las mediciones por medio de espacios vacios entre las barras.

La gráfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

        

  Un histograma y una gráfica de barras son muy semejantes, la diferencia radica en que el histograma no presenta separación entre las barras.

2.2.3. Gráfica de líneas

Una gráfica de líneas también se construye en un sistema coordenado rectangular y muestra la relación entre las variables mediante puntos conectados por líneas continuas. La frecuencia de cada valor medido es representada por la altura del punto.  En el eje horizontal se representa la variable y en el eje vertical, la frecuencia. Se determinan los puntos de corte del valor de la variable con su frecuencia y se unen, obteniéndose la gráfica de línea.

Page 26: Unidad 1-2-3 EB.doc

 

2.2.4. Gráfica de áreas o de pastel

Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. Esta gráfica muestra la relación entre las variables dividiendo un círculo (o pastel) en sectores (o rebanadas). También, se utilizan para representar la distribución de frecuencias, pero es el área de cada sector la proporcional a los valores medidos.Para trazar la gráfica, se hace una distribución proporcional de las frecuencias del problema con respecto a la circunferencia, determinando sectores circulares para cada categoría.

 

Medición en cmFrecuencia

Frecuencia acumulada

Porcentaje

30 3 3 3%30.1 7 10 6%30.2 12 22 10%30.3 18 40 15%30.4. 23 63 19%30.5 21 84 18%30.6 17 101 14%30.7 11 112 9%30.8 5 117 4%30.9 1 118 1%

HistogramaEn esta figura se muestra el histograma de las mediciones en cm vs la frecuencia, nota como el ancho de las clases es el mismo.

Gráfica de pastelEn la gráfica de pastel se muestra dentro de cada “rebanada” la medición en cm y el porcentaje que corresponde a la frecuencia relativa.

Page 27: Unidad 1-2-3 EB.doc

Medición en cmFrecuencia

Frecuencia acumulada

Porcentaje

30 3 3 3%30.1 7 10 6%30.2 12 22 10%30.3 18 40 15%30.4. 23 63 19%30.5 21 84 18%30.6 17 101 14%30.7 11 112 9%30.8 5 117 4%30.9 1 118 1%

Medición en cmFrecuencia

Frecuencia acumulada

Porcentaje

30 3 3 3%30.1 7 10 6%30.2 12 22 10%30.3 18 40 15%30.4. 23 63 19%30.5 21 84 18%30.6 17 101 14%30.7 11 112 9%30.8 5 117 4%30.9 1 118 1%

Gráfica de líneaEn esta figura se muestra la frecuencia acumulada mediante una gráfica de línea.

Actividad 4: Gráficas

Los parámetros que has visto hasta aquí, la organización numérica de los datos en tablas y las representaciones gráficas de éstas, pueden ser realizados de forma manual, pero existen programas informáticos como Excel, software libre y programas especializados para estadística, que permiten realizar todos estos trabajos. Realiza la siguiente actividad:

1. Retoma los problemas que realizaste en la Actividad 2: Frecuencias, con los datos de la tabla elabora las gráficas que revisaste en este tema e inclúyelas en el mismo documento.

2. Entra a la base de datos "Gráficas" y publica tu archivo con la nomenclatura EB_U2_GR_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB.

3. Comparte con tus compañeros(as) el procedimiento que seguiste para graficar los datos del problema, si utilizaste algún software comenta cuál. Agrega una conclusión sobre la utilidad de la representación gráfica de datos.

4. Consulta las aportaciones de tus compañeros(as) y coméntalas, tratando de complementar las ideas que exponen y tus propias ideas.

Para ingresar a la actividad: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en la Actividad 4: Gráficas.

Page 28: Unidad 1-2-3 EB.doc

Actividad 5: Uso cotidiano de la estadística descriptiva

Como mencionamos al inicio de la unidad, los temas que has visto hasta aquí son procedimientos que utiliza la estadística descriptiva para trabajar con un conjunto de datos. ¿Has pensado que los datos así representados se usan frecuentemente en la vida cotidiana? Investiga al respecto y realiza lo siguiente:

1. Entra al foro Uso cotidiano de la estadística descriptiva y responde las siguientes preguntas:

¿En qué casos de la cotidianeidad se utiliza la estadística descriptiva? ¿Has utilizado la estadística descriptiva?¿Cómo? ¿Cuál es la utilidad de las técnicas de representación numérica y gráfica de datos en la vida

cotidiana?

2. Consulta y comenta las aportaciones de tus compañeros(as), tratando de complementar sus respuestas y las tuyas.

Da clic en el icono para descargar la Rúbrica del foro.

Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en la Actividad 5: Uso cotidiano de la estadística descriptiva.

Autoevaluación

Antes de realizar la evidencia de aprendizaje y con el objetivo de que evalúes los conocimientos que aprendiste en esta unidad, resuelve el ejercicio de autoevaluación.Para ingresar a la autoevaluación: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en la Autoevaluación.

Evidencia de aprendizaje: Representación de datos

 

Para generar la evidencia de aprendizaje de esta unidad realiza lo siguiente:

1. Retoma los datos de la muestra que obtuviste y organízalos en tablas de la siguiente manera:

Elabora una tabla de frecuencias por intervalos con la variable edad para toda la muestra. Para la variable carrera, elabora una tabla de frecuencias simple para cada una de las carreras. Elabora las gráficas correspondientes a cada una de las variables.

2. Organiza tu trabajo de la siguiente manera:

Incluye una presentación donde describas de dónde se obtuvieron los datos y la finalidad del análisis de los mismos.

Page 29: Unidad 1-2-3 EB.doc

El procedimiento que seguiste para obtener la muestra. Las tablas con una descripción. Las gráficas con su respectiva descripción.

 

3. Guarda tu trabajo como EB_U2_EA_XXYZ. Sustituye las dos X por las iniciales de tu nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB.

4. Envía tu trabajo al (a la) Facilitador(a) para que lo revise y te retroalimente. Recuerda que una vez que recibas las observaciones, puedes enviar una segunda versión de tu trabajo con las adecuaciones necesarias.

5. Consulta la escala de evaluación de esta evidencia.

Da clic en el icono para descargar la Escala de evaluación.

Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadística, se enlistarán las actividades, da clic en Evidencia de aprendizaje.

Cierre de la unidad

Has concluido la unidad 2, en la que conociste los fundamentos de la estadística descriptiva, la utilidad de ésta y el tipo de información que puedes obtener a través de ella.Recuerda que la organización de los datos se hace a través de tablas que pueden ser de frecuencias o intervalos de clase.

La frecuencia es el número de veces que se repite un dato. Puede ser:

Frecuencia absoluta Frecuencia acumulada Frecuencia relativa

Frecuencia relativa acumulada

Los intervalos de clase son un conjunto de números comprendidos entre un número límite inferior y un número límite superior.

También las gráficas ayudan a visualizar la información contenida en las tablas de frecuencia.

No olvides que la estadística descriptiva es muy útil en todo tipo de investigaciones; por ejemplo, cuando muestran gráficas o estadísticas en los medios de comunicación.

Para saber más

Consulta la siguiente dirección electrónica para saber más sobre las técnicas para recolectar información: http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf

En la siguiente dirección electrónica puedes encontrar explicaciones, ejemplos y ejercicios sobre los

Page 30: Unidad 1-2-3 EB.doc

temas que se abordaron en esta unidad: http://www.vitutor.com/estadistica.html

Fuentes de consulta

Montgomery, Douglas C. y Runger, George C. (1996). Probabilidad y Estadística aplicadas a la ingeniería (4ª ed.). McGraw-Hill, México.

Walpole, Ronald E., Myers Raymond H., et al. (2007). Probabilidad y Estadística para Ingeniería y ciencias (8ª ed.). México: Pearson Educación.

Intervalos de clase, consultado el 26 de abril de 2010 en: http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadistica_descriptiva_2

Censo y entrevista, consultados el 26 de abril de 2010 en: http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.doc http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf

Unidad 3. Medidas de tendencia central y dispersión

Presentación de la unidad

Para cualquier conjunto de datos estudiados es importante tener un resumen de la información y sus características. Esta información indica cómo se comporta la población de datos que tienes. Para resumir la información se utilizan dos tipos de valores que, en vez de representar cada uno de los datos, representan conjuntos de datos. Estos dos tipos de indicadores estadísticos son: las medidas de tendencia central, que muestran hacia qué valores se agrupan o acumulan los datos; y las medidas de dispersión, que de forma contraria a las anteriores, muestran cómo se dispersan o separan los datos.

Propósito de la unidad

En esta unidad: Aplicarás el procedimiento para obtener las medidas de tendencia central y

dispersión en datos agrupados y no agrupados.

Competencia específica

Utiliza las medidas de tendencia central y dispersión para describir un conjunto de datos mediante la representación numérica y gráfica de la información obtenida en una muestra o población.

Page 31: Unidad 1-2-3 EB.doc

3.1. Medidas de tendencia central

Las medidas de tendencia centralLas medidas de tendencia central son los valores que representan un conjunto de datos de forma tal que te ayudan a saber dónde están acumulados los datos sin indicar cómo se distribuyen. Se llaman así porque tienden a ubicarse en la parte central del conjunto de datos. Las medidas de tendencia central más comunes son: la media aritmética (conocida como media o promedio), la mediana y la moda.

3.1.1. Media

Media aritmética

La media aritmética o, simplemente, media, se denota por x la letra μ según se calcule en una muestra o en la población, respectivamente.  La media  es resultado de dividir la suma de todos los valores de los datos entre el número total de datos.

La manera como se organizan los datos: no agrupados y agrupados (por frecuencias o intervalos),determina la expresión de la fórmula para calcular la media.

Fórmula para datos no agrupados

Los datos no agrupados son aquellos datos que se organizan en una tabla de datos, es decir, cada valor se representa de manera individual. Las fórmulas para calcular la media son:

En estas fórmulas la diferencia radica en que, el total de la población se representa con la letra N y el total de la muestra se representa con la letra n.

Fórmula para datos agrupados en frecuencias

Los datos agrupados en frecuencias son aquellos que se organizan en una tabla de frecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable y, en otra columna, la frecuencia o el número de veces que se repite cada valor en una serie de datos.

Las fórmulas para calcular la media con los datos organizados de esta manera son:

Page 32: Unidad 1-2-3 EB.doc

Fórmula para datos agrupados en intervalos

Los datos agrupados en intervalos son los que se organizan dentro de un rango establecido entre un límite inferior y un límite superior. Recuerda que las tablas de intervalos muestran el número de datos que abarca cada intervalo (frecuencia por intervalo). Las fórmulas para calcular la media con los datos organizados de esta manera son:

Los suguientes documentos te ayudarán a comprender cómo se usan las fórmulas,da clic en los iconos para descargarlos. 

Reglas de las sumatorias   

Ejemplo de media en datos no agrupados   

Ejemplo de media en datos agrupados por frecuencias   

Ejemplo de media en datos agrupados por intervalos

Actividad 1: Medidas de tendencia central. Media

Para realizar las actividades de esta unidad, utilizarás los problemas que resolviste en la Actividad 2: Frecuencias de la Unidad 2. Lo recomendable es que trabajes con las tablas que ya habías elaborado, si no tienes el archivo puedes descargarlo a continuación.

Da clic en el icono para descargar el documento Frecuencias.

Con los datos de este problema, tendrás que obtener las medidas de tendencia central y dispersión que revisarás a lo largo de la unidad, por lo tanto, esta actividad está dividida en seis momentos.

Es importante que la actividad la realices paso a paso, ya que si tienes dudas sobre el uso de las fórmulas,

Page 33: Unidad 1-2-3 EB.doc

puedes consultarlas a tiempo con tu Facilitador(a); además, tendrás que entregar tu trabajo al final del tema.1. Analiza el problema y selecciona la fórmula adecuada para obtener la media aritmética.2. Si tienes dudas sobre el uso de la fórmula que seleccionaste, puedes consultar a tus compañeros(as) y/o

a tu Facilitador(a). Para ello, utiliza el foro Medidas de tendencia central, donde puedes publicar todas tus inquietudes sobre el tema y comentar las de tus compañeros(as).

3. Guarda tu documento como EB_U3_MTC_XXYZ, en formato Word 97-2003. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Recuerda que tu archivo no debe pesar más de 4 MB.

Aún no debes enviar tu documento, recuerda tenerlo a la mano para realizar la Actividad 2. No olvides incluir la fórmula y las operaciones que realices.

Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en Foro: Medidas de tendencia central.

3.1.2. Mediana

Mediana

La segunda medida de tendencia central es la mediana, esta se define como:

 El valor que divide en dos partes iguales una serie de datos, es decir, la cantidad de datos que quedan a la derecha de la mediana es igual a la cantidad de datos que quedan a la izquierda. Se representa por Me. 

Para calcular la mediana, debes hacer lo siguiente:

Para cuando la cantidad de valores es impar

 

Para cuando la cantidad de valores es par

Ordena los valores de menor a mayor y busca el valor del centro.

Por ejemplo:

1. Supón que tienes los siguientes valores: 2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9

2. Ordena:0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9

3. El dato que divide a la mitad es:4, por lo tanto Me: 4

Ordena los valores de menor a mayor, busca y promedia los valores del centro.

Por ejemplo:

1. Supón que tienes los siguientes valores:5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1 ,3, 2

2. Ordena:1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9

3. Busca y promedia los datos del centro: 4+5=9/2= 4.5, por lo tanto Me: 4.5

Mediana en datos agrupados por intervalos

Page 34: Unidad 1-2-3 EB.doc

Cuando quieres calcular la mediana en datos agrupados por intervalos, tienes que buscar el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas, es decir, es necesario localizar el intervalo donde se encuentre N/2, para ello utiliza la siguiente fórmula:

  Donde:

Lies el límite inferior del intervalo donde se encuentra la mediana.es la división de las frecuencias absolutas entre 2.

Fi-1es la frecuencia acumulada anterior al intervalo de la mediana.

fies la frecuencia absoluta del intervalo donde se encuentra la mediana.

ai es la amplitud del intervalo.Lee el documento Mediana por intervalos. 

Ejemplo de mediana por intervalos

Actividad 2: Medidas de tendencia central. Mediana

1. Retoma el problema que utilizaste en la actividad anterior para obtener la media aritmética.

2. Con los datos obtenidos, calcula la mediana, incluyendo fórmula y las operaciones que realices.

3. Recuerda  que en el foro Medidas de tendencia central, puedes plantear tus dudas sobre el tema.

4. La nomenclatura que debe tener tu archivo es la misma que se definió en la actividad anterior, EB_U3_MTC_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Recuerda que tu archivo no debe pesar más de 4 MB.

Nota: Todavía no debes enviar tu documento, consérvalo.

3.1.3. Moda

La tercera medida de tendencia central es la moda.La moda es el valor que tiene mayor frecuencia absoluta, es decir, el valor que se repite más veces en una serie de datos. La moda se denota por Mo.