Transcript
Page 1: ESTADISTICA DEFINICIONES

Agregar a favoritos     Invitar a un amigo     Ayuda     Português

 ¡Regístrese!  |  Iniciar sesión

Busqueda avanzada

Monografías

Nuevas

Publicar

Blogs

Foros

Monografias.com > Matematicas > Estadistica

  Descargar   Imprimir   Comentar   Ver trabajos relacionados

Anuncios GoogleDetecte el uso de Drogas Nuestro test de drogas detecta el consumo de drogas en solo minutoswww.test123-colombia.com

Doctorado a Distancia Obtenga su Doctorado a distancia Estudios universitarios a distanciawww.aiu.edu

Anotaciones básicas de estadísticaEnviado por nagomez0

Anuncios Google:

Módulos LCD gráficosTodos tamaños, colores, interfaces Gran soporte técnico y precios | www.crystalfontz.com

Equipo RadiofrecuenciaReduce la celulitis mejora textura y tonifica la piel | www.estetique.com

1. Presentaciones en tablas : 2. Métodos gráficos : 3. Bibliografia

1. Presentaciones en tablas:

0

and

En el índice

Page 2: ESTADISTICA DEFINICIONES

Primero definiré que es una tabla para luego trabajar las diferentes clases de tablas pedidas:

Una tabla es un cuadro que consiste en la disposición conjunta, ordenada y normalmente totalizada, de las sumas o frecuencias totales obtenidos en la tabulación de los datos, referentes a las categorías o dimensiones de una variable o de varias variables relacionadas entre sí. Las tablas sistematizan los resultados cuantitativos y ofrecen una visión numérica, sintética y global del fenómeno observado y de las relaciones entre sus diversas características o variables. En ella, culmina y se concreta definitivamente la fase clasificatoria de la investigación cuantitativa.

Teniendo la definición de lo que es una tabla, podemos trabajar entonces cada uno de los tipos de tablas pedidos:

Tabla de entrada de datos: Es una tabla en la cual solo aparecen los datos que se obtuvieron de la investigación científica o del experimento. Es la tabla más sencilla y se utiliza cuando no se necesita mayor información acerca de los datos, estas tablas se construyen por medio de la tabulación de los datos, este procedimiento es relativamente sencillo, para realizarlo nos ocupamos de un conjunto de datos estadísticos obtenidos al registrar los resultados de una serie de n repeticiones de algún experimento u observación aleatoria, suponiendo que las repeticiones son mutuamente independientes y se realizan en condiciones uniformes, es importante decir que el resultado de cada observación puede expresarse de forma numérica, para este tipo de tablas de entrada de datos se puede trabajar con una ó mas variables, de manera que nuestro material estadístico consiste en n valores observados de la variable Xj.

Los valores observados se suelen registrar, en primer lugar en una lista, si él numero de observaciones no excede de 20 ó 30, estos datos se registran en orden creciente de magnitud.

Con los datos de esta tabla pueden hacerse diversas representaciones gráficas y calcularse determinadas características numéricas como la media, la mediana,etc.

EJ: Agrupar en una tabla de datos

10, 1, 6, 9, 2, 5, 7, 4, 3, 8

X 1 2 3 4 5 6 7 8 9 10

Tablas de frecuencias: Una tabla de frecuencia esta formada por las categorías o valores de una variable y sus frecuencias correspondientes. Esta tabla es lo mismo que una distribución de frecuencias. Esta tabla se crea por medio de la tabulación y agrupación, la cual es un método sencillo como lo habíamos empezado a ver en la tabla de datos, Se realiza el mismo procedimiento de tabulación anteriormente descrito si el numero de valores observados para la variable, se trabaja con una sola variable, descontando los repetidos son pequeños, si existen repetidos la frecuencia f es el numero de repeticiones de un valor de X dado, Sin embargo, cuando el conjunto de datos es mayor, resulta laborioso trabajar directamente con los valores individuales observados y entonces se lleva a cabo, por lo general, algún tipo de agrupación como paso preliminar, antes de iniciar cualquier otro tratamiento de los

Page 3: ESTADISTICA DEFINICIONES

datos. Las reglas para proceder a la agrupación son diferentes según sea la variable, discreta o continua, para una variable discreta suele resultar conveniente hacer una tabla en cuya primera columna figuren todos los valores de la variable X representados en el material, y en la segunda, la frecuencia f con que ha aparecido cada valor de X en las observaciones.

Para una variable continua, el procedimiento de agrupación es algo más complicado. Se toma un intervalo adecuado sobre el eje de la variable que contenga los n valores observados, y divídase el intervalo en cierto numero de intervalos de clase. Todas las observaciones que pertenecen al mismo intervalo de clase se agrupan y cuentan, y él numero que resulte representa la frecuencia de clase correspondiente a dicho intervalo, luego se forma una tabla, en cuya primera columna figuran los limites de cada intervalo de clase, y en la segunda aparecen las correspondientes frecuencias.

Estas clases de tablas son las mas usadas y brindan mayor información de los datos que las tablas de entradas de datos, efectivamente, una tabla de este tipo dará en forma abreviada, una información completa acerca de la distribución de los valores observados. Con estas se pueden utilizar mas a fondo los métodos gráficos al igual que los métodos aritméticos.

Ej: Agrupar en una tabla 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5

X F

1 2

2 4

3 3

4 1

5 1

S 11

Agrupar en una tabla las siguientes estaturas: 160, 168, 175, 183, 170, 164, 170, 184, 171, 168, 187, 161, 183, 175, 185, 186, 187, 164, 165, 175, 162, 188, 169, 163, 166, 172, 173, 167, 174, 176, 178, 179, 177

X F

160-165 6

265-270 6

170-175 6

Page 4: ESTADISTICA DEFINICIONES

175-180 7

180-185 3

185-190 5

S 33

Tablas de doble entrada: También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o numero de elementos que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla. Para la tabulación de un material agrupado de observaciones simultaneas de dos variables aleatorias necesitaremos una tabla descrita como anteriormente lo describimos, las reglas para agrupar son las mismas que en el caso de una sola variable.

Este tipo de tablas brindan información estadística de dos eventos relacionados entre sí, es útil en casos en los cuales los experimentos son dependientes de otro experimento, mas adelante aparecen mas aplicaciones del análisis estadístico bivariable.

Ej:

T1/T2 SÍ NO

SÍ 12 2

NO 10 4

1.2. Métodos gráficos:

Primero definiré lo que es un gráfico o diagrama en estadística

Un diagrama es una especie de esquemático, formado por líneas, figuras, mapas, utilizado para representar, bien datos estadísticos a escala o según una cierta proporción, o bien los elementos de un sistema, las etapas de un proceso y las divisiones o subdivisiones de una clasificación. Entre las funciones que cumplen los diagramas se pueden señalar las siguientes:

Hacen más visibles los datos, sistemas y procesos Ponen de manifiesto sus variaciones y su evolución histórica o espacial. Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de un

proceso y representar la correlación entre dos o más variables.

Page 5: ESTADISTICA DEFINICIONES

Sistematizan y sintetizan los datos, sistemas y procesos. Aclaran y complementan las tablas y las exposiciones teóricas o cuantitativas. El estudio de su disposición y de las relaciones que muestran pueden sugerir

hipótesis nuevas.

Algunos de los diagramas más importantes son el diagrama en árbol, diagrama de áreas o superficies, diagrama de bandas, diagrama de barras, diagrama de bloques, diagrama circular, diagrama circular polar, diagrama de puntos, diagrama de tallo y hoja diagrama, histogramas y gráficos de caja y bigote o boxplots.

2.1 Gráficos univariados: Para trabajar los gráficos univariables debemos primero saber lo que es el análisis estadístico univariable y después de esto trabajaremos los métodos pedidos

El análisis estadístico que opera con datos referentes a una sola variable o distribución de frecuencias y pretende determinar sus propiedades estadísticas. El a.e.u. proporciona al analista medidas representativas de la distribución o promedios, índices de dispersión de los datos de la distribución, procedimientos para normalizar los datos, medidas de desigualdad de unos datos en relación con otros y por ultimo medidas de la asimetría de la distribución.

Gráficos de puntos: Es una variación del diagrama lineal simple el cual esta formado por líneas rectas o curvas, que resultan de la representación, en un eje de coordenadas, de distribuciones de frecuencias, este construye colocando en el eje x los valores correspondientes a la variable y en el eje de las ordenadas el valor correspondiente a la frecuencia para este valor. Proporciona principalmente información con respecto a las frecuencias. Este se usa cuando solo se necesita información sobre la frecuencia.

Cuando la muestra se agrupa por intervalos se trabaja con la marca de clase del intervalo de clase, la marca de clase es el punto medio del intervalo

EJ: Duración de tubos de neón

X(horas) Xm F

300-400 350 2

400-500 450 6

500-600 550 10

600-700 650 8

700-800 750 4

S 30

Page 6: ESTADISTICA DEFINICIONES

Gráficos de tallo y hoja: es una forma rápida de obtener una representación visual ilustrativa del conjunto de datos, para construir un diagrama de tallo y hoja primero se debe seleccionar uno ó más dígitos iniciales para los valores de tallo, el dígito o dígitos finales se convierten en hojas, luego se hace una lista de valores de tallo en una columna vertical. Prosiguiendo a registrar la hoja por cada observación junto al valor correspondiente de tallo, finalmente se indica las unidades de tallos y hojas en algún lugar del diagrama, este se usa para listas grandes y es un método resumido de mostrar los datos, posee la desventaja que no proporciona sino los datos, y no aparece por ningún lado información sobre frecuencias y demás datos importantes.

Ej: realice un diagrama de tallo y hoja para los siguientes datos de distancias en yardas de una cancha de golf

6435 6464 6433 6470 6526 6527 6506 6583 6605 6694 6614 6790 6770 6700 6798 6770 6745 6713 6890 6870 6873 6850 6900 6927 6936 6904 7051 7005 7011 7040 7050 7022 7131 7169 7168 7105 7113 7165 7280 7209

Diagramas de barras: nombre que recibe el diagrama utilizado para representar gráficamente distribuciones discretas de frecuencias no agrupadas. Se llama así porque las frecuencias de cada categoría de la distribución se hacen figurar por trazos o columnas de longitud proporcional, separados unos de otros. Existen tres principales clases de gráficos de barras:

Barra simple: se emplean para graficar hechos únicos Barras múltiples: es muy recomendable para comprar una serie estadística con otra,

para ello emplea barras simples se distinto color o tramado en un mismo plano cartesiano, una al lado de la otra

Barras compuestas: en este método de graficacion las barras de la segunda serie se colocan encima de las barras de la primera serie en forma respectiva.

El diagrama de barras proporciona información comparativa principalmente y este es su uso principal, este diagrama también muestra la información referente a las frecuencias

Page 7: ESTADISTICA DEFINICIONES

Ej:

CIUDAD TEMPERATURA

A 12

B 18

C 24

TIENDA Enero Febrero Marzo abril mayo Junio

A 800 600 700 900 1100 1000

B 700 500 600 1000 900 1200

Page 8: ESTADISTICA DEFINICIONES

Histogramas: Se emplea para ilustrar muestras agrupadas en intervalos. Esta formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con los limites de los intervalos y el centro de cada intervalo es la marca de clase, que representamos en el eje de las abscisas. La altura de cada rectángulo es proporcional a la frecuencia del intervalo respectivo. Esta proporcionalidad se aplica por medio de la siguiente formula

Altura del rectángulo = frecuencia relativa/longitud de base

El histograma se usa para representar variables cuantitativas continuas que han sido agrupadas en intervalos de clase, la desventaja que presenta que no funciona

para variables discretas, de lo contrario es una forma útil y practica de mostrar los datos estadísticos.

EJ:

X Xm F

118-126 122 2

126-134 130 3

134-142 138 8

142-150 146 12

150-158 154 7

158-166 162 5

166-174 170 2

174-182 178 1

S 40

Page 9: ESTADISTICA DEFINICIONES

Diagramas de caja o boxplots: los pasos para construirlo son los siguientes: dibujar y marcar un eje de medida horizontal construir un rectángulo cuyo borde izquierdo esta arriba del cuarto inferior y cuyo

borde derecho esta arriba del cuarto superior dibujar un segmento de recta vertical dentro de la caja arriba de la mediana prolongar rectas desde cada extremo de la caja hasta las observaciones más lejanas

que estén todavía a menos de 1.5fs de los bordes correspondientes dibujar un circulo abierto para identificar cada observación que caiga entre 1.5fs y

3fs del borde al cual esta más cercano estas se llaman puntos inusuales suaves dibujar un circulo de línea llena para identificar cada observación que caiga a mas

de 3fs del borde más cercano, estas se llaman puntos inusuales extremos

donde fs= cuarto superior – cuarto inferior

este diagrama se usa cuando se necesita la mayor información acerca de la distribución de los datos, la ventaja que posee con respecto a los demás diagramas es que este gráfico posee características como centro y dispersión de los datos, y la principal desventaja que posee es que no presenta ninguna información acerca de las frecuencias que presentan los datos

EJ: Para los siguientes datos realice un diagrama de caja: 2.68 3.06 4.31 4.71 5.71 5.99 6.06 7.04 7.17 7.46 7.50 8.27 8.42 8.73 8.84 9.14 9.19 9.21 9.39 11.28 15.19 21.06

Gráficos de sectores: es un gráfico que se basa en una proporcionalidad entre la frecuencia y el ángulo central de una circunferencia, de tal manera que a la frecuencia total le corresponde el ángulo central de 360°. Para construir se aplica la siguiente formula:

X = frecuencia relativa * 360°/S frecuencia relativa

Este se usa cuando se trabaja con datos que tienen grandes frecuencias, y los valores de la variable son pocos, la ventaja que tiene este diagrama es que es fácil de hacer y es entendible fácilmente, la desventaja que posee es que cuando los valores de la variable son muchos es casi imposible o mejor dicho no informa mucho este diagrama y no es productivo, proporciona principalmente información acerca de las frecuencias de los datos de una manera entendible y sencilla.

EJ: Representar mediante un gráfico de sectores la frecuencia con que aparece cada una de las cinco vocales en el presente párrafo:

Vocal a e i o u

Frecuencia 13 20 4 6 3 S 46

Page 10: ESTADISTICA DEFINICIONES

2.2 gráficos bivariados: Para trabajar los diagramas de dispersión, primero debemos saber que es el análisis estadístico bivariable y las ventajas que este tiene

El análisis estadístico bivariable es aquel análisis que opera con datos referentes a dos variables y pretende descubrir y estudiar sus propiedades estadísticas. El análisis estadístico bivariable se orienta fundamentalmente a la normalización de los valores o frecuencias ce los datos brutos, determina la existencia, dirección y grado de la variación conjunta entre las dos variables, lo que se realiza mediante él calculo de los coeficientes de correlación pertinentes, calcula la covarianza o producto de las desviaciones de las dos variables en relación a sus medias respectivas y por ultimo establece la naturaleza y forma de la asociación entre las dos variables en el caso de las variables de intervalo.

Diagrama de dispersión: es un diagrama que representa gráficamente, en un espacio de ordenadas, los puntos de dicho espacio que corresponden a los valores correlativos de una distribución bivariante conjunta, estos diagramas deben usarse cuando tenemos un análisis estadístico bivariable, ósea una tabla de datos de doble entrada, la ventaja que tienen es que se puede graficar de una forma sencilla una distribución bivariante conjunta y la desventaja principal es que no funciona si sucede que una dupla se repita

EJ:

X Y

A 2 3

B 4 1

C 5 4

D 3 6

E 2 8

Page 11: ESTADISTICA DEFINICIONES

BIBLIOGRAFIA

Sierra Bravo. R. Diccionario Practico de Estadística, Ed Paraninfo S.A. Madrid. España, pags 56-57, 177-187, 427-432.

Serrano Rodríguez, Javier. Introducción a la Estadística. Ed universitaria de América LIDA, Bogotá, Colombia. Pag 30-49

Devore, Jay L. Probabilidad y Estadística para ingeniería y ciencias, Ed Thomson, 4ta Edición, pags 7-37.

1. Escalas de medición:

Corresponde a la Situación 1, es decir, es una escala en que se establece un número determinado de clases o categorías de tal modo que cada elemento de la población pertenece a una y sólo una clase. Matemáticamente se dice que se ha establecido una relación de equivalencia entre los elementos de la población. Si sólo existen dos clases se denomina escala dicotómica. La única operación matemática que se puede realizar con las clases de cualquier escala nominal es determinar las cantidades de elementos que les corresponden determinar sus frecuencias.

Por ejemplo:

Sexo: las clases son masculino o femenino. Especialidad: las diferentes especialidades (carreras) del CRUSAM. Número de cedula de identidad personal. Temperatura de una persona: sanguíneo, flemático, melancólico, colérico. Número de placa de automóviles del país.

Page 12: ESTADISTICA DEFINICIONES

a. Escala Nominal:

Corresponde a la Situación 1, es decir, es una escala en que se establece un número determinado de clases o categorías de tal modo que cada elemento de la población pertenece a una y sólo una clase. Matemáticamente se dice que se ha establecido una relación de equivalencia entre los elementos de la población. Si sólo existen dos clases se denomina escala dicotómica. La única operación matemática que se puede realizar con las clases de cualquier escala nominal es determinar las cantidades de elementos que les corresponden determinar sus frecuencias.

Por ejemplo:

Sexo: las clases son masculino o femenino. Especialidad: las diferentes especialidades (carreras) del CRUSAM. Número de cedula de identidad personal. Temperatura de una persona: sanguíneo, flemático, melancólico, colérico. Número de placa de automóviles del país.

a. Escala Ordinal:

Corresponde a la Situación 2. Es una escala nominal entre cuyas clases está definido un orden, de modo que cualquiera que sean dos de ellas, una será mayor o superior, en algún sentido, que la otra.

Por ejemplo:

Evaluaciones en un examen: 5, 4, 3 y 2. Grado de satisfacción de una necesidad: alto, medio, bajo Conocimiento de un idioma: excelente, bien, regular, mal

a. Escala de Intervalos:

Corresponde a la situación 3 y no es más que una escala ordinal con una distancia, una unidad de medida entre sus clases de modo tal que dado dos puntajes cualesquiera se puede saber cuan distante está uno del otro. La unidad de medida es arbitraria, pero común y el punto de inicio (cero) es también arbitrario.

Cuando se tiene una escala de intervalo se pueden realizar las operaciones de adición y sustracción, pero no necesariamente la multiplicación y división dentro de la escala.

Por ejemplo:

La temperatura del aire. (caluroso, fresco, agradable, etc.)

a. Escala de Razones:

Corresponde a la situación 4 y es una escala de intervalos donde existe un cero absoluto que marca la ausencia total del atributo en estudio.La proporción entre los atributos de dos individuos cualesquiera es independiente de la escala de medida utilizada. En ella la razón entre dos clases (puntajes) cualesquiera permanece invariable ante toda la transformación de la escala de razón, o sea ante toda

Page 13: ESTADISTICA DEFINICIONES

transformación del tipo y=Φ(x). De aquí que siempre el cero de la escala transformada coincide con el cero de la escala original.

En las escalas de razones es posible realizar todas las operaciones aritméticas con los puntajes.

Por ejemplo:

Estatura de los alumnos: la estatura en metros es proporcional a la estatura en pulgadas.

Peso de los alumnos: (en libras o kilogramos) El tiempo invertido en una prueba de velocidad en educación física (en

minutos o segundos).

1.2. La representación de los datos: FRECUENCIAS.

Cuando se reúne gran cantidad de datos primarios es útil distribuirlos en clases y categorías y determinar las frecuencias de las clases, o sea, el número de elementos que pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente con las frecuencias de clases se denomina distribución de frecuencias

El caso que se describe a continuación, variables discretas se denomina distribución por conteo de valores individuales. Supongamos que un determinado colectivo, representado por la variable estadística Xi, que para mayor sencillez consideraremos como unidimensional; sean los datos de esta variable (representativo cada uno de ellos de un suceso) X1, X2, … , Xn (supuesto que sean n los valores de la variable considerada.)

Definiremos como frecuencia de un dato el número de veces que este aparece en el colectivo; consecuentemente, si una variable estadística toma r valores, cada uno de los cuales puede repetirse un cierto número de veces, podríamos decir que el número de datos representado por la variable serían N, siendo N la suma de las respectivas frecuencias de cada dato (N=ΣXi).

Este valor N será denominado como frecuencia total, mientras que la frecuencia de cada dato recibirá el nombre de frecuencia absoluta o simplemente frecuencia (fi). La frecuencia absoluta nos habla del número de veces que un dato aparece en un colectivo, más ello no nos dice demasiado en orden al establecimiento de comparaciones sobre la importancia de este dato. Para obtener una idea de la importancia que un dato posee en el seno de un colectivo, puesto que no es suficiente concepto de frecuencia, se utiliza el concepto frecuencia relativa, que se definirá como: el coeficiente entre la frecuencia absoluta del dato considerado y la frecuencia total (fr=fi/ΣXi).

Para efectos prácticos, asumiremos las siguientes definiciones de frecuencias:

frecuencias absolutas : es el número de veces que aparece en la muestra dicho valor de la variable y se representa por fi.

frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fri

Page 14: ESTADISTICA DEFINICIONES

frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadística) en orden ascendente (fa↑) o descendente (fa↓).

frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N) y la denotaremos por fra.

Resumiendo lo expuesto, si Xi es un valor de la variable, podemos representar por fi a su frecuencia y por fi/ΣXi a su frecuencia relativa (siendo ΣXi=N o la frecuencia total). Para el conjunto de los valores de la variable Xi tendríamos, así la tabla #1, compresiva de la información sobre dicha variable, a través de las respectivas frecuencias:

Tabla #1: Variables Discretas

Valores de la variable Xi

(datos)

frecuencias absolutas

fi

frecuencias relativas

fi/N

X1 f1 f1/N

X2 f2 f2/N

… … …

… … …

Xn fn fn/N

Donde: N=Σfi y Σfi/N=1

Otro es el caso de las clases representadas en forma de intervalos, variables continuas, llamados intervalos de clases que poseen extremos llamados limite inferior y limite superior, Un intervalo se dice que es abierto o no cerrado, por un extremo si no contiene el límite correspondiente.

La longitud, tamaño o amplitud de un intervalo de clases (C) es la diferencia entre los limites superior e inferior (C=lim sup – lim inf). El Recorrido (R) es la diferencia entre el dato mayor y el menor del conjunto da datos en estudio (R=Xn – X1)

En el caso de variables continuas será necesario fijar intervalos de frecuencias para llegar a un resumen efectivo de la información original. A menudo es necesario representar una clase, o más particularmente, un intervalo por un único valor, este representará a todo el intervalo y se denominará marca de clases. Matemáticamente

Page 15: ESTADISTICA DEFINICIONES

el punto medio de cada intervalo corresponde a lo que denominamos marca de clase, se denotará por Xi, y constituirá el valor representativo de cada intervalo. El número de observaciones que correspondan a cada intervalo se denominará frecuencias absolutas.

Tabla #2: Variables Continuas

Intervalos

(C)

Marcas de Clases

Xi

Frecuencias Absolutas

fi

X1-X2 X1 f1

X2-X3 X2 f2

… … …

… … …

Xn-1-Xn Xn fn

Donde

N = Σfi = Número de observaciones

C = X’ – X" = Amplitud del intervalo

Por último, en el caso de variables no mensurables, dicha tabla adoptará una forma como la siguiente:

Tabla #3: Variable Ordinales

Variable Frecuencias

Característica A fA

Característica B fB

… …

Page 16: ESTADISTICA DEFINICIONES

… …

Característica Z fZ

1.1.2. Reglas Generales para construir las distribuciones de

frecuencias por intervalos

A = ( X1, X2, … , Xn )

2. Efectuar el arreglo ordenado (Ascendente o Descendente) de la población o muestra

3. Obtener la frecuencia absoluta mediante la tabulación o conteo de los datos (homogenizar los datos)

R = (valor mayor – valor menor) = Xn – X1

4. Encontrar el rango o recorrido (R) de los datos: 5. Encontrar el número de clases o intervalos de clases (K). El número de clases

debe ser tal que se evite el detalle innecesario, pero que no conduzca a la perdida de más información de la que puede ser convenientemente ignorada. Para este cálculo se utiliza la formula de Sturges

K = 1 + 3.322(log. N)

5- Determinar la amplitud de la clase ( C ):

R

C = --------

K

Nota: el resultado siempre se aproxima al siguiente entero si excede al número entero obtenido, no importa el monto de la fracción excedida al entero

˜ C = se lee "se aproxima a…"

6. El dato menor (X1) será el limite inferior de la primera clase. A él se le suma C y se obtiene el limite superior de la primera clase que también será el limite inferior de la segunda clase. Luego se suma nuevamente C y se obtiene el limite superior del segundo intervalo e inferior del tercero. Y así sucesivamente hasta que el limite superior corresponda o supere ligeramente el valor mayor ( Xn ), la cantidad de clases obtenidas deberá corresponder con el número K calculado mediante la formula de Sturges.

7. Una vez construidos los intervalos se calculan, mediante tabulación de acuerdo a los limites inferiores y superiores de las clases, las frecuencias absolutas, relativas, porcentuales y acumuladas correspondientes.

8. Con los datos obtenidos se procede a construir la tabla de distribución de frecuencia.

Page 17: ESTADISTICA DEFINICIONES

1.2. Tabla de distribución de frecuencias.

Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla, que denominaremos distribución de frecuencias, en la que cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc.

Por tanto, llamaremos distribución de frecuencias a un agrupamiento de datos en clases acompañada de sus frecuencias: frecuencias absolutas, frecuencias relativa o frecuencia porcentuales. En caso de que las variables estén al menos en escala ordinal aparecen opcionalmente las frecuencias acumuladas absolutas, y frecuencias acumuladas porcentuales. Las distribuciones de frecuencias varían en dependencia si corresponden a una variable discreta o a una variable continua.

Ejemplo #1: Variable Continua:

La tienda CABRERA’S Y ASOCIADOS estaba interesada en efectuar un análisis de sus cuentas por comprar. Uno de los factores que más interesaba a la administración de la tienda era el de los saldos de las cuentas de crédito. Se escogió al azar una muestra aleatoria de 30 cuentas y se anotó el saldo de cada cuenta (en unidades monetarias) como sigue:

77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99

43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97

32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68

Solución:

1. A= ( 7.42, 8.15, …, …, …, 90.99, 93.91 )

donde: X1 = valor mínimo = 7.42

Xn= valor máximo = 93.91

2. Efectuar el arreglo ordenado de la población o muestra:

R = valor mayor – valor menor = Xn – X1 = 93.91 – 7.42 = 86.49

3. Encontrar el rengo o recorrido de los datos: "R"

K=1+3.322(log N)

Nota: en el ejemplo en estudio N=30 por cuanto que son 30 clientes en la muestra:

K = 1 + 3.322 (log 30)

= 1 + 3.322 (1.477) el log fue obtenido según calculadora

= 1+ 4.9069

= 5.9069 ~6 aproximado al siguiente entero

Page 18: ESTADISTICA DEFINICIONES

4. Encontrar en número de clases "K" , según la fórmula de Sturges: 5. Determinar la amplitud de la clase: "C"

Nota: obsérvese que se va a trabajar con una cifra significativa más cómoda, o sea como los datos están dados en centésimos, se calculo C hasta los milésimos para evitar que algún dato coincida con el límite de clases

Clases P.M.

Xi

fi fr fa↓ fa↑ fra↓ fra↑

7.420 – 21.835 14.628 10 0.33 10 30 0.33 1.00

21.835 – 36.250 29.043 4 0.13 14 20 0.46 0.67

36.250 – 50.665 43.458 5 0.17 19 16 0.63 0.54

50.665 – 65.080 57.873 3 0.10 22 11 0.73 0.37

65.080 – 79.495 72.288 3 0.10 25 8 0.83 0.27

79.495 – 93.910 86.703 5 0.17 30 5 1.00 0.17

Total XXX 30 1.00 XXX XXX XXX XXX

Simbología utilizada:

XI = Punto medio o marca de clases

fi = frecuencia absoluta

fr = frecuencia relativa

fa↓ = frecuencia absoluta acumulada descendente

fa↑ = frecuencia absoluta acumulada ascendente

fra↓ = frecuencia relativa acumulada descendente

fra↑ = frecuencia relativa acumulada ascendente

Nota:

i. Obsérvese que el límite inferior de la primera clase es el valor mínimo ( X1=7.42 ) y el límite superior es el resultado de X1+C = 7.42+14.415 = 21.835.

Page 19: ESTADISTICA DEFINICIONES

ii. El límite inferior de la siguiente clase es igual al límite superior de la clase anterior y el límite superior es el resultado de adicionarle nuevamente la amplitud de la clase ( C ).

iii. Obsérvese que el límite superior de la última clase es igual al valor mayor ( Xn=93.91 )

1.2. Representaciones Gráficas de la Distribución de

Frecuenciasa. Los Cuadros estadísticos:

La estadística es una disciplina que nos enseña a organizar los datos recogidos para poder analizar sus características y posteriormente inferir, a partir de las muestras tomadas, las características de la población investigada. Los cuadros o tablas corresponden a arreglos sistemáticos de los datos por filas y columnas y son un buen complemento del texto en los informes

El primer procedimiento estadístico consiste en tabular los datos según el tipo de escala de medición utilizada. La tabulación de los datos conlleva a representar la información a través de tablas que de forma general contiene las siguientes partes fundamentales:

1.2. Numeración (siempre que se presenten dos o más cuadros)

3. Título: es la descripción que precede al cuadro, la cuál deberá estar redactada en forma breve y clara, de tal manera que exprese su contenido, siguiendo el ordenamiento del mismo. Es necesario abarcar las características: Qué, Dónde, Cómo y Cuándo

4. Encabezamiento: se refiere al número de atributos o variables que se quieren representar en el cuadro y se anotan como denominaciones de las columnas y subcolumnas; puede ser unidimensional, bidimensonial o multidimensional. Los títulos de las columnas van en mayúsculas y los subtítulos en minúsculas

5. Cuerpo: es el conjunto de columnas y líneas que contiene el cuadro en orden vertical y horizontal, donde se colocan los datos sobre los hechos observados

6. Pie: se refiere a la información adicional necesaria a saber: notas, llamadas, fuentes de información y otras. Se anotan en el espacio debajo de la línea inferior que limita el cuerpo del cuadro.

a. Los Gráficos Estadísticos:

El gráfico es quizás el auxiliar más valioso y utilizado para expresar datos estadísticos, este elemento no le añade novedad a las tablas o cuadros estadísticos, es de fácil comprensión y accesible a un número mayor de usuarios. El gráfico además de

Page 20: ESTADISTICA DEFINICIONES

expresar visualmente los hechos más importantes de la información numérica, permite una mejor y más fácil comprensión y ahorra tiempo y esfuerzo en el análisis de datos estadísticos al facilitar su apreciación visual en forma conjunta:

-Histogramas de frecuencias:

Un histograma es un gráfico que sirve para representar una distribución de frecuencias. Este gráfico está formado por un conjunto de rectángulos (caso de variables continuas) que tienen como base un eje horizontal (generalmente el eje de las abscisas o de las X), y como centro los puntos medios de las clases. Los anchos de las clases y las áreas de los rectángulos son proporcionales a las frecuencias de las clases. En el caso de las variables discretas el gráfico consiste de un conjunto de barras verticales en lugar de rectángulos, hallándose cada barra sobre la observación respectiva y con una altura proporcional a la frecuencia de la observación

- Polígono de frecuencias:

El polígono de frecuencias es un gráfico formado por líneas quebradas, que tiene los centros de las clases representadas en un eje horizontal (eje de las X) y las frecuencias de las clases en un eje vertical (eje de las Y). La frecuencia correspondiente a cada centro de clase se señala mediante un punto y luego los puntos consecutivos se unen por líneas rectas. Del correspondiente histograma se puede lograr el polígono de frecuencia uniendo los puntos medios de las bases superiores de cada rectángulos mediante líneas rectas.

Page 21: ESTADISTICA DEFINICIONES

-Ojivas:

Las ojivas se refieren a los gráficos que se construyen utilizando una distribución acumulativa de frecuencias, el orden de acumulación se aplica al cuadro de distribución de frecuencia y puede ser descendente (fa↓, fra↓) o ascendente (fa↑, fra↑). La figura que se forma al unir los puntos del polígono de frecuencias acumulativas es lo contrario del orden anunciado (por ejemplo si se utilizó el orden descendente en la acumulación de los datos en el cuadro, la ojiva resulta ser ascendente).

Page 22: ESTADISTICA DEFINICIONES

LABORATORIO

(Resolver y entregar en grupos de tres estudiantes, equivalen a nota de un parcial)

Problema #1: Variable Continua

En la siguiente tabla se presentan los pesos de 40 estudiantes de la Universidad de Panamá, con una aproximación de una libra.

138 164 150 132 144 125 149 157

146 164 140 147 136 148 152 144

168 126 138 176 163 118 154 165

146 173 142 147 135 153 140 135

161 145 135 142 150 156 145 126

a. Construya una tabla de distribución de frecuencias, indicando las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas.

b. Construya un histograma, un polígono de frecuencias y una ojiva de la distribución.

Page 23: ESTADISTICA DEFINICIONES

Problema #2: Variable Discreta:

Una encuesta entre un grupo de madres-solteras, para analizar los problemas económicos que enfrentan, en determinada comunidad; arrojó los siguientes resultados acerca del número de niños en el hogar.

1 4 2 3 5 3 5 3 3 5

1 1 2 1 4 1 2 1 4 1

2 1 1 2 1 2 3 2 3 3

3 1 3 4 1 1 3 5 4 2

2 5 1 4 2 3 1 2 5 1

a. Construya una tabla de distribución de frecuencias y sus respectivas representaciones gráficas.

Problema #3:

Una compañía de transmisiones electrónicas registro como sigue el número de recibos de servicios prestados por cada una de sus 20 sucursales en el último mes:

808 641 628 731 641 446 342 545 910 568

335 459 727 848 229 347 309 649 575 757

La compañía piensa que una tienda realmente no puede esperar alcanzar financieramente el punto de equilibrio con menos de 456 servicios prestados mensualmente. Además su política es dar un bono financiero al gerente que genere más de 683 servicios al mes. Disponga los datos en una arreglo e indique cuántas sucursales no están consiguiendo el punto de equilibrio y cuántas ganan el bono.

Problema #4:

Una agencia de viajes ofrece precios especiales en ciertas travesías por el Caribe. Planea ofrecer varios de estos paseos durante la próxima temporada invernal en el hemisferio norte y desea enviar folletos a posibles clientes. A fin de obtener el mayor provecho por cada unidad monetaria gastada en publicidad, necesita la distribución de las edades de los pasajeros de travesías anteriores. Se consideró que si participaban pocas personas de un grupo de edad en los paseos no sería económico enviar un gran número de folletos a personas de ese grupo de edad. La agencia seleccionó una muestra de 40 clientes anteriores de sus archivos y se registró sus edades, como sigue:

77 18 63 84 38 54 50 59

54 56 36 50 50 34 44 41

Page 24: ESTADISTICA DEFINICIONES

58 58 53 62 62 43 52 53

63 62 62 61 61 52 60 60

45 66 83 63 63 58 61 71

a. Organice los datos en una tabla de distribución de frecuencias de las edades de los clientes en la muestra

b. ¿Cuál grupo de edad presenta la mayor frecuencia relativa? ¿Cuál la menor frecuencia relativa?.

c. Saque conclusiones que puedan ayudar a la agencia a planear una campaña de publicidad para los paseos invernales.

BIBLIOGRAFÍA

Caballero , Wilfredo Introducción a la Estadística

Serie Libros y Materiales Educativos N° 28

I edición. San José, Costa Rica

IICA, 1981

Carrasquilla E. Pedro Manual para la confección de gráficos estadístico

DEC-CGR, Dirección de Estadísticas y Censos

Panamá. República de Panamá.

DEC-CGR Manual para la elaboración y publicación de

Cuadros estadísticos (tercera edición)

Dirección de estadística y Censos.

Panamá. República de Panamá.

Nuñez del Benavente Estadística básica para planificación. 6ta.edición

Arturo Siglo XX! Editores S.A,

México. 1977

1.2.-La Media Aritmética ():La medida de tendencia central más ampliamente usada es la media aritmética, usualmente abreviada como la media y denotada por (léase como "X barra").

La media aritmética para datos no agrupados

Page 25: ESTADISTICA DEFINICIONES

Si se dispone de un conjunto de n números, tales como X1, X2, X3,…,Xn, la media aritmética de este conjunto de datos se define como "la suma de los valores de los ni números , divididos entre n", lo que usando los símbolos explicados anteriormente , puede escribirse como:

Ejemplo:Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 27,34 y 25., para calcular la media aritmética (promedio de las edades, se tiene que:

La media aritmética para datos agrupados Si los datos se presentan en una tabla de distribución de frecuencias, no es posible conocer los valores individuales de cada una de las observaciones, pero si las categorías en las cuales se hallan. Para poder calcular la media, se supondrá que dentro de cada categoría, las observaciones se distribuyen uniformemente dentro alrededor del punto medio de la clase, por lo tanto puede considerarse que todas las observaciones dentro de la clase ocurren en el punto medio, por lo expuesto la media aritmética para datos agrupados puede definirse de la siguiente manera:Si en una tabla de distribución de frecuencia, con r clases, los puntos medio son: X1, X2, X3,…,Xn; y las respectivas frecuencias son f1, f2, f3, … , fn, la media aritmética se calcula de la siguiente manera:

donde: N = número total de observaciones, por tanto Σfi puede simplificarse y escribirse como N ( N= Σfi )Ejemplo:Si se toman los datos del ejemplo resuelto al construir la tabla de distribución de frecuencia de las cuentas por cobrar de Cabrera’s y Asociados que fueron los siguientes:Clases 1 2 3 4 5 6Puntos Medios (Xi) 14,628 29,043 43.458 57,873 72.288 86.703Frecuencias (fi) 10 4 5 3 3 5Al calcular la cuenta promedio por cobrar (media aritmética) de estos datos se tiene lo siguiente:

Page 26: ESTADISTICA DEFINICIONES

Media aritmética ponderada

Por otro lado, si al promediar los datos estos tienen diferentes pesos, entonces estamos ante un caso de media aritmética ponderada, que puede definirse de la siguiente maneraDefinición:Sea dado un conjunto de observaciones, tales como X1, X2; X3; … ; Xn; y un conjunto de valores p1, p2; p3; … ; pn; asociado con cada observación Xi respectivamente, que reciben el nombre de factores de ponderación, entonces la media ponderada se calcula como:

Ejemplo:En el curso de estadística del Prof. Cabrera la nota semestral se calcula como una media ponderada. Por cuanto que el promedio de laboratorios representa el 30% de la nota semestral. El promedio de ejercicios parciales representa el 30% y el examen semestral el restante 40%.Si obtiene en este curso los siguientes promedios al final del semestre: laboratorios 90 pts. Parciales 75% pts. Y en el examen semestral 70 pts.; el promedio semestral se calcula de la siguiente forma.:

La nota semestral de 77.5 corresponde a "C".

Propiedades de la media aritmética

Puede ser calculada en distribuciones con escala relativa y de intervalos .Todos los valores son incluidos en el cómputo de la media. Una serie de datos solo tiene una media. Es una medida muy útil para comparar dos o más poblaciones Es la única medida de tendencia central donde la suma de las desviaciones de cada valor

respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto de balance de una serie de datos.

Page 27: ESTADISTICA DEFINICIONES

Desventajas de la media aritmética

Si alguno de los valores es extremadamente grande o extremadamente pequeño, la media no es el promedio apropiado para representar la serie de datos.

No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.

1.3.- La Mediana (X0.5): Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeños, la media aritmética no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana., y denotada por X0.5La mediana es una medida de posición y se define como la posición central en el arreglo ordenado de la siguiente manera:Dado un conjunto de números agrupados en orden creciente de magnitud, la mediana es el número colocado en el centro del arreglo, de tal forma que una mitad de las observaciones está por encima y la otra por debajo de dicho valor. Si el número de observaciones es par, la mediana es la media de los dos valores que se hallan en el medio del arreglo, de donde se concluye en la siguiente definición:Mediana. Es el punto medio de los valores de una serie de datos después de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos

La Mediana para datos no agrupados.Sea X1, X2; X3; … ; Xn; una sucesión de datos, la mediana denotada por X0.5 se calcula de la siguiente manera:X0.5 = X (n+1)/2 si n es parXn/2 + X(n/2)+1X0.5= ---------------------- si n es impar2Nota: El resultado obtenido en la formula corresponde al número de la observación en el arreglo, por tanto debe reemplazarse por el valor de dicha variable en el arreglo. Ejemplo: (n es impar)Se tienen las edades de cinco estudiantes universitarios de I año, a saber: 18,23,25.27 y 35. Obsérvese que los datos deben estar ordenados en un arreglo ascendente o descendente.Por cuanto que el número de datos es cinco (n=5) y es impar, entonces

X0.5 = Xn+1/2 = X(5+1)/2 = X6/2 = X3 = 25 añosNota: obsérvese que se obtuvo el número de la variable mediana (X3) que en el arreglo de edades ordenado en forma ascendente corresponde a 25 años (X3=25)Continuación del ejemplo…(n es par)

Page 28: ESTADISTICA DEFINICIONES

Si el número de estudiantes hubiere sido par, suponga que se adiciona un estudiante con 31 años, entonces el arreglo ascendente consecuente sería 18, 23, 25, 27, 31 y 35, entonces la mediana se calcula asi:

La mediana para datos agrupados

Si se tiene una distribución de frecuencias, la mediana es igualmente ese valor que tiene 50% de las observaciones por debajo y 50 % por encima. Geométricamente, la mediana es el valor de X sobre el eje de las abscisas correspondiente a la ordenada que divide un histograma en dos partes de igual área.Para hallar el valor de la mediana, en el caso de datos agrupados debe encontrarse primero la clase mediana, la que se define como la clase más baja para la cual la frecuencia acumulada excede N/2 (siendo N=Σfi ). Encontrada esta clase, la siguiente formula servirá para hallar el valor de la mediana

N/2 – faX0.5 = Li + ------------- ( C )

fidonde:L = límite inferior de la clase mediana.N = frecuencia total o Σfi.fa = frecuencia absoluta acumulada hasta la clase premedianafi = frecuencia absoluta de la clase medianaC = amplitud de la clase mediana.Ejemplo:Si se toman los datos obtenidos del ejemplo resuelto al construir la tabla de distribución de frecuencias de las cuentas por cobrar de la tienda Cabrera’s y Asociados que fueron las siguientes

Clases P.M.Xi

fi fr fa↓ fa↑ fra↓ fra↑

7.420 – 21.835 14.628 10 0.33 10 30 0.33 1.00

21.835 – 36.250 29.043 4 0.13 14 20 0.46 0.67

36.250 – 50.665 43.458 5 0.17 19 16 0.63 0.54

50.665 – 65.080 57.873 3 0.10 22 11 0.73 0.37

65.080 – 79.495 72.288 3 0.10 25 8 0.83 0.27

79.495 – 93.910 86.703 5 0.17 30 5 1.00 0.17

Page 29: ESTADISTICA DEFINICIONES

Total XXX 30 1.00 XXX XXX XXX XXX

Si se desea calcular la mediana, es necesario primero encontrar la clase mediana, que será aquella que en teoría contenga el dato N/2 = 30/2 = 15, que corresponde con la tercera clase por cuanto que la frecuencia acumulada (fa) hasta esa clase es 19, luego entonces:

Respuesta: La mediana de cuentas por cobrar es B/.39.133

Propiedades de la mediana

Hay solo una mediana en una serie de datos. No es afectada por los valores extremos ( altos o bajos ) Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se encuentra

en el intervalo abierto. Puede ser calculada en distribuciones con escala relativa, de intervalos, y ordinal.

1.3.- La Moda (Mo.):A veces es importante conocer cuál es el valor que más prevalece en el conjunto de datos. El valor que ocurre con más frecuencia se le conoce como moda. La moda es la medida de tendencia central especialmente útil para describir mediciones de tipo ordinal, de intervalos y nominal.En un conjunto de números la moda se define como el valor ó número que ocurre con más frecuenciaEjemplo:En el siguiente conjunto de números 1, 5, 5, 9, 12, 12, 12, 14. La moda es igual a 12, por cuanto que es el número que más se repite (tres veces)

La Moda para datos agrupados (Mo.):

La Moda puede deducirse de una distribución de frecuencia o de un histograma a partir de la fórmula.

Mo. = Li + [ ( ∆1 / ∆1+∆2 ) ] C

Page 30: ESTADISTICA DEFINICIONES

Donde;Li = límite inferior de la clase modal (clase de mayor frecuencia absoluta (fa)∆1 = diferencia de las frecuencias absolutas de la clase modal y premodal.∆2 = diferencia de las frecuencias absolutas de la clase modal y postmodalC = amplitud de la clase modal.Ejemplo:Para encontrar la moda es necesario, en primer lugar, identificar la clase modal; que será aquella que posea la mayor frecuencia absoluta. En el ejemplo de cuentas por cobrar de Cabrera`s y Asociados la clase modal será la primera, por cuanto que tiene la mayor frecuencia absoluta.A partir de esto se puede reemplazar en la formula anterior los datos, a saber:Li =7.42 C=14.415 f1 = 10 (frecuencia absoluta de la clase modal)f0 = 0 (frecuencia absoluta de la clase premodal)f2 = 4 (frecuencia absoluta de la clase postmodal)∆1 = 10–0 = 10 ∆2 = 10-4 = 6Mo. = 7.42 + [ (10/10+6) 14.415 ] = 7.42 + [ (10/16) 14.415] == 7.42 + [ 0.625 (14.415) ] = 7.42 + 9.01 = 16.53

Propiedades de la modao La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de

intervalos, y relativa).o La moda tiene la ventaja de no ser afectada por valores extremos. o Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.

Desventajas de la moda

En muchas series de datos no hay moda porque ningún valor aparece más de una vez. En algunas series de datos hay más de una moda, en este caso uno podría preguntarse ¿cual es

el valor representativo de la serie de datos?

1-4—Relación empírica entre la media, la mediana y la modaEn distribuciones totalmente simétricas, la media, la mediana y la moda coinciden, localizándose en un mismo valor. En cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente:

Media – Moda = 3(Media – MedianaPosiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimétricas a derecha e izquierda respectivamente, para curvas simétricas los tres valores coinciden

Page 31: ESTADISTICA DEFINICIONES

1.5.- La Media Armónica (a):La Media Armónica, la representaremos como a, es la inversa de la media aritmética de las inversas de los valores de la variable, responde a la siguiente definición:Si se tiene un conjunto de observaciones tales como: X1, X2, … . Xn; la media armónica, denotada por a, se define como el reciproco de la suma de los valores inversos de la variable estadística divididos entre el número total de datos y se calcula con la siguiente fórmula

Se utiliza para promediar velocidades, tiempos, rendimiento, etc. (cuando influyen los valores pequeños). Su problema: cuando algún valor de la variable es ó próximo a cero no se puede calcularEjemplo:Un.automóvil que hace viajes de ida y vuelta entre las ciudades A y B, realiza el viaje entre A y B a razón de 80 Km por hora y el viaje entre B y A a 120 Km por hora, La velocidad promedio del viaje de ida y vuelta será dea = (1/80 + 1/120)/2 = [(120+80)9600]/2 = 19200/200 = 96 km/h

Propiedades de la media armónica

La media armónica se basa en todas las observaciones por lo que está afectada por todos los valores de la variable. Da a los valores extremadamente grandes un peso menor que el que les da la media geométrica, mientras que a los valores pequeños les da un peso mayor que el que les da tanto la media aritmética como la media geométrica.

La media armónica esta indeterminada si alguno de los valores es cero, pues hallar el recíproco de cero implica dividir entre cero, lo cual no es válido. La media armónica está rígidamente definida y siempre es definitiva, excepto cuando uno de los valores es cero.

La media armónica es el promedio que se ha de usar, cuando lo que se va a promediar son proporciones donde los numeradores de las razones son los mismos para todas las proporciones.

La media armónica se presta a manipulaciones algebraicas posteriores

1.6.-La Media Geométrica(g):Se define como la raíz de índice de la frecuencia total cuyo radicando es el producto de las potencias de cada valor de la variable elevado a sus respectivas frecuencias absolutas, se denota

Page 32: ESTADISTICA DEFINICIONES

por g; suele utilizarse cuando los valores de la variable siguen una progresión geométrica. También para promediar porcentajes, tasas, nº índices, etc. siempre que nos vengan dados en porcentajes y se calcula mediante la siguiente fórmula

g = n√(X1 * X2 * … * XnFórmula que algunas veces es conveniente expresarla en forma logarítmica. El logaritmo de la media geométrica es la media aritmética de los logaritmos de los valores de la variable. El problema se presenta cuando algún valor es 0 ó negativo y exponente de la raíz par ya que no exista raíz par de un número negativo, entonces la fórmula anterior se presenta de la siguiente manera:

log Xg = 1/N (log X1 + log X2 + … + log Xn)Ejemplo;Encontrar la media de los siguientes números 2, 4, 8. obsérvese que entre ellos existe una razón o proporción constante, cada uno de ellos es el doble del anterior, por tanto la media a utilizar es la media geométrica, de la siguiente manera

g = 3√ (2) (4) (8) = 3√ 64 = 4Respuesta: la media geométrica de los datos es 4

Propiedades de la media geométrica (g)

La media geométrica esta basada en todas las observaciones, por lo que está afectada por todos los valores de la variable. Sin embargo, da menos pesos a los valores extremadamente grandes que el que les da la media aritmética.

La media geométrica es igual a cero si algunos de los valores es cero, y se puede volver imaginaria si ocurren valores negativos. Con la excepción de estos dos casos, su valor siempre es definitivo y está rígidamente definido.

La media geométrica es la que se debe utilizar cuando lo que se va a promediar son tasas de cambios o proporciones, y se intenta dar igual peso a tasas de cambios iguales.

LABORATORIO(Resolver y entregar en grupos de tres estudiantes, equivalen a nota de un parcial)

Problema #1:Una guardería es una institución elegible para recibir un subsidio destinado a los servicios sociales del corregimiento, a condición de que la edad promedio de sus niños no llegue a 9 años. Si los datos siguientes representan la edad de todos los niños que actualmente asisten a ella:

8 5 9 10 9 12 7 12 13 7 8

a. ¿Llena el requisito para recibir el subsidio?

14,500 15,600 12,500 8.000 7,8006,500 5,900 10,200 8,800 14,30013,900

Page 33: ESTADISTICA DEFINICIONES

b. La guardería del ejemplo anterior puede continuar siendo subvencionada por la oficina de servicios sociales de la Junta Comunal, mientras el ingreso anual promedio de la familia cuyos asisten a esa institución no llegue a B/.12,500.00. El ingreso familiar de los padres de los niños es;

c. ¿Llena esta institución los requisitos para recibir apoyo financiero de la Junta Comunal del Corregimiento?

d. Si la respuesta a (c) es negativa, ¿cuánto debe disminuir el ingreso familiar para cumplir esa condición?

e. Si la respuesta a (c) es afirmativa, ¿cuánto puede aumentar el ingreso familiar promedio, sin que la institución pierda su elegibilidad para recibir el subsidio?

Problema #2:Una granja ganadera registro durante febrero el nacimiento de 29 terneros, cuyos pesos al nacer (en kilogramos) fue el siguiente:

22 31 33 34 35 36 37 38 38 39

40 40 40 41 41 42 42 42 42 42

43 43 44 45 46 46 46 46 50

Los datos anteriores al ser dispuestos en una tabla de distribución de frecuencias se obtuvo la siguiente tabla resultante.

clases fi

21.5 – 26.5 1

26.5 – 31.5 1

31.5 – 36.5 4

36.5 – 41.5 9

41.5 – 46.5 13

46.5 – 51.5. 1

Total 29

Calcule en las dos variantes (datos no agrupados y datos agrupados) la media aritmética, la mediana y la moda.Problema #3:El peso en kilogramos de un grupo de estudiantes del sexo masculino en un curso de educación física, son los siguientes:

clases fi

52.5 – 57.5 8

Page 34: ESTADISTICA DEFINICIONES

57.5 – 62.5 9

62.5 – 67.5 6

67.5 – 72.5 4

72.5 – 77.5 2

77.5 – 82.5. 1

Total 30

Encuentre la media, la mediana y la Moda. Compare los resultados utilizando la fórmula señalada anteriormente en el texto relativa a la correspondencia entre estas tres medidas de tendencia central.Problema #4:Un profesor ha decidido utilizar un promedio ponderado al calcular las calificaciones finales de los estudiantes que asistieron a su seminario. El promedio de las tareas hechas en casa representan el 20% de cada calificación, el examen parcial, 25%; el examen final, 35%; el examen trimestral, 10% y los problemas de practica, 10%. Con los datos anexos calcule el promedio final de los cinco estudiantes que asistieron al seminario

Alumno Tarea escolar Problemas Examentrimestral

Examen parcial

Examen final

1 85 89 94 87 90

2 78 84 88 91 92

3 94 88 95 86 89

4 82 79 83 84 93

5 95 90 92 82 88

Problema #5:En 1996 se invirtió un fondo de B7.30,000.00 y durante diez años se reinvirtieron todos los intereses y dividendos. Al final de los diez años el valor total del fondo era de B7.49,783.64 ¿Cuál fue la tasa de rendimiento promedio, computada anualmente sobre la inversión inicial?Problema #6:Los siguientes tres automóviles obtuvieron el kilometraje por litro de gasolina que se indica abajo, después de cubrir un trayecto de 600 km, en una pista de prueba. ¿Cuál es el promedio de kilómetros por litros para los tres automóviles?.

Automóvil A 12.5 km/lt

Automóvil B 15.6 km/lt

Automóvil C 19.4 km/lt

Problema #7:

Page 35: ESTADISTICA DEFINICIONES

Suponga que cada uno de los tres automóviles del problema #6 tenía 10 litros de gasolina en el tanque. Los autos fueron rodados hasta que se le acabó la gasolina y los kilómetros por litro fueron los mismos señalados en el problema anterior. ¿Cuál es el número promedio de kilómetros para los tres automóviles?. Compare esta respuesta con los que se obtuvieron en el problema #6. Problemas de práctica de sumatoriasI. Si x1=4; x2=8; x3=10; x4=12; x5=15; x6=5; x7=4; x8=14; x9=16 lleva a cabo las siguientes operaciones

II. Dado quex1=4; x2=6; x3=-5; x4=1;y1=2; y2=3; y3=5; y4=7;z1=3; z2=8; z39; z4=10Halla

Page 36: ESTADISTICA DEFINICIONES

RespuestasI.-  1) 222) 493) 1794) 735) 7(88) = 6166) 12II-.1) 302) 233) 6 + 17 = 234) 5(47) = 2355) 17 + 30 = 476) 537) 5(8) = 40

Page 37: ESTADISTICA DEFINICIONES

8) 1(10) = 10  

 

 


Top Related